![统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/26/40868026/b_40868026.jpg)
上QQ阅读APP看书,第一时间看更新
10.2.1 示例
数据集合A包括10个个体和3个变量,见表10.1。二值变量是RESPONSE(Y),INCOME的单位是千美元(X1),AGE的单位是年(X2)。我用数据集合A对INCOME和AGE的回应做一个逻辑斯谛回归分析。
表10.1 数据集合A
![](https://epubservercos.yuewen.com/F5D3BB/21233234408534806/epubprivate/OEBPS/Images/10b1.jpg?sign=1734456248-gqP1B0Q2gyeswOrtlRFeZSuwdl2joCjB-0-b0a2d8689bb4384d2a53b02c68434b91)
表10.2是标准的LRM结果,其中包括逻辑斯谛回归系数和其他信息“列”(这些内容超出了本章范围)。“参数估计值”这一栏是变量INCOME、AGE的系数和截距值。截距是一个数学概念,记作X0,通常等于1(即截距=X0=1)。系数b0作为“初始”值赋值给所有个体,不管模型里的预测变量的值是多大。
表10.2 LRM结果
![](https://epubservercos.yuewen.com/F5D3BB/21233234408534806/epubprivate/OEBPS/Images/10b2.jpg?sign=1734456248-BHERKabhXrHBKEws6zpHs8kRc1x2vA76-0-67b1c4a397302d6a757312567dc5287b)
LRM的估计值见公式10.3:
![](https://epubservercos.yuewen.com/F5D3BB/21233234408534806/epubprivate/OEBPS/Images/108-i.jpg?sign=1734456248-akBJLn5tIKUdqxNqjBY0kVozjq7yfk9b-0-8be0114b2baa42d88853c566fe6ba8f6)
记住,LRM预测的是RESPONSE的logit值,不是RESPONSE的概率。