如何找到包含所有变量及其系数的最终回归模型方程?有什么方法吗?
回答:
展示一个示例
我将展示一个使用波士顿房价数据集进行OLS回归的例子。
代码:
# 加载数据集和回归函数from sklearn import linear_model,datasetsimport pandas as pd# 我使用波士顿数据集来展示full_data = datasets.load_boston()# 获取回归器,拟合截距reg = linear_model.LinearRegression(fit_intercept=True)# 数据是我们的解释变量,目标是我们的响应变量reg.fit(full_data['data'],full_data['target'])# 我们有一个截距和11个变量的系数reg.intercept_,reg.coef_# 获取特征名称full_data.feature_names# 添加到列表中以获取新列表coef = np.append(reg.intercept_,reg.coef_)feature_names = np.append(['Intercept'], full_data.feature_names)# 输出包含你想要的系数的数据框pd.DataFrame({"feature_names":feature_names,"coef":coef})
输出:
feature_names coef0 Intercept 36.4594881 CRIM -0.1080112 ZN 0.0464203 INDUS 0.0205594 CHAS 2.6867345 NOX -17.7666116 RM 3.8098657 AGE 0.0006928 DIS -1.4755679 RAD 0.30604910 TAX -0.01233511 PTRATIO -0.95274712 B 0.00931213 LSTAT -0.524758
一些建议
你可以使用 dir(object)
来查看你的拟合模型中有什么内容,比如使用 dir(full_data)
和 dir(reg)
来查看实例的属性和方法。
关于 sklearn
,这里有一个官方指南。你可以在指南中找到函数和数据集。