这是我的代码,但我不知道为什么会得到这样糟糕的图表。我哪里做错了?
import pandas as pddf = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header = None, sep = '\s+')df.columns = ["CRIM", "ZN", 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT','MEDV']# print dfX = df.iloc[:,:-2].valuesy = df.iloc[:,-1].valuesfrom sklearn.linear_model import LinearRegressionlr = LinearRegression()lr.fit(X, y)import matplotlib.pyplot as pltplt.plot(X, lr.predict(X))plt.show()
回答:
我猜你的问题和困惑可能在于问题的维度。我理解你期望看到一条穿过点的线,就像这里展示的那样,其中线性函数接受X作为输入并输出lr.predict(X)
。你不会看到那条单一的线,因为你的X变量有12列,因此你有12个不同的独立变量。
如果你试图将所有这些变量与你的一个因变量lr.predict(X)
一起绘制,那么你将需要13个维度。plot
方法不会为你绘制这些。相反,它试图为X中的每个维度绘制12条不同的线。这就是你看到的现象。