我试图使用逻辑回归进行预测,并使用Python和sklearn库测试准确性。我使用了从这里下载的数据:
http://archive.ics.uci.edu/ml/datasets/concrete+compressive+strength
这是一个Excel文件。我编写了代码,但总是得到相同的错误,错误是:
ValueError: Unknown label type: 'continuous'
我在进行线性回归时使用了同样的逻辑,并且它对线性回归是有效的。
这是代码:
回答:
尽管你没有提供数据的详细信息,但从错误信息和你代码最后一行的注释来看:
#true value affter 3 days: 16.28 MPa
我得出结论,你正处于一个回归(即数值预测)设置中。线性回归是适合这个任务的模型,但逻辑回归不适合:逻辑回归是用于分类问题的,因此它期望目标变量是二元(或分类)的数据,而不是连续值,所以出现了这个错误。
简而言之,你正在尝试应用一个不适合你的问题的模型。
更新(在提供了数据链接后):确实,仔细阅读数据集描述,你会看到(强调部分):
混凝土抗压强度是回归问题
而从scikit-learn的用户指南中关于逻辑回归的部分(再次强调):
尽管名称如此,逻辑回归是一种用于分类而非回归的线性模型。