“标量变量的索引无效” – 使用Scikit Learn的”accuracy_score”时

我不确定具体哪里出了问题。然而，我的目标是建立一个交叉验证的Python代码。我知道有各种度量标准，但我认为我使用的是正确的度量标准。然而，我没有得到我想要的CV10结果，而是收到了一个错误：

“标量变量的索引无效”

我在StackOverflow上找到了这个：当你试图索引一个numpy标量，如numpy.int64或numpy.float64时，会发生IndexError: invalid index to scalar variable。这与当你试图索引一个int时发生的TypeError: ‘int’ object has no attribute ‘_getitem‘_非常相似。

任何帮助都将不胜感激…

我正在尝试按照以下链接进行操作： http://scikit-learn.org/stable/modules/model_evaluation.html

from sklearn.ensemble import RandomForestClassifierfrom sklearn import cross_validationfrom numpy import genfromtxtimport numpy as npfrom sklearn.metrics import accuracy_scoredef main():    #读取数据，并解析为训练和目标集    dataset = genfromtxt(open('D:\\CA_DataPrediction_TrainData\\CA_DataPrediction_TrainDataGenetic.csv','r'), delimiter=',', dtype='f8')[1:]       target = np.array( [x[0] for x in dataset] )    train = np.array( [x[1:] for x in dataset] )    #在这种情况下，我们将使用随机森林，但这可以是任何分类器    cfr = RandomForestClassifier(n_estimators=10)    #简单的K-Fold交叉验证。10折。    cv = cross_validation.KFold(len(train), k=10, indices=False)    #迭代训练和测试交叉验证段，并    #在每个段上运行分类器，将结果聚合到一个列表中    results = []    for traincv, testcv in cv:        pred = cfr.fit(train[traincv], target[traincv]).predict(train[testcv])        results.append(accuracy_score(target[testcv], [x[1] for x in pred]) )    #打印出交叉验证结果的平均值    print "Results: " + str( np.array(results).mean() )if __name__=="__main__":    main()

回答：

你的pred变量只是一个预测列表，因此你不能索引它的元素（这就是错误的原因）

results.append(accuracy_score(target[testcv], [x[1] for x in pred]) )

应该改为

results.append(accuracy_score(target[testcv], pred) )

或者如果你真的想要一个副本

results.append(accuracy_score(target[testcv], [x for x in pred]) )

学技术

“标量变量的索引无效” – 使用Scikit Learn的”accuracy_score”时

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复