Python Key Error – 学技术

我在使用Python时遇到了Key Error问题，无法解决。

错误信息如下所示：

Traceback (most recent call last):File "<pyshell#4>", line 1, in <module>import handling_data_File "C:\Python27\handling_data_.py", line 453, in <module>main()File "C:\Python27\handling_data_.py", line 443, in mainpans.append([row[0],p.classify(row)])File "C:\Python27\handling_data_.py", line 367, in classifycgclass = self.greater_class_prob_dist[query[2]]KeyError: ' Without-pay'

问题出在以下这行代码：

clclass = self.less_class_prob_dist[query[2]]

我不确定这行代码有什么问题，因为还有另一行代码是关于greater_class_prob_dist的：

cgclass = self.greater_class_prob_dist[query[2]]

这个类是一个朴素贝叶斯实现，如果从文本文件中读取包含’ Without-pay’的条目，它可以完美运行，否则就无法运行。

有谁知道如何解决这个问题吗？

这里有一个链接，包含整个类和文本文件，如果有人需要查看或运行它以了解问题所在：源代码

任何帮助都将不胜感激

编辑：包含’ Without-pay’的记录打印如下：

['tst1249', 62, ' Without-pay', 170114, ' Assoc-acdm', 12, ' Married-civ-spouse', ' Farming-fishing', ' Husband', ' White', ' Male', 0, 0, 50, ' United-States', '?']

回答：

如果你查看trainingset.txt中的所有条目，你会发现所有包含Without-pay的条目都被标记为收入<=50k。正如你在__init__中看到的，训练数据被分为两组：

        for row in data:              if row[15] == ' >50K':                    self.greaterThan_data.append(row)              else:                    self.lessThan_data.append(row)

由于没有Without-pay的条目有>50k的收入，所以它们都没有进入greaterThan_data。

因此，当你调用…

        self.greater_class_prob_dist = self.getCatProbs(self.greaterThan_data,2)

…生成的字典中缺少那个键。

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复