我在使用Python时遇到了Key Error问题,无法解决。
错误信息如下所示:
Traceback (most recent call last):File "<pyshell#4>", line 1, in <module>import handling_data_File "C:\Python27\handling_data_.py", line 453, in <module>main()File "C:\Python27\handling_data_.py", line 443, in mainpans.append([row[0],p.classify(row)])File "C:\Python27\handling_data_.py", line 367, in classifycgclass = self.greater_class_prob_dist[query[2]]KeyError: ' Without-pay'
问题出在以下这行代码:
clclass = self.less_class_prob_dist[query[2]]
我不确定这行代码有什么问题,因为还有另一行代码是关于greater_class_prob_dist的:
cgclass = self.greater_class_prob_dist[query[2]]
这个类是一个朴素贝叶斯实现,如果从文本文件中读取包含’ Without-pay’的条目,它可以完美运行,否则就无法运行。
有谁知道如何解决这个问题吗?
这里有一个链接,包含整个类和文本文件,如果有人需要查看或运行它以了解问题所在:源代码
任何帮助都将不胜感激
编辑:包含’ Without-pay’的记录打印如下:
['tst1249', 62, ' Without-pay', 170114, ' Assoc-acdm', 12, ' Married-civ-spouse', ' Farming-fishing', ' Husband', ' White', ' Male', 0, 0, 50, ' United-States', '?']
回答:
如果你查看trainingset.txt
中的所有条目,你会发现所有包含Without-pay
的条目都被标记为收入<=50k
。正如你在__init__
中看到的,训练数据被分为两组:
for row in data: if row[15] == ' >50K': self.greaterThan_data.append(row) else: self.lessThan_data.append(row)
由于没有Without-pay
的条目有>50k
的收入,所以它们都没有进入greaterThan_data
。
因此,当你调用…
self.greater_class_prob_dist = self.getCatProbs(self.greaterThan_data,2)
…生成的字典中缺少那个键。