我的问题如下:
我对Python中的机器学习(使用NLTK)有一些了解,到目前为止效果还可以。我可以根据某些特征进行预测。但是我想知道,是否有方法可以显示实现某个标签的最佳特征?我是指与我之前所做的事情完全相反(输入所有情况,然后为其获得一个标签)
我试图通过一个例子来阐明我的问题:
假设我有一个包含足球比赛的数据库。
标签例如是‘胜’、‘负’、‘平’。
特征例如是‘风速’、‘是否下雨’、‘白天或夜晚’、‘犯规次数’等。
现在我想知道:在什么情况下一支球队会取得胜利、失败或平局?基本上我想得到这样的结果:
取得胜利的最佳条件:风速=0,无雨,下午,犯规=0等
取得失败的最佳条件:…
有办法实现这个吗?
回答:
我的绘画技能不是很好!
我只懂理论,所以你得自己找代码..
如果你只有1种情况(“x”情况的最佳情况),图表会变成类似这样(不会是2维的,但类似这样):
绿色(胜),橙色(平),红色(负)
现在如果你想预测球队是赢、输还是平局,你有(至少)两种模型来分类:
所以,例如,如果你有新的数据,需要对其进行分类,方法如下:
- 我们有一个新点,具有某些属性..
- 我们通过查看/计算该点位于线的哪一侧来对其进行分类(或查看它与我们的基准情况有多远…
注意:为了提高准确性,你需要给每个因素赋予一定的权重..