我有一组状态到动作的配对数据集,(s,a),其中每个s定义了a的可能选择上的概率分布,每个a都是从该概率分布中抽取的。我希望为这个数据集训练一个分类器,使其不是学习预测最大似然值,而是预测a是从哪个分布中抽取的。
例如,如果你在玩迭代的石头剪刀布游戏,你的状态可能是你之前的动作,a属于{石头,纸,剪刀},其中之前的状态会降低再次选择该动作的概率。我的数据集看起来会像这样:
PreviousAction,ChosenRock,PaperPaper,RockRock,ScissorsScissors,PaperPaper,Paper...
使用scikit-learn中的随机森林是否可以学习标签上的概率分布?
回答:
是的,可以。使用fit
训练一个RandomForestClassifier
(它期望y
参数是标签而不是概率分布),然后使用predict_proba
进行预测。