如何在从训练集构建决策树后查找下一个值?我需要知道在我的示例中,当我输入 B 和 C 的值时,A 字段的下一个值的概率。
df = pd.DataFrame(np.random.randint(low=0, high=10, size=(5, 3)), columns=['a', 'b', 'c'])>>> a b c0 2 8 81 4 2 92 1 0 73 5 1 74 6 0 2X = df[ ['b','c'] ]Y = df[ ['a'] ]clf = DecisionTreeClassifier(random_state=241)clf.fit(X, Y)
如果 B=8,C=8,如何找出字段 A 的下一个值的概率?
回答:
你可以简单地使用 clf.predict_proba()
。例如:
clf.predict_proba([[8,8]])
将返回一个浮点数向量,表示数据为列”a”中每个唯一值的概率。