决策树中的 clf.score(X_train,Y_train) 评估什么?

我正在尝试构建一个决策树,并在网上找到了以下代码。

我的问题是:

  • 在决策树中,clf.score(X_train,Y_train) 评估的是什么?输出如以下截图所示,我想知道这个值代表什么?

    clf = DecisionTreeClassifier(max_depth=3).fit(X_train,Y_train)print("Training:"+str(clf.score(X_train,Y_train)))print("Test:"+str(clf.score(X_test,Y_test)))pred = clf.predict(X_train)

    输出:

    enter image description here

  • 在下面的代码中,我认为它计算了模型的几个分数。当我设置更高的 max_depth 时,分数会增加。这对我来说很容易理解。然而,我想知道这些数字与前一个截图中训练和测试的值有什么不同?

enter image description here

  • 我的目标是预测房价是否超过2万美元。在选择最适合且简单的模型时,我应该考虑哪个分数?

回答:

正如评论中正确指出的,确实是平均训练准确率;通过简单比较你第二个截图中的四个不同分数与第一个截图中的训练分数,你应该已经能够猜到这一点。但在任何情况下,在这里提出此类问题之前,你应该首先查阅相关的文档,这无疑是你在类似情况下的最佳朋友。引用scikit-learn DecisionTreeClassifierscore 方法的文档

score (X, y, sample_weight=None)

返回给定测试数据和标签的平均准确率。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注