机器学习算法的困惑

我使用机器学习制作了一个关于板球预测的小应用。我收集了2001年至2011年期间的ODI比赛记录,并准备了一个训练集。

现在,为了预测某支球队的胜负,我考虑了各种因素。

例如,这是一场在印度的Wankhede体育场举行的印度对澳大利亚的比赛。

  1. 印度过去10年的战绩。

  2. 印度过去2年的战绩。(近期状态)

  3. 印度在印度过去10年的战绩。

  4. 印度在印度过去2年的战绩。(近期状态)

  5. 印度在Wankhede过去10年的战绩。

  6. 印度在Wankhede过去2年的战绩。(近期状态)

  7. 澳大利亚过去10年的战绩。

  8. 澳大利亚过去两年的战绩。

  9. 澳大利亚在过去10年对阵印度的战绩。

  10. 澳大利亚在过去2年对阵印度的战绩。

  11. 澳大利亚在过去10年在印度对阵印度的战绩。

  12. 澳大利亚在过去2年在印度对阵印度的战绩。

因此,我们计算了所有这些因素的概率。例如,印度在10年内参加了322场比赛并赢得了140场,所以获胜的概率是140/322,其余因素的概率也是如此。最后,我们将所有概率相加,得到了两国的胜负百分比。我想知道这是什么样的定理。最初它是基于朴素贝叶斯的,但朴素贝叶斯是将概率相乘,而这里不是。你可以在这里查看实现,http://www.manzarict.org/cricket我们使用了基本的PHP,以便通过SQL查询更快地找到概率。现在,这种求和方法可能是不正确的,欢迎提出其他方法。


回答:

这是一个简单的线性模型,你甚至没有调整模型的权重,而是使用了常数值。线性模型通过以下方式做出决策

cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )

其中x是你的数据点(x_i是第i个特征)。在你的情况下,所有w_i=1(你只是将所有特征相加,仅此而已)。称之为“定理”有些过头了,这只是一个先验假设的(因为你没有训练它)、简单的(因为它由常数值组成,没有专业知识)、线性模型(因为它使用了特征的加权和)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注