我使用机器学习制作了一个关于板球预测的小应用。我收集了2001年至2011年期间的ODI比赛记录,并准备了一个训练集。
现在,为了预测某支球队的胜负,我考虑了各种因素。
例如,这是一场在印度的Wankhede体育场举行的印度对澳大利亚的比赛。
-
印度过去10年的战绩。
-
印度过去2年的战绩。(近期状态)
-
印度在印度过去10年的战绩。
-
印度在印度过去2年的战绩。(近期状态)
-
印度在Wankhede过去10年的战绩。
-
印度在Wankhede过去2年的战绩。(近期状态)
-
澳大利亚过去10年的战绩。
-
澳大利亚过去两年的战绩。
-
澳大利亚在过去10年对阵印度的战绩。
-
澳大利亚在过去2年对阵印度的战绩。
-
澳大利亚在过去10年在印度对阵印度的战绩。
-
澳大利亚在过去2年在印度对阵印度的战绩。
因此,我们计算了所有这些因素的概率。例如,印度在10年内参加了322场比赛并赢得了140场,所以获胜的概率是140/322,其余因素的概率也是如此。最后,我们将所有概率相加,得到了两国的胜负百分比。我想知道这是什么样的定理。最初它是基于朴素贝叶斯的,但朴素贝叶斯是将概率相乘,而这里不是。你可以在这里查看实现,http://www.manzarict.org/cricket我们使用了基本的PHP,以便通过SQL查询更快地找到概率。现在,这种求和方法可能是不正确的,欢迎提出其他方法。
回答:
这是一个简单的线性模型,你甚至没有调整模型的权重,而是使用了常数值。线性模型通过以下方式做出决策
cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )
其中x是你的数据点(x_i是第i个特征)。在你的情况下,所有w_i=1(你只是将所有特征相加,仅此而已)。称之为“定理”有些过头了,这只是一个先验假设的(因为你没有训练它)、简单的(因为它由常数值组成,没有专业知识)、线性模型(因为它使用了特征的加权和)。