机器学习算法的困惑

我使用机器学习制作了一个关于板球预测的小应用。我收集了2001年至2011年期间的ODI比赛记录，并准备了一个训练集。

现在，为了预测某支球队的胜负，我考虑了各种因素。

例如，这是一场在印度的Wankhede体育场举行的印度对澳大利亚的比赛。

印度过去10年的战绩。
印度过去2年的战绩。（近期状态）
印度在印度过去10年的战绩。
印度在印度过去2年的战绩。（近期状态）
印度在Wankhede过去10年的战绩。
印度在Wankhede过去2年的战绩。（近期状态）
澳大利亚过去10年的战绩。
澳大利亚过去两年的战绩。
澳大利亚在过去10年对阵印度的战绩。
澳大利亚在过去2年对阵印度的战绩。
澳大利亚在过去10年在印度对阵印度的战绩。
澳大利亚在过去2年在印度对阵印度的战绩。

因此，我们计算了所有这些因素的概率。例如，印度在10年内参加了322场比赛并赢得了140场，所以获胜的概率是140/322，其余因素的概率也是如此。最后，我们将所有概率相加，得到了两国的胜负百分比。我想知道这是什么样的定理。最初它是基于朴素贝叶斯的，但朴素贝叶斯是将概率相乘，而这里不是。你可以在这里查看实现，http://www.manzarict.org/cricket我们使用了基本的PHP，以便通过SQL查询更快地找到概率。现在，这种求和方法可能是不正确的，欢迎提出其他方法。

回答：

这是一个简单的线性模型，你甚至没有调整模型的权重，而是使用了常数值。线性模型通过以下方式做出决策

cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )

其中x是你的数据点（x_i是第i个特征）。在你的情况下，所有w_i=1（你只是将所有特征相加，仅此而已）。称之为“定理”有些过头了，这只是一个先验假设的（因为你没有训练它）、简单的（因为它由常数值组成，没有专业知识）、线性模型（因为它使用了特征的加权和）。

学技术

机器学习算法的困惑

发表回复取消回复

相关文章：

使用 LibSVM 计算与均值/标准差对最接近的匹配项

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复