使用机器学习分析体育博彩

假设我有一个数据库,里面有超过100万次的博彩记录(各种体育项目),由数千名用户在两年的时间内(并且还在增长)进行的。

这些数据只是闲置在那里什么也没做,所以我想如果可以使用类似https://www.tensorflow.org/的东西,做一些调整,它可以分析数据库中的所有博彩并从中学习一些模式,了解什么是好的,什么是不好的。

关键是我们没有资源雇佣数十人来编写一些复杂的软件,这将花费不知道多久的时间。所以我在想我们可以使用TensorFlow的一些模块,从那里开始。

然后我会向网络输入系统中当前开放的博彩(这些博彩是针对即将进行的比赛的),它会为我挑选我应该下注什么,例如这个博彩有90%的胜率,因为10个非常成功的玩家下了这个注,而且他们在下注这个特定运动时成功率非常高。

我们有很多有经验的用户,他们从博彩中赚了很多钱。所以系统可以基于我们拥有的数据进行训练,然后它就会知道,例如,如果用户A在这个联赛/团队上下注,他很可能会赢。

问题是,我们接下来该怎么做?有人能指出我们正确的方向吗?还是这对于两个人在几个月内来说太难了?我们可以使用一些预编程的解决方案,比如TensorFlow吗?


回答:

在没有查看数据的情况下,无法建议你接下来应该采取什么方向,但无论如何,你的第一步应该是彻底探索你的数据,在数据的一小部分上创建模型,并测试你的假设。

总的来说,你可以尝试以下几点:

  1. 使用Python或R来加载和清理数据

  2. 从数据中随机选择一小部分(例如10,000行),使用SVM或随机森林创建一个简单的模型,看起来像是分类胜负的模型。

  3. 测试你的结果并用一些数据验证你的假设。

  4. 探索你的数据,看看是否可以生成更好的特征

  5. 先设计一个小的神经网络,然后考虑使用tensorflow或keras等深度神经网络。

看看这个:https://hackernoon.com/how-to-create-your-own-machine-learning-predictive-system-in-the-nba-using-python-7189d964a371

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注