假设我有一个数据库,里面有超过100万次的博彩记录(各种体育项目),由数千名用户在两年的时间内(并且还在增长)进行的。
这些数据只是闲置在那里什么也没做,所以我想如果可以使用类似https://www.tensorflow.org/的东西,做一些调整,它可以分析数据库中的所有博彩并从中学习一些模式,了解什么是好的,什么是不好的。
关键是我们没有资源雇佣数十人来编写一些复杂的软件,这将花费不知道多久的时间。所以我在想我们可以使用TensorFlow的一些模块,从那里开始。
然后我会向网络输入系统中当前开放的博彩(这些博彩是针对即将进行的比赛的),它会为我挑选我应该下注什么,例如这个博彩有90%的胜率,因为10个非常成功的玩家下了这个注,而且他们在下注这个特定运动时成功率非常高。
我们有很多有经验的用户,他们从博彩中赚了很多钱。所以系统可以基于我们拥有的数据进行训练,然后它就会知道,例如,如果用户A在这个联赛/团队上下注,他很可能会赢。
问题是,我们接下来该怎么做?有人能指出我们正确的方向吗?还是这对于两个人在几个月内来说太难了?我们可以使用一些预编程的解决方案,比如TensorFlow吗?
回答:
在没有查看数据的情况下,无法建议你接下来应该采取什么方向,但无论如何,你的第一步应该是彻底探索你的数据,在数据的一小部分上创建模型,并测试你的假设。
总的来说,你可以尝试以下几点:
-
使用Python或R来加载和清理数据
-
从数据中随机选择一小部分(例如10,000行),使用SVM或随机森林创建一个简单的模型,看起来像是分类胜负的模型。
-
测试你的结果并用一些数据验证你的假设。
-
探索你的数据,看看是否可以生成更好的特征
-
先设计一个小的神经网络,然后考虑使用tensorflow或keras等深度神经网络。