谷歌最近关于Google预测API的公告听起来非常有趣。这对于我即将进行的一个项目可能很有用,并且可能会比我之前考虑的一些自定义代码做得更好。
然而,这存在一些供应商锁定的问题。谷歌保留了训练模型,并且以后可能会对我收取过高的费用。我意识到,如果我愿意自己托管训练(我愿意),并且能够忍受没有他们随时随地投入硬件解决问题的能力,可能存在开源的替代方案。
我上次查看第三方计算机训练代码已经是很多年前了,当时有很多细节需要仔细考虑并根据项目进行定制。谷歌似乎隐藏了这些决策,并为你处理这些问题。对我来说,这仍然像是魔法,但我很想知道其他人是否也能做到同样的事情。
所以我的问题是:
Google预测API的替代方案有哪些:
- 使用监督式机器学习对数据进行分类,
- 可以轻松配置(或不需要配置)以适应不同类型和规模的数据集?
- 是开源且自托管的(或者至少,提供你免版税使用你的模型的权利,不依赖第三方)
回答:
也许是Apache Mahout?