免责声明: 虽然我对大数据有所了解,并且目前正在学习机器学习的其他知识,但我希望研究的具体领域尚不明确,或者至少目前对我来说显得模糊。我会尽力描述它,但这个问题仍可能被归类为过于模糊或根本不是一个问题。希望我能在得到反馈后更精确地重新表述这个问题。
所以,
我对Hadoop和Hadoop堆栈有一些经验(通过使用CDH获得),并且我在阅读一本关于Mahout的书,这是一组机器学习库。我认为我对统计学的了解足以理解机器学习算法背后的数学,并且我对R有一些经验。我的最终目标是建立一个能够进行交易预测并实时处理金融数据的设置。
我想知道是否有任何材料可以帮助我进一步了解如何管理这个问题;欢迎书籍、视频教程和带有示例数据集的练习。
回答:
在Coursera上参加机器学习课程。这是一个很好的机器学习算法入门课程,它会告诉你机器学习能做什么/一些通用方法:https://www.coursera.org/course/ml
为了获得更广泛的视角,我建议参加Coursera的数据科学课程:https://www.coursera.org/course/datasci
最后,一本好书是《Mahout in Action》 – 它更多地是关于用Mahout解决实际问题,并且有很多例子和案例研究。我相信在学习这些之后,你将更好地理解下一步要做什么。