在对这个回答的跟进中,我想问一下你们是否知道任何好的(更重要的是易于理解的)数据挖掘教程和/或使用Weka工具包的示例。
自从我第一次听说数据挖掘及其能做的事情以来,我就对数据挖掘非常感兴趣,我也有一些我想用我的一些数据进行的实验,我已经买了四本书,我发现以下两本书特别有趣:
数据挖掘 http://ecx.images-amazon.com/images/I/61DhYb1Z6QL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg
最后一本书是由Weka的同一作者编写的,包含了很多示例,但尽管如此,我发现理解其中的逻辑和特别是数学部分有点困难。我目前的数学技能非常粗糙,我计划今年去大学,希望我能学习并更好地理解所涉及的数学,但在那之前,我想在数据挖掘方面获得一些实践经验。
有没有带有示例数据的逐步教程可以帮助我开始使用Weka工具包?
回答:
对于“应用”数据挖掘来说,对于初学者来说,你可能根本不需要考虑数学。Weka是一个大学机器学习项目的产物,提供了100多个算法。相比之下,微软的SQL server SSAS提供了九个算法——他们甚至不费心解释数学。
它们都提供关联、聚类、属性选择、某种形式的神经网络。因此,诀窍是理解你试图实现什么,不一定是下面的数学。尝试阅读关于微软算法的文档(文档很好),看看你是否能找出SSAS和Weka的共同原则——这应该能帮助你专注于基本原则并开始入门。
这里有一份Weka教程的列表。