大家好。我对分类算法这个主题完全是新手,需要一些关于从哪里开始“认真阅读”的好建议。我目前正在研究,机器学习和自动分类算法是否值得添加到我的某些应用程序中。
我已经浏览了 Z. Michalewicz 和 D. Fogel 的“How to Solve It: Modern heuristics”(特别是关于使用神经网络的线性分类器的章节),在实践方面,我目前正在研究WEKA 工具包的源代码。我的下一个(计划)步骤将是深入研究贝叶斯分类算法领域。
不幸的是,我缺乏该领域重要的理论基础(更不用说迄今为止以任何方式使用它了),因此,如果您能给出关于接下来应该在哪里查找的任何提示,我将不胜感激;特别是,对可用的分类算法的良好介绍将非常有帮助。作为一名工匠而不是理论家,越实用越好…
有提示吗?
回答:
我一直觉得Andrew Moore 的教程非常有用。它们以坚实的统计理论为基础,如果您将来选择阅读论文,它们将非常有用。这是一个简短的描述:
这些包括分类算法,如决策树、神经网络、贝叶斯分类器、支持向量机和基于案例的(又名非参数)学习。它们包括回归算法,如多元多项式回归、MARS、局部加权回归、GMDH 和神经网络。它们还包括其他数据挖掘操作,如聚类(混合模型、k-means 和分层)、贝叶斯网络和强化学习