我在寻找一些关于机器学习的入门文章。有人能为初学者推荐一些吗?
回答:
我假设你说的“文章”是指任何可在线获取的资源。
我推荐两类资源:
首先,寻找机器学习博客,博主的首选语言与你相同。根据我的经验,阅读一篇关于单一主题(例如,支持向量机)的博客文章,同时阅读博客文章附带的源代码,是程序员学习机器学习的最佳方式。几个优秀的例子是博客Smell the Data(Python)和Igvita(Ruby)。两者都包含(至少)几篇文章,每篇以教程风格描述特定的机器学习技术,包括对其(发布的)源代码的详细讲解。特别是Igvita,提供了关于支持向量机、决策树、奇异值分解和集成方法的优秀教程和工作的Ruby代码——就像我提到的另一个博客一样,仅凭这些博客中的机器学习文章就可以开设一门高年级本科课程。
其次,我强烈推荐VideoLectures.net。
这是我找到的最好的资源——无论是免费还是付费——提供非常高质量的(无论是视频质量还是演示内容)机器学习的视频讲座和教程。这些视频讲座的目标受众从初学者(一些讲座被特别标记为“教程”)到专家不等;大多数似乎处于中间水平。
所有讲座和教程都是为经验丰富的专业人士和学者教授的,在许多情况下,讲师是他在/她所讲授的主题上的领先权威。该网站也是100%免费的。
唯一的缺点是你不能下载讲座并存储在例如iTunes中;然而,几乎每场讲座都有一套你可以下载的幻灯片(或者,你可以方便地在观看演示时在线查看它们)。
我观看并强烈推荐的几场讲座包括:
-
半监督学习方法
-
机器学习导论
-
高斯过程基础
-
图模型
-
k-最近邻模型
-
核方法导论