有哪些好的机器学习编程练习?

理想情况下,它们应具有以下特点:

  1. 可以在一个晚上的编码时间内完成。不需要一周或更长时间才能获得有趣的结果。这样,我就可以在一个(可能是几个小时)的时间内感受到我已经学习并完成了一些事情。

  2. 这些问题来自现实世界,或者至少是现实世界问题的简化版本。

  3. 如果问题需要数据来测试解决方案,则可以轻松获得真实世界的数据集,或者我可以很容易地自己生成有趣的测试数据。

  4. 可以很容易地评估我做得有多好。当我测试我的解决方案时,从结果中可以清楚地看出我已经完成了一些重要的工作,可以通过简单的检查,或者通过结果质量的可量化衡量标准来判断。


回答:

实现以下算法:

  • Perceptron,margin perceptron:你可以尝试检测人脸图像(对人脸和非人脸的图像进行分类),使用任何人脸数据库。例如,尝试MIT CBCL人脸数据库。你也可以尝试MNIST 数据,并编写一个简易的OCR系统。
  • LVQ,Kohonen map:你可以尝试压缩图像。你可以从任何壁纸网站下载大型图像。
  • Naive bayes classifier:你可以对垃圾邮件和非垃圾邮件进行分类。还有更多科学的数据集,例如Reuters和Newsgroups等,你需要根据文章确定主题。
  • Backpropagation,multi layer perceptron:你可以尝试使用人脸数据、垃圾邮件数据,或者文本/直方图数据
  • Primal SVM linear learning using SGD:例如,你可以使用MNIST数字来尝试。

这里有很多项目,其中一些需要几个小时,有些需要几天,但你肯定会学到很多东西。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注