- 使用监督学习或无监督学习的基本标准是什么?
- 哪一种方法更优越?
- 是否有只能使用其中一种方法的特定情况?
谢谢
回答:
-
如果你有标记的数据集,你可以使用两种方法。如果你没有标记的数据,你只能使用无监督学习。
-
这不是哪一种“更好”的问题,而是你想要达到的目标的问题。例如,数据聚类通常是无监督的——你希望算法告诉你数据的结构如何。而分类则是监督的,因为你需要教你的算法区分不同类别,以便对未见过的数据进行预测。
-
参见第1点。
顺便提一下:这些都是非常广泛的问题。我建议你熟悉一些机器学习的基础知识。
例如,这里有一个很好的播客:http://ocdevel.com/podcasts/machine-learning
Jake VanderPlas 的书和笔记本非常好:http://nbviewer.jupyter.org/github/jakevdp/PythonDataScienceHandbook/blob/master/notebooks/Index.ipynb