我在尝试对30,000个文本数据集进行KernelPCA时遇到了内存错误。RandomizedPCA运行正常。我认为这是因为RandomizedPCA可以处理稀疏数组,而KernelPCA则不能。
有没有人知道scikits-learn中当前实现了稀疏数组支持的学习方法列表?
回答:
我们还没有这样的列表。目前你需要阅读各个类的文档字符串来获取信息。
无论如何,对于像文本文档这样高维度的稀疏数据,非线性模型的表现往往不如线性模型(而且它们更容易过拟合)。
我在尝试对30,000个文本数据集进行KernelPCA时遇到了内存错误。RandomizedPCA运行正常。我认为这是因为RandomizedPCA可以处理稀疏数组,而KernelPCA则不能。
有没有人知道scikits-learn中当前实现了稀疏数组支持的学习方法列表?
回答:
我们还没有这样的列表。目前你需要阅读各个类的文档字符串来获取信息。
无论如何,对于像文本文档这样高维度的稀疏数据,非线性模型的表现往往不如线性模型(而且它们更容易过拟合)。