我需要训练一个分类器来处理维度变化的数据。例如(以下是用于说明的虚构数据):
class-1,0,1,2,3class-2,0,3,2,4,5,7class-3,1,8,8,8,2,8,0,0,0::依此类推...
我尝试使用scikit-learn
训练一个线性SVM,但它要求维度是固定的。简单地将较小维度用零填充以匹配最大维度,结果令人失望。
对于这种数据,我应该使用不同的分类器吗?我应该如何处理这个问题?
回答:
特征哈希是你需要使用的算法,可以将你的变长输入转换为定长输入。然后,你可以将转换后的向量用于任何合适的学习算法。