我在尝试训练一个SVM分类器,但我对机器学习还比较新手。我知道这里有两个步骤:参数调整和特征工程,但哪个应该先做?看起来这个回答建议先做特征工程,这是正确的吗?如果是正确的,我是否可以随机选择一组SVM参数来进行特征工程?
回答:
你必须先进行特征工程/特征选择。你需要知道你将使用哪些变量,然后才能调整这些值。
至于如何进行特征选择,这是另一个问题。你可以使用诸如主成分分析、奇异值分解等技术,或者其他许多方法。这是一个活跃的研究领域,如果你在谷歌上搜索,你会发现很多描述各种技术的论文。
这篇是我最近阅读的一篇论文,它使用基于熵的技术进行特征选择。