我使用MATLAB的fitcdiscr
函数和predict
函数运行了LDA。
我感觉我的代码可能存在一些错误,为了进行 sanity check,我想识别出在分类中权重最大的哪些特征。
这可以做到吗?
回答:
在您的拟合对象中有一个Coeffs
字段,其中包含所有相关信息 http://uk.mathworks.com/help/stats/classificationdiscriminant-class.html
特别是,如果您拟合了一个线性LDA,将会有一个Linear
字段,这是用于投影的线性算子。然而,应该注意的是,线性模型的系数值并不代表特征的重要性。这其中需要考虑更多因素。权重可能因为您的特征值较小或因为值的分布存在高度偏差而变大。如果您需要特征选择技术 – 使用特征选择方法(如L1正则化模型),否则您可能会从数据中得出错误的结论。