我目前正在进行多标签分类工作。我使用SVMlight作为分类器,并将多标签问题进行了二值化处理。这意味着在我的案例中需要进行超过1000次的分类运行。
我的特征大小固定为1000,模型的训练现在需要超过3天的时间(使用2 GHz的Intel Core 2 Duo处理器和8 GB内存)。有没有人有经验知道这种情况是否常见,或者能否提供一些建议来提升性能?你认为更换到高性能机器会带来显著效果吗?
提前感谢!
回答:
特征归一化解决了我的问题,在特征空间中进行min/max([-1,1])归一化后,性能大幅提升。