我最近刚开始使用libsvm。我尝试了一段时间来训练我的特征,获取模型,然后使用相应的特征进行预测。不幸的是,我不断遇到错误的文件格式。我通常会采取这种措施,裁剪我的特征,然后在它们上面进行训练,这样我就能得到一个模型。
这是我训练以获取模型的方式。顺便说一下,我是通过Unix命令行来做的。
./svm-train -t 0 -b 1 svmtrainModel1Revised.txt TrainedModel1.svm
0 1:8.109121 2:11.063075 3:9.265099 4:7.392232 5:9.5773860 1:7.497237 2:10.314889 3:9.330452 4:8.658748 5:9.4930170 1:7.579283 2:9.853208 3:9.863712 4:8.48306 5:9.848121 1:7.683603 2:10.323639 3:10.616027 4:7.039438 5:10.3214181 1:7.645213 2:9.742212 3:9.957533 4:8.810831 5:8.860670 1:7.738999 2:9.956453 3:9.643299 4:8.553764 5:9.8242241 1:7.968907 2:10.610946 3:9.061123 4:7.84069 5:9.793263
我根据上述获得的模型进行预测。
./svm-predict -b 1 svmtest1RevisedA.txt TrainedModel1.svm labelmodel1.txt
这些特征的格式与上述相同,只是缺少了真实标签。
8.139867 10.146595 9.554127 8.409128 9.3809237.691873 9.820682 9.777709 9.136581 9.0385138.629565 10.684548 9.192018 9.031779 9.7330097.796154 10.871736 9.113837 7.329961 10.0716537.235544 9.994834 10.601161 8.720384 10.1121528.008006 10.75276 10.755063 7.517268 9.4156187.857692 9.936756 9.556366 8.941176 8.9336037.806821 9.934397 9.324827 8.422852 8.797105
这些元素之间没有逗号,只有空格,但当我进行预测时,它告诉我第1行的输入格式错误
。请帮助我。
回答:
你需要将训练标签设置为1或-1。这是机器学习领域中SVM子领域的标准做法。另外,你可能需要删除任何制表符,并确保你的空白字符只包含空格。
这是我使用libsvm训练的一个文件中的几行:
-1 1:0.000000 2:0.274121 3:0.448146 4:0.586426 5:0.599033 6:0.1124811 1:0.406015 2:0.411721 3:0.588133 4:0.757176 5:0.462532 6:0.196860-1 1:0.131868 2:0.432938 3:0.614296 4:0.711778 5:0.178528 6:0.2179121 1:0.489093 2:0.393096 3:0.568940 4:0.744675 5:0.527169 6:0.590553-1 1:0.077703 2:0.226890 3:0.408387 4:0.523369 5:0.837690 6:0.454314
如果你对输入格式仍然感到困惑,可以使用checkdata.py脚本。它位于libsvm-3.12/tools
目录中(相对于你的libsvm安装目录),如果存在任何格式错误,它可以解释这些错误。