如何在第1行获取正确的libsvm输入格式

我最近刚开始使用libsvm。我尝试了一段时间来训练我的特征,获取模型,然后使用相应的特征进行预测。不幸的是,我不断遇到错误的文件格式。我通常会采取这种措施,裁剪我的特征,然后在它们上面进行训练,这样我就能得到一个模型。

这是我训练以获取模型的方式。顺便说一下,我是通过Unix命令行来做的。

./svm-train -t 0 -b 1 svmtrainModel1Revised.txt TrainedModel1.svm

0 1:8.109121    2:11.063075 3:9.265099 4:7.392232  5:9.5773860 1:7.497237    2:10.314889 3:9.330452 4:8.658748 5:9.4930170 1:7.579283    2:9.853208 3:9.863712 4:8.48306 5:9.848121 1:7.683603    2:10.323639 3:10.616027 4:7.039438 5:10.3214181 1:7.645213    2:9.742212 3:9.957533 4:8.810831 5:8.860670 1:7.738999    2:9.956453 3:9.643299 4:8.553764 5:9.8242241 1:7.968907    2:10.610946 3:9.061123 4:7.84069 5:9.793263

我根据上述获得的模型进行预测。

./svm-predict -b 1 svmtest1RevisedA.txt TrainedModel1.svm labelmodel1.txt

这些特征的格式与上述相同,只是缺少了真实标签。

8.139867    10.146595   9.554127    8.409128    9.3809237.691873    9.820682    9.777709    9.136581    9.0385138.629565    10.684548   9.192018    9.031779    9.7330097.796154    10.871736   9.113837    7.329961    10.0716537.235544    9.994834    10.601161   8.720384    10.1121528.008006    10.75276    10.755063   7.517268    9.4156187.857692    9.936756    9.556366    8.941176    8.9336037.806821    9.934397    9.324827    8.422852    8.797105

这些元素之间没有逗号,只有空格,但当我进行预测时,它告诉我第1行的输入格式错误。请帮助我。


回答:

你需要将训练标签设置为1或-1。这是机器学习领域中SVM子领域的标准做法。另外,你可能需要删除任何制表符,并确保你的空白字符只包含空格。

这是我使用libsvm训练的一个文件中的几行:

-1 1:0.000000 2:0.274121 3:0.448146 4:0.586426 5:0.599033 6:0.1124811 1:0.406015 2:0.411721 3:0.588133 4:0.757176 5:0.462532 6:0.196860-1 1:0.131868 2:0.432938 3:0.614296 4:0.711778 5:0.178528 6:0.2179121 1:0.489093 2:0.393096 3:0.568940 4:0.744675 5:0.527169 6:0.590553-1 1:0.077703 2:0.226890 3:0.408387 4:0.523369 5:0.837690 6:0.454314

如果你对输入格式仍然感到困惑,可以使用checkdata.py脚本。它位于libsvm-3.12/tools目录中(相对于你的libsvm安装目录),如果存在任何格式错误,它可以解释这些错误。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注