我在尝试使用SVM light对路透社文本进行分类,但我的训练数据不符合所需格式
<‘line> .=. <‘target> <‘feature>:<‘value> <‘feature>:<‘value> … <‘feature>:<‘value> # <‘info>
我的数据格式是
<‘line> .=. <‘feature>:<‘value> <‘feature>:<‘value> … <‘feature>:<‘value> # <‘info>
目标标签在另一个单独的文件中。我知道SVM light有一个选项可以指定一个单独的目标标签文件,但我无法在SVM light网站上找到它,因为我收到一个错误消息:
Reading examples into memory…Line must start with label or 0!!!
每当我使用以下命令加载我的训练数据时
svm_learn example1/train.dat example1/model
有什么建议吗?
回答:
经过深入研究,我发现SVM light没有语法允许用户为训练数据指定外部类别标签文件。类别标签必须是训练数据的一部分,并且应遵循SVM light的”target feature:value”格式