使用LibShortText处理LibSVM格式的文件

我在尝试使用LibShortText，但我并不完全理解它的工作原理。

从README来看，它的功能似乎是针对文本文件的。然而，我需要对已经是LibSVM格式的文件进行分类，所以我想像text-train.py和text-predict.py这样的功能可能不适用…?

还提到：


如果提供了一个预处理目录，那么假设训练数据已经是LIBSVM格式的。
有谁知道什么是预处理目录…?
从LibShortText文档中，我看到有一个“中级分类模块 – 学习器”，它可以处理像我这样的文件。然而，我不明白它是如何工作的！它没有像LIBSVM那样所有的参数，例如…而且我还没有成功找到如何保存或理解结果（权重和预测在哪里？）。
如果有人能解释这个东西是如何工作的，我会非常感激（我已经测试了好几个小时了）…谢谢！

回答：
根据文档（http://www.csie.ntu.edu.tw/~cjlin/libshorttext/doc/libshorttext.html#quick-start），你可以使用-A选项来附加.svm文件。
但是，如果你的数据已经是libsvm格式的，你可以直接使用liblinear（libshorttext底层的库）。
如果你已经有了libshorttext的发行版，那么你已经有了liblinear。你可以通过从你解压libshorttext的任何位置使用cd命令来编译和运行，如下所示：
 $ cd libshorttext/classifier/learner/liblinear $ make $ ./train train_file.svm $ ./predict test_file.svm model_file output_file
作为参考，这里是liblinear的README：https://github.com/ninjin/liblinear/blob/master/README，我发现它非常有用。



相关文章：

文本分类 – 如何找出最影响决策的特征
LibSVM 中的名义属性
使用 LibSVM 计算与均值/标准差对最接近的匹配项
MATLAB 中的支持向量机
机器学习，最佳技术
测试非线性支持向量机的数据集
求助–使用LibSVM获得100%的准确率？
SVM和神经网络
了解LibSVM中SVM参数的好资源
如何选择合适的核函数

学技术

使用LibShortText处理LibSVM格式的文件

发表回复取消回复

相关文章：

使用 LibSVM 计算与均值/标准差对最接近的匹配项

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复