使用libsvm评估字符串数组

我正在使用Java版的libsvm,我已经创建了模型,现在我想用字符串数组来评估它,我之前已经用双精度浮点数数组完成了这个操作

但是我不知道如何用字符串数组进行评估,希望有人能帮助我

提前感谢,

这段代码适用于双精度浮点数数组

private double evaluate(Neighbor features, svm_model model) {    svm_node[] nodes = new svm_node[features.getDocument().getAttributes().size()];    Iterator<String> iteraitor = features.getDocument().getAttributes().keySet().iterator();    int i = 0;    while (iteraitor.hasNext()) {        svm_node node = new svm_node();        node.index = i;        String key = (String) iteraitor.next();        node.value = (features.getDocument().getAttributes().get(key));        nodes[i] = node;        i++;    }int totalClasses = 2;    int[] labels = new int[totalClasses];    svm.svm_get_labels(model, labels);    double[] prob_estimates = new double[totalClasses];    double v = svm.svm_predict_probability(model, nodes, prob_estimates);    for (int j = 0; j < totalClasses; j++) {        System.out.print("(" + labels[j] + ":" + prob_estimates[j] + ")");    }    // System.out.println("(Actual:" + features[0] + " Prediction:" + v + ")");    return v;}

回答:

SVM是一种在R^n空间中工作的几何分类器,它只接受数值。要在字符串上使用SVM,你必须执行以下操作之一:

  • 将字符串/文档转换为某种特征表示(数值),如tfidf
  • 使用基于字符串的核函数(如wordnet kernel等),它会自行引入数值特征空间

libsvm允许使用预计算的核值,因此如果你实现了某个核函数K(x_i,x_j),你只需向libsvm提供核矩阵,其中K[i,j]=K(x_i,x_j)(其中x_i是第i个训练样本)。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注