我正在使用Java版的libsvm,我已经创建了模型,现在我想用字符串数组来评估它,我之前已经用双精度浮点数数组完成了这个操作
但是我不知道如何用字符串数组进行评估,希望有人能帮助我
提前感谢,
这段代码适用于双精度浮点数数组
private double evaluate(Neighbor features, svm_model model) { svm_node[] nodes = new svm_node[features.getDocument().getAttributes().size()]; Iterator<String> iteraitor = features.getDocument().getAttributes().keySet().iterator(); int i = 0; while (iteraitor.hasNext()) { svm_node node = new svm_node(); node.index = i; String key = (String) iteraitor.next(); node.value = (features.getDocument().getAttributes().get(key)); nodes[i] = node; i++; }int totalClasses = 2; int[] labels = new int[totalClasses]; svm.svm_get_labels(model, labels); double[] prob_estimates = new double[totalClasses]; double v = svm.svm_predict_probability(model, nodes, prob_estimates); for (int j = 0; j < totalClasses; j++) { System.out.print("(" + labels[j] + ":" + prob_estimates[j] + ")"); } // System.out.println("(Actual:" + features[0] + " Prediction:" + v + ")"); return v;}
回答:
SVM是一种在R^n
空间中工作的几何分类器,它只接受数值。要在字符串上使用SVM,你必须执行以下操作之一:
libsvm
允许使用预计算的核值,因此如果你实现了某个核函数K(x_i,x_j)
,你只需向libsvm
提供核矩阵,其中K[i,j]=K(x_i,x_j)
(其中x_i
是第i
个训练样本)。