有人有在Julia(1.4.1)中训练支持向量机(SVM)的经验吗?
我尝试使用LIBSVM接口,但GitHub页面上的示例出现了错误:
# 加载Fisher经典的鸢尾花数据集iris = dataset("datasets", "iris")# LIBSVM自动处理多类数据,使用一对一策略labels = convert(Vector, iris[:Species])# 输入数据的第一维是特征;第二维是实例instances = convert(Array, iris[:, 1:4])'# 使用默认参数在数据的一半上训练SVM。查看svmtrain的文档以了解选项model = svmtrain(instances[:, 1:2:end], labels[1:2:end]);```ERROR: MethodError: no method matching LIBSVM.SupportVectors(::Int32, ::Array{Int32,1}, ::CategoricalArray{String,1,UInt8,String,CategoricalValue{String,UInt8},Union{}}, ::Array{Float64,2}, ::Array{Int32,1}, ::Array{LIBSVM.SVMNode,1})Closest candidates are:LIBSVM.SupportVectors(::Int32, ::Array{Int32,1}, ::Array{T,1}, ::AbstractArray{U,2}, ::Array{Int32,1}, ::Array{LIBSVM.SVMNode,1}) where {T, U} at /home/benny/.julia/packages/LIBSVM/5Z99T/src/LIBSVM.jl:18LIBSVM.SupportVectors(::LIBSVM.SVMModel, ::Any, ::Any) at /home/benny/.julia/packages/LIBSVM/5Z99T/src/LIBSVM.jl:27
回答:
看起来LIBSVM.jl
的文档相当过时,且包未得到适当更新,因此值得提出一个问题(或者至少提交一个拉取请求来更新README)。
您看到的错误与包本身无关,而是因为在当前版本的DataFrames.jl
和RDatasets.jl
中,labels
列不再是Vector
(在LIBSVM.jl
开发时是这样的),而是CategoricalArray。您可以通过将CategoricalArray转换为常规的Vector{String}
来避免这个问题。完整的示例如下所示:
using RDatasets, LIBSVMusing StatsBase, Printf # `mean`和`printf`不再在Base中,应明确使用# 加载Fisher经典的鸢尾花数据集iris = dataset("datasets", "iris")# LIBSVM自动处理多类数据,使用一对一策略labels = string.(convert(Vector, iris[:Species]))# 输入数据的第一维是特征;第二维是实例instances = convert(Array, iris[:, 1:4])'# 使用默认参数在数据的一半上训练SVM。查看svmtrain的文档以了解选项model = svmtrain(instances[:, 1:2:end], labels[1:2:end]);# 在数据的另一半上测试模型(predicted_labels, decision_values) = svmpredict(model, instances[:, 2:2:end]);# 计算准确率@printf "Accuracy: %.2f%%\n" mean((predicted_labels .== labels[2:2:end]))*100
或者,您可以使用MLJ.jl或ScikitLearn.jl,它们应该能正确包装LIBSVM.jl。