LibSVM 中的名义属性

在创建 libsvm 训练文件时,如何区分名义属性和数值属性?我尝试将某些名义属性编码为整数,但我想确保 libsvm 不会错误地将它们解释为数值。不幸的是,libsvm 的站点似乎只有非常少的文档。Pentaho 的文档似乎暗示 libsvm 做了这种区分,但我仍然不清楚它是如何实现的。


回答:

不要这样做 I'm trying to encode certain nominal attributes as integers

而是为每个名义属性的每个值使用单独的二元特征。

根据 SVM 的公式,所有属性/特征都是数值型的,而类标签是名义型的。名义属性本质上是通过使用互斥的二元特征来伪造的。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注