我想使用scikit-learn的SVM,并使用如这里所示的卡方核。在这种情况下,核函数是基于直方图的,这正是我的数据的表示形式。然而,我找不到将这些与直方图一起使用的例子。正确的做法是什么?
正确的做法是否是将直方图视为一个向量,其中向量的每个元素对应于直方图的一个区间?
提前感谢
回答:
有一个使用近似特征映射的例子,在这里。这个例子是针对RBF核的,但它同样适用。
上面的例子使用了“pipeline”,但你也可以在将数据传递给线性分类器之前先对数据进行转换,因为AdditiveChi2Sampler
实际上并不以任何方式fit
数据。
请记住,这只是核映射的一个近似(我发现它工作得相当好),如果你想使用精确的核,你应该采用@人名的答案。