我尝试使用Weka中的NaiveBayesUpdateable分类器。我的数据包含了名义属性和数值属性:
@relation cars @attribute country {FR, UK, ...} @attribute city {London, Paris, ...} @attribute car_make {Toyota, BMW, ...} @attribute price numeric %% 汽车价格 @attribute sales numeric %% 销售的汽车数量
我需要根据其他属性预测销售数量(数值!)。
我了解到在Weka中不能使用数值属性进行贝叶斯分类。一种技术是将数值属性的值分割成长度为k的N个区间,并使用名义属性代替,其中n是类名,像这样:@attribute class {1,2,3,…N}。
然而,我需要预测的数值属性范围从0到1,000,000。创建1,000,000个类别完全没有意义。如何使用Weka预测数值属性,或者如果Weka没有这类工具,我应该寻找哪些算法?
回答:
这根本不是一个分类问题。你应该使用回归模型,例如LinearRegression
。