使用类值解决决策树问题?

我刚开始使用WEKA和机器学习,所以请原谅我下面提出的无知问题。我已经浪费了几个小时试图解决这个问题,希望有人能指引我正确的方向:

我试图对USDJPY的数据运行J48决策树。数据是通过.csv文件加载的,类值是名义类型,更具体地说,如果USDJPY在20个交易日后交易价格上涨超过1%,则值为TRUE或FALSE。问题是,当我运行算法时,决策树只是简单地使用类值来解决问题,这毫无用处。除了类属性外,还有22个其他属性,我希望通过这些属性来预测类属性。

当我将我的数据集与示例“glass”数据集进行比较时,我找不到任何差异来解释我的问题。运行J48时(使用相同的设置),“glass.arff”文件按预期工作,通过其他属性尝试预测类值(玻璃类型),(即有些猜测是错误的)。

我在这里错过了什么?以下是属性列表:

@ATTRIBUTE date NUMERIC@ATTRIBUTE open NUMERIC@ATTRIBUTE high NUMERIC@ATTRIBUTE low NUMERIC@ATTRIBUTE close NUMERIC@ATTRIBUTE 1daypctchg NUMERIC@ATTRIBUTE smavg50onclose NUMERIC@ATTRIBUTE smavg100onclose NUMERIC@ATTRIBUTE smavg200onclose NUMERIC@ATTRIBUTE ubb2 NUMERIC@ATTRIBUTE bollma2 onclose NUMERIC@ATTRIBUTE lbb2 NUMERIC@ATTRIBUTE bollwjpybgn NUMERIC@ATTRIBUTE %bjpybgn NUMERIC@ATTRIBUTE rsi NUMERIC@ATTRIBUTE ma50>100 {FALSE,TRUE}@ATTRIBUTE ma50>200 {FALSE,TRUE}@ATTRIBUTE ma100>200 {FALSE,TRUE}@ATTRIBUTE up1pct5d? {FALSE,TRUE}@ATTRIBUTE up1pct20d? {FALSE,TRUE}@ATTRIBUTE dwn1pct5d? {FALSE,TRUE}@ATTRIBUTE dwn1pct20d? {FALSE,TRUE}

回答:

只要你的.csv文件中真实类值始终在同一列,Weka(及其J48实现)就应该能够对你的数据进行分类。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注