weka: 自动应用属性选择

我在一个包含许多属性的庞大数据集上使用Weka。是否有办法自动应用特征选择的输出?这样我就不必手动删除数百个特征了?(在浏览器中)

如果有人知道,这将是一个加分项:CLI的命令是什么?(我经常使用脚本处理大量数据/分类器)

非常感谢!


回答:

这在浏览器和CLI中都是完全可行的。

在浏览器的前处理标签页上,有一个标记为“过滤器”的框。如果你选择“选择”按钮,并在新窗口中展开一些文件夹,你会发现有监督和无监督的属性过滤器。选择合适的过滤器后,你的选择将出现在前处理过滤器框中。你可以双击这个框来显示一个窗口,窗口中包含选项,允许你进一步定义你的过滤器。这个窗口还将包含“更多”和“能力”按钮,这些按钮将允许你了解更多关于你所选择的过滤器的信息。

对于你的任务,一些好的过滤器可能是:

  1. filters > supervised > attribute > AttributeSelction
    这是一种应用Weka内置属性选择程序的方法。

  2. filters > unsupervised > attribute > Remove
    这将允许你提供你想要从数据集中删除的属性的索引。

为了在CLI中实现这些属性过滤器和其他过滤器,我建议查看这两个来源。它们比我能做的更好地解释了这些内容。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注