Python 随机森林与机器学习 – 改进

我刚开始使用Python进行机器学习。我的编程背景是Fortran,所以你可以想象,Python是一个巨大的飞跃。我在化学领域工作,并且开始参与化学信息学(将数据科学技术应用于化学)。因此,Python广泛的机器学习库的应用非常重要。我的代码也需要高效。我已经编写了一个可以运行且看起来运作正常的代码。我想知道的是:

1 如何最好地改进它/使其更高效。

2 对我的代码中使用的其他方法有何建议,如果可能的话,请说明为什么其他方法可能更优越?

我通常处理连续数据和回归模型。

任何建议都将不胜感激,提前感谢您的帮助。

这段代码不需要翻译,保持原样

回答:

您还可以对数据进行特征选择:

scikit-learn特征选择

scikit-learn提供了一些特征选择技术,您可以使用它们来改善数据挖掘项目的某些方面

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注