机器学习中的偏斜类和不平衡类

在机器学习中,偏斜类与不平衡类之间有区别吗?还是它们只…

Ensembles in Python

我已经使用Python中的scikit-learn实现…

MAE实际上告诉我什么?

我创建了一个简单的线性回归模型来预测标普500的收盘价…

如何解决“IndexError: 数组索引过多”的问题

我的代码出现了“IndexError: 数组索引过多”…

如何为使用线性回归模型的职位推荐选择训练数据集?

我的数据库中有两种类型的档案,一种是候选人档案,另一种…

如何处理书籍交叉数据集中的0条目

我正在使用书籍交叉数据集,其中有一个文件记录了用户X对…

scikit-learn RandomForestClassifier中特征重要性与森林结构的关系?

这是一个使用Iris数据集的简单示例。我在试图理解特征…

根据其他数据框向pandas数据框添加新列

我正在尝试在一个pandas数据框中设置一个新的列(实…

使用不完整数据进行机器学习

我有一百万个样本,样本中大约有1000个特征。然而,每…

设计一个最小图像数据的分类器

我想训练一个三类别的组织图像分类器,但总共只有大约50…

使用Spark ML进行文本分类

我有一段基于免费文本描述的分类需求。例如,描述可能是关…

理解KMeans算法的质量

在阅读了KMeans的不平衡因子之后,我试图理解这是如…

从更大的应用数据集中选择训练集

我正在尝试对一个数据集进行情感分析。但是,没有现成的语…

TensorFlow: 它只有SGD算法吗?还是也包括其他算法如LBFGS

关于TensorFlow的问题: 我在网站上查看视频和…

在多元高斯分布中如何处理某一特征的零标准差

我使用多元高斯分布来分析异常情况。训练集的外观如下 1…

ValueError: 标签 [‘timestamp’] 不在轴中

我在学习机器学习时,遇到了这个代码。我尝试运行上述来源…

“ValueError: labels [‘timestamp’] 不包含在轴中” 错误

我有这段代码,我想从文件中删除 ‘time…

是否有方法了解sklearn GridSearch的进度

网格搜索通常耗时较长,因此我想知道它目前运行到了什么程…

为使用聚类准备数据

数据集:我得到了每个客户每天使用产品的分钟数,试图通过…

Spark: 覆盖库方法

我想对spark.ml.classification….

如何解释k-means聚类的结果?

我目前正在使用NTSB航空事故数据库进行一些分析。这个…

朴素贝叶斯分类器:在鸢尾花数据集上的准确率仅为30-40%

过去几天,我一直在尝试用Python实现朴素贝叶斯分类…

机器学习与显式编程的区别

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

分类文本

我正在尝试判断给定的URL是否属于某种活动。所谓“活动…

如何从CountVectorizer中过滤特征?

我在进行文本分析(主题建模),当我使用CountVec…