如何在无监督领域适应中进行验证

以下是维基百科中的定义: 无监督领域适应:学习样本包含…

特征选择(Boruta)

已关闭。此问题需要更加集中。目前不接受回答。 想要改进…

在Tensorflow中构建循环卷积自编码器

我正在尝试在Tensorflow中构建一个循环卷积自编…

关于损失降低的不一致性

[x] 请检查您是否已更新到Keras的主分支。您可以…

关于模型选择的帮助

我正在研究机器学习领域。我有一个用例和数据,但我对一些…

scikit-learn: 在管道中应用任意函数

我刚刚发现了scikit-learn的Pipeline…

如何根据列数据类型在sparklyr中最佳地子集化Spark数据框

我正在将许多列转换为虚拟变量。我想从数据框中删除原始的…

为什么 ml_create_dummy_variables 在 sparklyr 中不显示新的虚拟变量列

我在尝试在 sparklyr 中创建模型矩阵。有一个函…

在scikit-learn中自动选择多个估计器的最佳者

scikit-learn是否有一个估计器可以运行多个其…

如何优化Python中的MAPE代码?

我需要一个MAPE函数,但在标准包中找不到&#8230…

如何通过测试集AUC分数检测xgboost的过拟合

我正在尝试了解如何构建预测模型,最近在R中发现了xgb…

在 Spark: MatrixFactorizationModel.scala 中,“recommendProductsForUsers”函数完成时间非常长

我有一个9个节点的集群,每个节点的配置如下, 我尝试使…

非朴素的文本分类算法?

朴素贝叶斯算法假设特征之间是独立的。哪些文本分类算法不…

使用Python在三维空间中绘制最大间隔超平面

我发现了一个关于SVM的非常酷的笔记本: https:…

R: 按时间区间分组数据框

我有一个如下所示的客户交易数据框: CustID Tr…

通过从现有值的分布中抽样来填补缺失值

缺失值是数据分析中常见的问题。一种常见的策略似乎是用从…

如何在训练集和测试集不同的情况下使用GridSearchCV?

我想为随机森林分类器(使用scikit-learn)找…

机器学习中的偏斜类和不平衡类

在机器学习中,偏斜类与不平衡类之间有区别吗?还是它们只…

Ensembles in Python

我已经使用Python中的scikit-learn实现…

MAE实际上告诉我什么?

我创建了一个简单的线性回归模型来预测标普500的收盘价…

如何解决“IndexError: 数组索引过多”的问题

我的代码出现了“IndexError: 数组索引过多”…

如何为使用线性回归模型的职位推荐选择训练数据集?

我的数据库中有两种类型的档案,一种是候选人档案,另一种…

如何处理书籍交叉数据集中的0条目

我正在使用书籍交叉数据集,其中有一个文件记录了用户X对…

scikit-learn RandomForestClassifier中特征重要性与森林结构的关系?

这是一个使用Iris数据集的简单示例。我在试图理解特征…

根据其他数据框向pandas数据框添加新列

我正在尝试在一个pandas数据框中设置一个新的列(实…