LDA 在 Python 中生成的组件少于请求的数量

我正在处理以下数据集: http://archive….

使用Pandas在Python中进行多行计算的特征工程

我有以下格式的CSV数据: +————…

数据传输中的异常检测

我正在开发一个异常检测模型,需要帮助识别数据传输中的异…

sklearn中的层次分类

已关闭。 此问题是在寻求软件库、教程、工具、书籍或其他…

GaussianNB: 无法将字符串转换为浮点数: ‘Thu Apr 16 23:58:58 2015’

我在尝试使用GaussianNB解决一个机器学习问题。…

在Python中使用Pandas导入数据的问题

我正在学习以下机器学习教程: http://machi…

机器学习:如何检测生成依赖布尔值的独立变量

我在工作中尝试使用机器学习,但找不到适合我需求的方法。…

数据科学:评分方法论

我正在寻找一种方法,根据某些事件为个人分配风险评分。我…

如何在无监督领域适应中进行验证

以下是维基百科中的定义: 无监督领域适应:学习样本包含…

特征选择(Boruta)

已关闭。此问题需要更加集中。目前不接受回答。 想要改进…

在Tensorflow中构建循环卷积自编码器

我正在尝试在Tensorflow中构建一个循环卷积自编…

关于损失降低的不一致性

[x] 请检查您是否已更新到Keras的主分支。您可以…

关于模型选择的帮助

我正在研究机器学习领域。我有一个用例和数据,但我对一些…

scikit-learn: 在管道中应用任意函数

我刚刚发现了scikit-learn的Pipeline…

如何根据列数据类型在sparklyr中最佳地子集化Spark数据框

我正在将许多列转换为虚拟变量。我想从数据框中删除原始的…

为什么 ml_create_dummy_variables 在 sparklyr 中不显示新的虚拟变量列

我在尝试在 sparklyr 中创建模型矩阵。有一个函…

在scikit-learn中自动选择多个估计器的最佳者

scikit-learn是否有一个估计器可以运行多个其…

如何优化Python中的MAPE代码?

我需要一个MAPE函数,但在标准包中找不到&#8230…

如何通过测试集AUC分数检测xgboost的过拟合

我正在尝试了解如何构建预测模型,最近在R中发现了xgb…

在 Spark: MatrixFactorizationModel.scala 中,“recommendProductsForUsers”函数完成时间非常长

我有一个9个节点的集群,每个节点的配置如下, 我尝试使…

非朴素的文本分类算法?

朴素贝叶斯算法假设特征之间是独立的。哪些文本分类算法不…

使用Python在三维空间中绘制最大间隔超平面

我发现了一个关于SVM的非常酷的笔记本: https:…

R: 按时间区间分组数据框

我有一个如下所示的客户交易数据框: CustID Tr…

通过从现有值的分布中抽样来填补缺失值

缺失值是数据分析中常见的问题。一种常见的策略似乎是用从…

如何在训练集和测试集不同的情况下使用GridSearchCV?

我想为随机森林分类器(使用scikit-learn)找…