对具有异质变量的客户集进行聚类

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

Python: 快速对数组进行MinMax缩放

我使用以下方法将一个n维数组缩放到0和1之间: x_s…

在机器学习中,为什么大多数人使用random_state=42?

已关闭。此问题属于基于意见的。目前不接受回答。 想要改…

在对字符串数据进行分类时出现ValueError

我在尝试解决Kaggle上的泰坦尼克号问题(https…

某些数据集是否无法进行预测?

某些类型的数据集是否无法进行预测? 我目前的一个实际例…

sklearn.lda.LDA() 和 sklearn.discriminant_analysis.LinearDiscriminantAnalysis() 之间的区别

在阅读关于使用 Python 进行线性判别分析的过程中…

在决策树中将缺失值按原样处理

我的数据集中有一些变量(类别变量和数值变量)存在缺失值…

使用之前训练的模型在Catboost中进行进一步预测

我想找到使用Catboost进行分类的最佳参数。我有训…

### Numpy np.newaxis

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

我的目标是根据每个id_num之前的事件预测其接下来的3个事件

我是数据科学的新手,正在研究一个类似于下方展示的示例数…

R – 计算相似数据集之间的差异(相似性度量)

我已经看到许多涉及这个话题的问题,但还没有找到答案。如…

如何将Pandas时间戳分组并在Matplotlib中绘制多个图表并将它们堆叠在一起?

我有一个时间戳组织得很好的数据框架,如下所示: 这是一…

使用Pandas或Matplotlib绘制Pandas时间序列密度的方法?

我很难绘制Pandas时间序列的密度图。 我有一个数据…

Issue with Pandas DataFrame creating

我成功创建了一个DataFrame,但是列名有些问题。…

Matplotlib子图大小不相等

我在使用子图显示一些图形时,标签与最后一个子图混在一起…

Sklearn GridSearchCV是否会遍历估计器参数的所有可能默认选项?

scikit-learn中的算法可能有一些参数具有默认…

机器学习中的偏斜类和不平衡类

在机器学习中,偏斜类与不平衡类之间有区别吗?还是它们只…

将数据框中的列数据分类

我的数据框中有一列数字,我想将这些数字分类为例如高、中…

如何处理机器学习算法中的定性数据

假设我正在尝试使用神经网络来预测我的跑步时间。我有过去…

graphlab create sframe 如何获取 SArray 的中位数

我正在学习使用 graphlab create,代码如…

在多元高斯分布中如何处理某一特征的零标准差

我使用多元高斯分布来分析异常情况。训练集的外观如下 1…

有没有可以集成到iOS应用程序中的开源机器学习库(不寻求优缺点或最佳/最差库的评价)

已关闭。 此问题正在寻求对软件库、教程、工具、书籍或其…

有效提升随时间显著下降的信号的方法

我想知道如果信号在某段时间内显著下降,最有效的纠正方法…

如何计算点击率

这是一个例子,我有以下数据: datetime key…

线性回归的梯度下降法不起作用

我正在尝试实现一个简单的线性回归的梯度下降算法。我使用…