为什么Python的’StandardScaler’和Matlab的’zscore’标准化方法不同?

为什么Python中sklearn.preproces…

为训练准备数据

我正在尝试通过创建字符文本的一热编码来准备数据文件,以…

如何在RNN TensorFlow中使用超大数据集?

我有一个非常大的数据集:7.9 GB的CSV文件。其中…

### 用于自编码器的数据预处理技巧

最近,我尝试使用自编码器来发现异常,但输入的某些特征是…

在机器学习中,从多维空间中选择多样化数据子集的方法?

我在考虑创建一个尽可能多样化的训练集,同时将数据压缩到…

如何使用监督机器学习方法处理不同维度的输入?

我目前正在处理训练和测试数据集(一组数组),这些数组的…

何时应用数据白化

数据白化(特征缩放和均值归一化)在我们使用代表不同特征…

如何在机器学习中处理带有其他属性的时间序列数据?

我正在处理一个二分类问题,每个数据实例包含多个不同指标…

解析非均匀数据

我正在尝试解析一组数据,这些数据包含两部分(或一部分)…

使用GPT-3.5和嵌入技术在大规模数据处理中表现卓越

我正在尝试将OpenAI的功能,特别是GPT3.5和嵌…

在机器学习中,AUC是否比准确率更适合作为不平衡数据集的评估指标?如果不是,哪个是最佳评估指标?

在处理不平衡数据时,AUC是否更有效?因为在大多数情况…

机器学习数据预处理

已关闭。此问题属于基于意见的问题,目前不接受回答。 想…