在sklearn中如何在管道中预处理标签?

我有一个预处理脚本,用于从钻石数据集中获取数据并进行预…

在Pandas数据框中添加一列,并按百分比随机填充值

我想在一个Pandas数据框上进行测试、训练和验证,但…

将numpy数组映射回pandas时间序列的最佳方法

我有一个如下所示的时间序列: from datetim…

将来,向 .loc 或 [] 传递包含任何缺失标签的列表样对象将会引发 KeyError,您可以使用 .reindex() 作为替代方法

我试图通过以下方式将我的数据集分为训练集和测试集: f…

为机器学习的X添加时间戳日期

这个循环使用np来向预测数据集添加未来日期: # 未来…

模型预测返回警告

我正在尝试构建一个模型,用于预测运动员获得奖牌的概率。…

如何在预测时使用pandas.get_dummies

为了运行深度学习模型,我需要将分类值列转换。在训练时,…

如何将类函数应用于替换 pandas 数据框子集列中的 NaN 为均值?

该类由一组属性和函数组成,包括: 属性: df:一个 …

如何删除方差在容忍范围内的pandas DataFrame列?

假设有以下DataFrame: d={‘month’:…

Scikit-learn 列转换器无法返回特征名称

我试图使用列转换器和独热编码器来转换我的分类数据: 快…

如何在一个数据集的列上应用函数来移除特定字符?

我想在一个包含文本文章的数据集的列上应用一个循环函数。…

无法更改Python数据框列的值

for ind in data6.index: if(…

Pandas ValueError: 无法设置没有定义索引的框架和无法转换为序列的值

我正在参考Rounak Banik写的《Hands o…

如何将回归数据转换为分类数据?

已关闭。此问题需要详细信息或澄清。目前不接受回答。 想…

Kaggle泰坦尼克号-从灾难中学习机器学习与TensorFlow:模型训练无法获取损失值

我刚刚开始学习使用TensorFlow进行机器学习,我…

字典的平均值

使用来自sklearn的iris数据集。我将数据分开,…

为什么我在Tensorflow中使用相同文件夹内的图像时,有些图像会被忽略?

我有两个文件夹的数据(训练集有10000张图像,验证集…

python-如何正确选择k个最佳数值特征?

我试图对一个名为x_train的pandas数据框中的…

如何查找数据集中的异常?

如今,我面临一个问题,就是有些数据集中包含异常。例如,…

scikit在整个数据框上的预处理

我有一个数据框: df = pd.DataFrame(…

线性回归中遇到的双精度溢出错误

大家好,我正在尝试进行线性回归,当我运行代码时出现了以…

如何在不使用循环的情况下,使用序列对列表进行索引?

Result = pd.DataFrame({‘Fil…

房屋机器学习错误:”支持的目标类型为:(‘binary’, ‘multiclass’)。但得到的是’multilabel-indicator'”

我正在尝试创建一个机器学习算法来测试一些房屋数据的cr…

ValueError: 无法将字符串转换为浮点数: ‘Yes, policy’ 拟合到我的逻辑回归模型上

我在使用pandas读取一个Excel表格,该表格有超…

如何在scikit learn模型中使用Tensorflow嵌入?

我正在尝试将文本数据用作线性回归模型的输入,并使用te…