使用逻辑回归解决泰坦尼克号机器学习问题

我是一名有志成为数据科学家的人。我偶然发现了泰坦尼克号…

如何生成特定条目的Kaggle提交CSV文件? [重复]

这个问题已有答案: 如何读取和写入CSV文件? (9个…

将预测结果合并到原始数据框中?

我已经完成了一个从文本中分类类别的机器学习算法。我已经…

在Python中使用下限和上限替换异常值的函数

from sklearn import dataset…

如何使用线性回归预测模型?

我正在尝试使用数据集预测房价 我尝试使用线性回归模型,…

生成用户/项目交互

我有一个pandas数据框(交互数据框),列为用户、项…

如何预测特征数量与测试集可用特征数量不匹配的情况? [重复]

此问题已有答案: 在训练和测试数据中保持相同的虚拟变量…

Python列表在计数向量化和拟合函数中的错误

请告诉我哪里出了问题以及如何纠正。 data = op…

使用Python将大型数据集的等价行分组为二维数组

我有10万行数据,我想按照下面的方法在Python中进…

无法将字符串转换为浮点数以及如何使用此数据集训练模型

我有一个数据集,包含以下列:年龄(浮点类型)、性别(字…

MultiLabelBinarizer在逆变换时混淆数据

我在机器学习中使用sklearn的multilabel…

使用包含NA值的字段进行TensorFlow模型训练

我正在尝试使用TensorFlow创建一个机器学习模型…

从Pandas数据框生成三元组

我正在尝试根据类别或标签从Pandas数据框中生成所有…

从Dask数据框中获取一行而不将整个数据框加载到内存中

是否可以让Dask一次只将一行加载到内存中?我有一个巨…

箱形图胡须之外的点是否为异常值?

我在处理泰坦尼克号数据集时发现,绘制箱形图后出现了大量…

在node-red-contrib-machine-learning中遇到错误

我正在尝试使用这个库在node-red中实现最基本的机…

如何判断在处理空值时是删除列还是行?

这是我的数据框的头部。我试图删除“Type 2”列中的…

对于有序变量,是否必须创建虚拟变量?转换时也遇到了错误

我正在处理的数据集中,分类变量是有序的,三个列的值从1…

使用XGBoost进行预测时遇到问题

我有一个使用XGBoost进行二元分类预测的程序。我已…

多项式回归出现错误“形状 (18,17) 和 (1140,1) 不对齐:17 (dim 1) != 1140 (dim 0)”

我在数据框上使用多项式回归。这是代码 from skl…

Scikit-Learn/Pandas: 使用保存的模型基于用户输入进行预测

我正在使用Pandas构建一个机器学习模型,但在将我的…

如何使用测试数据对抗训练模型?

我是一名机器学习的初学者,目前正在参与泰坦尼克号竞赛。…

结合文本和数值列用于机器学习算法

我正在处理一个情感分类问题,需要预测推文的情感是积极的…

Pandas keyError : (‘%s not 在索引中’ % objarr[mask])

已关闭。 此问题不符合 Stack Overflow …

如何使用 sklearn 的 Pipeline 和 FeatureUnion 选择多个(数值和文本)列进行文本分类?

我已经开发了一个用于多标签分类的文本模型。使用 One…