将数值映射到字符串

我有一个数据集: 数据集 我想将数值映射到CASE_S…

尝试重现《动手学习机器学习与Sci-Kit Learn和Tensorflow》书中房屋数据集时无法显示

我试图使用下面的代码重现书中的房屋数据集/代码,但不知…

能否根据前几个月的数据预测潜在客户的数量

我有一组关于每天生成的潜在客户的数据样本。潜在客户不过…

如何创建现有DataFrame(pandas)的副本?

我刚刚开始探索pandas。我尝试在不影响源DataF…

使用Python对不常见的特征级别进行独热编码

我有一个包含分类因子的模型。我使用pandas.get…

如何处理这种缺失值和用于回归的日期格式?

我想从这个数据集中建立回归模型(前两个是自变量,最后一…

plt.scatter(X[:50,0], X[:50, 1], color = ‘red’, marker = ‘o’, label = ‘setosa’)

我在这里有一个关于plt.scatter的新手问题。 …

如何清理带有文本数据的数据集并用于分类

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

Word2Vector ValueError: scatter需要x列为数值型

我是机器学习的新手,可能会犯一些简单的错误,任何帮助都…

ValueError: 输入包含NaN、无穷大或对于dtype(‘float64’)来说过大的值,而这是在预处理数据时发生的

我有两个CSV文件(训练集 和 测试集)。由于在一些列…

通过预处理提高神经网络的准确性

阅读 https://blog.slavv.com/3…

在执行分层时,是否应保持类别比例?

我有30,000个按情感分类的短语。 我打算使用朴素贝…

TypeError: 不可哈希类型: ‘numpy.ndarray’ – 如何通过查询球树的半径从数据框中获取数据?

如何通过查询球树的半径来获取数据?例如 from sk…

Python 循环错误计数器

我在尝试删除 DataFrame 中的列,并想询问为什…

Pandas.plotting不显示图表

我正在按照《Python机器学习导论》这本书中的教程进…

将多类别实例转换为单类别实例 – Python

我目前正在探索一个CSV格式的数据集,其中的值如下所示…

学习算法的准确性在特征平均后下降

我有一个庞大的数据集需要清理。在这个数据集中,有6列代…

如何处理测试数据中某列缺失值时的一热编码问题?

例如,如果我的训练数据在某列中包含分类值(1,2,3,…

TypeError: 在尝试连接时无法连接一个非NDFrame对象

输入图片描述这是我的代码,我试图在axis=0上连接或…

如何将训练和测试数据集拆分为 X_Train、y_train 以及 X_Test、y_Test? [duplicate]

此问题已有答案: 如何将数据集拆分为训练和测试数据集,…

在Pandas DataFrame中聚合行

我有一个包含以下列的pandas DataFrame:…

自定义的Sklearn变换器单独使用时正常,但在管道中使用时抛出错误

我有一个简单的sklearn类,我希望将其用作skle…

如何在Scikit-Learn中重用LabelBinarizer进行输入预测

我在使用Scikit-Learn训练分类器。我从CSV…

值错误:传递的项目数量错误,传递了2个,位置暗示应为1

这段代码运行正常… forest1 = R…

在线性回归中,随着每次迭代,梯度下降的成本增加

你好,我正在学习一些机器学习算法,为了理解,我尝试实现…