在sklearn和pandas中将字符串特征转换为数值特征

我目前正在使用sklearn(我还是个初学者),我想训…

需要将数据框的列值转换为独立的列,并使用pandas填充每个单元格的计数值

我有一个数据框 data_frame = pd.Dat…

错误:无效的单位缩写:/ ,尝试转换日期格式为 2012/10/2 上午9:00:00 时发生

我正在使用pandas将包含日期和时间的列转换为秒,使…

如何仅修改Python中的数值变量

我想仅修改数据框中的数值变量,即通过中位数填补数值变量…

尝试将预测值回填到数据框的相应行

我正在使用我的模型进行预测,输出形式为numpy nd…

尝试找出数据框中一列与另一列的相似度

我正在尝试计算准确率。 我有一个包含众多数据列的pan…

Pandas累积数据用于线性回归

我试图调整我的数据,以便每天的总收入累积。例如: `C…

如何利用未来未知的数据?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

转换 Python datetime.datetime

我的 Postgres 数据库在这里以这种格式保存日期…

如何通过tree.plot_tree设置树视图中列的名称?

我试图通过sklearn库中的tree绘制一棵树,但问…

在构建模型时使用datetime64特征类型?

我有一个包含大约50个特征的数据框。我的实验中涉及到一…

在为线性回归模型获取值错误

我正在尝试参加Kaggle的泰坦尼克号竞赛。在尝试将线…

如何在线性回归中使用X和Y变量?

我正在尝试使用简单线性回归来预测某物品的成本。作为输入…

如何将sklearn决策树规则提取为pandas布尔条件?

关于如何提取sklearn决策树规则的帖子有很多,但我…

如何为线性回归定义目标变量

我想对一个尺寸为96×100的数据集进行回归…

准备训练数据集

在准备训练数据集时,我需要从训练数据集中移除目标变量数…

将TfidfVectorizer的fit_transform变量转换为数组(.toarray())后所有值变为零?

我在使用一个样本数据集进行tfidf实验时,一切正常,…

Pandas不会将分类数据[性别]转换为数值[0/1]

我正在尝试处理泰坦尼克号数据集。我想将Sex列转换为二…

如何将字符串数据分类为整数?

我需要对数据集中某个特征的字符串值进行分类,以便进一步…

为什么替换函数没有用新的列表替换我的列表?

我使用了替换函数,尝试用另一个单一项列表替换一个单一项…

使用Statsmodels VAR预测时间序列时遇到ValueError

我在尝试使用我的月度数据集预测未来的数值(数据按每年的…

Python: float() 参数必须是字符串或数字,而非 ‘pandas._libs.interval.Interval’

我在尝试Analytics Vidhya的贷款预测机器…

ValueError: 传递的项目数量错误,实际传递了5个,预期为1

点击查看数据样本我试图用每个Item_Identifi…

XGBoost: AttributeError: ‘DataFrame’ 对象没有属性 ‘feature_names’

我已经训练了一个用于二分类任务的XGBoost分类器。…

在函数中调用时显示混淆矩阵

我有一个函数,它从scikit-learn导入随机森林…