data-science – 第 2 页

IT技术

使用sklearn高效进行交叉验证数据集的网格搜索

xiaolong · 2025年5月31日 · 0 Comment

我正在使用网格搜索来寻找两个模型的最佳参数。我需要构建…

IT技术

如何在Python中使用训练好的模型测试新句子 (sklearn)

xiaolong · 2025年5月31日 · 0 Comment

我有用于多类文本分类的训练模型代码，并且它运行正常，但…

IT技术

如何利用OneHotEncoder的数组输出

xiaolong · 2025年5月31日 · 0 Comment

我是Python初学者… 我正在尝试理解如…

IT技术

从训练数据集中提取分类特征时出错

xiaolong · 2025年5月31日 · 0 Comment

我的训练数据看起来像这样：训练数据为了从中提取分类特…

IT技术

训练数据集和测试数据集可以分开而不是分割

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …

IT技术

model.get_weights() 与 model.trainable_variables 在 Tensorflow 中对比

xiaolong · 2025年5月31日 · 0 Comment

model.get_weights() 和 model…

IT技术

### 在Python中使用sklearn进行多元线性回归时的错误

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题需要调试细节。目前不接受回答。编辑问…

IT技术

在编写用于分析O’Reilly书籍中”California Housing”数据集的代码时，无法修复遇到的错误

xiaolong · 2025年5月31日 · 0 Comment

在执行代码时（来自书籍“Hands-On Machin…

IT技术

如何使用Python仅选择我需要的列

xiaolong · 2025年5月31日 · 0 Comment

ml = MonkeyLearn(‘2d14ec255…

IT技术

处理缺失分类数据时的属性错误

xiaolong · 2025年5月31日 · 0 Comment

我试图使用sklearn_pandas中的Catego…

IT技术

带重复的交叉验证

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题需要更多细节或更清晰的说明。目前不接受回…

IT技术

### K均值聚类和寻找最接近中心点的演员

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试使用K均值聚类方法对演员进行聚类，基于以下列…

IT技术

如何处理自然不平衡的数据集

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

如何处理重复的文本数据但具有不同的标签或类别？

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …

IT技术

Sklearn: 在OneHotEncoder中是否可以为未知类别指定null或NaN值？

xiaolong · 2025年5月31日 · 0 Comment

我正在处理一个包含混合类别和数值变量的数据集。由于数据…

IT技术

如何在H2OAutoML中设置weights_column？

xiaolong · 2025年5月31日 · 0 Comment

我在Python中尝试使用H2OAutoML创建回归模…

IT技术

pandas “groupby” 在标题中产生了一个无法访问或删除的级别

xiaolong · 2025年5月31日 · 0 Comment

df_india = pd.read_csv(‘fak…

IT技术

如何在数据聚类后根据其他列生成新列？

xiaolong · 2025年5月31日 · 0 Comment

我有一个这样的数据框，包含以下列 – [“…

IT技术

如何提升CatBoostRegressor的性能？

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题属于基于意见的问题。目前不接受回答。想…

IT技术

逻辑回归和词袋模型

xiaolong · 2025年5月31日 · 0 Comment

据我所知，X1代表某个词的出现次数，而beta1则是该…

IT技术

从头实现k-NN算法的低准确性

xiaolong · 2025年5月31日 · 0 Comment

我在尝试实现一个k-NN算法，但结果始终是非常低的准确…

IT技术

使用测试集进行预测时出现什么错误

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试分析泰坦尼克号数据集并构建一个预测模型。我已…

IT技术

如何在pandas中排除一两个列不进行标签编码？

xiaolong · 2025年5月30日 · 0 Comment

代码如下。我想在标签编码中排除名为’Car…

IT技术

Pytest tmpdir_factory 抛出了一个错误 “Expected binary or unicode string, got local”

xiaolong · 2025年5月30日 · 0 Comment

我正在使用 pytest 来测试将数据分割成训练集、验…

IT技术

如何将数据集缩放到与另一个数据集相同的尺度？

xiaolong · 2025年5月30日 · 0 Comment

我目前正在为我的回归模型缩放训练数据，并且我最终输入模…