from category_encoders impo…
我是PySpark的新手,我想将包括编码和归一化部分的…
已关闭。此问题属于基于意见的问题,目前不接受回答。 想…
当我从头开始实现KNN填补方法来处理缺失数据时,我遇到…
最近我在学习使用tidymodels构建机器学习工作流…
我想将Google Vision API面部识别的输出…
我的“版本”列包含数据模式不一致,有些数据后面跟着逗号…
我正在处理遗传数据,其中等位基因在t个测序的染色体中被…
我有一份关于Google Playstore数据的数据…
我正在使用的数据集: https://www.kagg…
我的模型有六个特征 f1,f2,f3,f4,f5 an…
最近我在做一个Kaggle项目“Prudential …
我目前正在处理一个与蛋白质相关的二元分类问题。目标是确…
在Sklearn中,如何在LabelEncoding之…
为了理解“哈希技巧”,我编写了以下测试代码: impo…
以下是我试图进行特征工程的数据集的一列: +—+-…
背景: 我正在进行健康保险索赔的二元分类工作。我处理的…
这只是一个机器学习/数据科学问题。 a) 假设我有一个…
我正在处理一个大小为(500, 33)的数据集。 特别…
我的数据框df中有三种类型的分类数据。 df[‘Veh…
我的数据集如下: profile category t…
我正在构建一个模型,用于根据用户的阅读历史等活动来预测…
我收集了关于天气预报的小时数据。我收集的特征包括数值型…
在我的数据集中,某些字符串列包含None或NA值,我想…
我想知道在完成分箱操作后应该怎么做。例如,其中一个特征…