我的数据中包含了一些分类特征和连续特征。将分类特征进行…
我有多个训练和测试数据框。 例如:train1, tr…
我对数据科学还比较新手。我正在尝试使用LDA解决NLP…
我有一个大型的CSV文件(3000行*20000列),…
我正在尝试计算此数据中每个滑动窗口内的持续时间: ID…
我试图在以下数据的每个滑动窗口内统计相同ID的数量: …
如果我使用以下方法对数据集进行了标准化处理: data…
我在使用Python进行机器学习模型的开发。我试图预测…
已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …
我正在开发一个新闻推荐系统,需要为用户和他们阅读的新闻…
假设我的数据框中有1010行数据。现在我想使用 tra…
我试图使用混淆矩阵解决一个相当基础的问题,但我的解决方…
我在尝试基于数据集的部分特征训练一个 Keras 模型…
我正在尝试通过因子化来编码数据框中的类别列表。之后,我…
我有一个如下所示的DataFrame。两个列都包含Me…
我的数据包含一个名为’Married…
我正在尝试提高我的代码性能,我想对数据框的两列进行分词…
我有一个非常大的数据集:7.9 GB的CSV文件。其中…
我正在使用sci-kit learn的标签编码类,将一…
我刚开始学习使用Siraj Raval在YouTube…
我是机器学习的新手。我正在尝试使用pandas/ten…
我在使用交叉验证方法评估一个决策树回归预测模型时遇到了…
我有以下格式的CSV数据: +————…
我想为训练集和测试集的分类字段创建虚拟变量,然后仅在训…
我在尝试对数据集应用Gaussian Naive Ba…