Home IT技术 如何复制数据集中的样本? 如何复制数据集中的样本? IT技术 xiaolong · 2025年4月12日 · 0 Comment 我使用代码检查了我的数据集’df’,发现’Has_Arrears’列存在严重不平衡。我希望通过复制Has_Arrears = 1的样本来扩展我的目标数据集,每个Has_Arrears = 1的观测值复制35次。我该如何实现这一点?谢谢 如果我想使用分层抽样,我应该如何编写代码? 回答: 如果我理解正确的话,这可能是你想要的: new = df['Has_Arrears'] == 1a = df[new]df = df.append([a]*35, ignore_index=True) 相关文章: 有没有可以在词级和句子级别上都能使用的分类器? 使用PyLucene作为K-NN分类器 如何正确地对文本分类器进行tfidf变换和“拟合”值? 为什么我的关联模型在数据集中发现了不应该存在的子群体? 使用Orange提取关联规则时遇到的问题? 如何使用NumPy读取Python中的二进制文件? 加权标签聚类 K means在scikit learn中的内核崩溃问题 – 由于计算时间过长 PCA适用于分类特征吗? 我们能否从Python程序中运行Orange data-mining downsampling machine-learning python