例如,我有以下两个数据集:
df1 =
df2 =
df2 的值已经在 df1 中(行 1、4 和 5)。现在我需要创建另一个数据集 df3,其中仅包含第 2 行和第 3 行的数据。
df3 =
我研究了很多关于拆分数据集的内容,但作为一个新学习者,我找不到确切的解决方案。如果我说错了什么,请随时纠正我。如果有人能帮助我解决这个问题,我将非常感激。谢谢。
回答:
要获取数据框的差异,请使用 drop_duplicates 方法如下:
pd.concat([df1,df2]).drop_duplicates(keep=False)