我在处理来自MIMIC数据集的数据。其中一些数据如下所示(数据类型为pandas.dataframe):
time A B C D01:00 2 NaN 3 402:00 2 NaN 3 403:00 2 NaN 3 401:00 NaN 4 3 4
NaN
表示缺失数据。
显然,第1行和第4行(它们在同一时间记录)应该合并。但我该如何操作呢?
我需要的输出如下:
time A B C D01:00 2 4 3 402:00 2 NaN 3 403:00 2 NaN 3 4
回答:
如果你想对其他行进行求和,这里是代码:
df.groupby(['time']).sum()
或者
df.groupby(['time']).max()
更多信息请见: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html