我试图使用下面的函数替换NaN值,但得到了索引超出范围的错误。这是我的样本数据框。它有以下列(日期、中心名称、商品名称、价格、年份)。我试图根据对应的年份和中心名称列,使用价格的众数来替换价格列中的缺失值。
例如,对于1997年和中心名称为’SHIMLA’,我使用下面的代码来替换价格列的缺失值,并且它是有效的。
data.loc[(data['Year']==1997)&(data['Centre_Name']=='SHIMLA')&(data['Price'].isnull()),'Price']=data.loc[(data['Year']==1997)&(data['Centre_Name']=='SHIMLA'),'Price'].mode()[0]
但是下面的函数不起作用。请帮助我
year_list=list(data['Year'].unique())for each_year in year_list: city_list=list(data[data['Year']==each_year]['Centre_Name'].unique()) for each_city in city_list: data.loc[(data['Year']==each_year)&(data['Centre_Name']==each_city)&(data['Price'].isnull()),'Price']=data.loc[(data['Year']==each_year)&(data['Centre_Name']==each_city),'Price'].mode()[0]
回答:
在第二个脚本中,将data.iloc
替换为data.loc