需要将数据框的列值转换为独立的列，并使用pandas填充每个单元格的计数值

我有一个数据框

data_frame = pd.DataFrame({'id':[1,2,3,4,5,6],'name':["A","B","C","A","B","A"], 'date':["15/03/2019","16/03/2019","15/03/2019","16/03/2019","16/03/2019","16/03/2019"], "conducted":[1,1,1,1,1,1],"present":[1,1,1,1,1,0]})`

结果

我需要将数据框转换为

到目前为止，我尝试了以下方法，

查找日期和名称的唯一值

date_unique_list = data_frame.date.unique()name_unique_list = data_frame.name.unique()

结果 :

array(['15/03/2019', '16/03/2019'], dtype=object)array(['A', 'B', 'C'], dtype=object)

创建带有日期列和名称行标题的数据框。

data_frame_dummies = pd.get_dummies(date_unique_list,prefix="",prefix_sep="")data_frame_dummies = pd.DataFrame(data_frame_dummies, columns = date_unique_list, index=name_unique_list)

结果 :

    15/03/2019  16/03/2019A   NaN           NaNB   NaN           NaNC   NaN           NaN

按日期更新每个学生的出勤计数。

-> 我似乎找不到这样做的方法。

回答：

我猜表格内的值是conducted的sum()。

您可以使用pandas的pivot_table()，并用零填充缺失值fillna(0.0)，例如：

编辑

包含present值的计数：

table = pd.pivot_table(data_frame, values=['present'], index=['name'], columns=['date'], aggfunc='count').fillna(0.0)

学技术

需要将数据框的列值转换为独立的列，并使用pandas填充每个单元格的计数值

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复