我有以下数据集:
我被要求: 定义一个指标和相应的函数,以确定在过去一年中,哪些用户在积极客户互动方面增长最快。根据定义“增长最快的用户”的指标,报告前10名用户。
到目前为止,我已经创建了一个相关矩阵:
user_id content_count total_engagement date_Deltauser_id 1.000000 -0.056683 0.027150 -0.000014content_count -0.056683 1.000000 0.215149 -0.007097total_engagement 0.027150 0.215149 1.000000 0.002337date_Delta -0.000014 -0.007097 0.002337 1.000000
如您所见,content_count和total_engagement具有最佳的相关性成分。
我接下来考虑做的是为每个user_id和他们的total_engagement创建一个图表,以查看整体线性情况,这将提供一些关于哪些用户的total_engagement有强烈增长的指示。
尽管如此,我对如何定义提出的问题的指标总体上有些困惑。我想发布这个帖子,看看是否有人能提出一些想法。
回答:
您必须有一个新的字段,用于显示user_id的每日参与度。类似于total_management/date_delta,这将给出实际的每日参与度。