在Pandas DataFrame中聚合行

我有一个包含以下列的pandas DataFrame:

  1. VisitorID (每个用户的唯一标识 – 基于cookie)
  2. VisitNumber (1 = 第一次访问, 2 = 第二次访问,等等…)
  3. TimeSpentOnVist (访问持续时间,单位为秒)
  4. Channel (访问的来源。例如:Facebook, Google 和 Bing)
  5. Media type (付费或自然流量)

每个访问(1, 2, 3)都会重复出现Visitor ID。我希望考虑最后一次访问的渠道和媒体类型进行聚合,同时将所有访问的时间累加。我的目标是按VisitorID分组,从而避免重复。

在Pandas中执行这种聚合操作的最有效方法是什么?


回答:

IIUC

df.sort_values(['VisitNumber']).groupby('VisitorID').\     agg({'TimeSpentOnVist':'sum','Channel':'last','Media type':'last'})

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注