Pandas – 统计项目

我需要将这些信息传递给图表,我需要比较每个月的数量。

    year    state   month   number  date718 1998    Amazonas    Janeiro 0.0     1998-01-01719 1999    Amazonas    Janeiro 3.0     1999-01-01720 2000    Amazonas    Janeiro 7.0     2000-01-01721 2001    Amazonas    Janeiro 3.0     2001-01-01722 2002    Amazonas    Janeiro 17.0    2002-01-01723 2003    Amazonas    Janeiro 158.0   2003-01-01724 2004    Amazonas    Janeiro 123.0   2004-01-01725 2005    Amazonas    Janeiro 44.0    2005-01-01726 2006    Amazonas    Janeiro 20.0    2006-01-01727 2007    Amazonas    Janeiro 37.0    2007-01-01728 2008    Amazonas    Janeiro 16.0    2008-01-01729 2009    Amazonas    Janeiro 9.0     2009-01-01730 2010    Amazonas    Janeiro 82.0    2010-01-01731 2011    Amazonas    Janeiro 53.0    2011-01-01732 2012    Amazonas    Janeiro 6.0     2012-01-01733 2013    Amazonas    Janeiro 37.0    2013-01-01734 2014    Amazonas    Janeiro 46.0    2014-01-01735 2015    Amazonas    Janeiro 35.0    2015-01-01736 2016    Amazonas    Janeiro 770.0   2016-01-01737 2017    Amazonas    Janeiro 65.0    2017-01-01

我有一个数据集,我需要对所有项目进行求和,例如,一月 = 5000,二月 = 6790

我尝试使用sum()和count(),但没有成功。

dt['month'].sum()

dt['month'].count()

回答:

你需要先使用groupby函数对你的数据框进行分组:

例如:

dt.groupby('month')['number'].sum()

你之前的方法只是对列进行求和,而不考虑它们的值。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注