目录
  • pandas中的agg函数
  • pandas详解 聚合运算agg()
    • 1. 创建DataFrame对象
    • 2. 单列聚合
    • 3. 多列聚合
    • 4. 多种聚合运算
    • 5. 多种聚合运算并更改列名
    • 6. 不同的列运用不同的聚合函数
    • 7. 使用自定义的聚合函数
    • 8. 方便的descibe

pandas中的agg函数

python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数

如下所示:

>>> df = pd.read_excel(r"D:/myExcel/1.xlsx") >>> df         A   B   C 0     bob  12  45 1  millor  15  23 2     bob  34  88 3     bob  98  23

(1)获取按A分组后B列的最大值

>>> df.groupby(by='A').agg({'B':'max'})          B A          bob     98 millor  15

(2)获取按A分组后B列的最大值和最小值

>>> df.groupby(by='A').agg({'B':['max','min']})          B            max min A              bob     98  12 millor  15  15

(3)获取按A分组后B列的最大值和最小值以及C列的最大值

>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'})          B       C        max min min A                  bob     98  12  23 millor  15  15  23

(4)默认是以函数名称命名的,可以修改

>>> df.groupby(by='A').agg( b_min=pd.NamedAgg(column='B', aggfunc='min'), b_max=pd.NamedAgg(column='B', aggfunc='max'))         b_min  b_max A                    bob        12     98 millor     15     15

通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中

>>> df.groupby('A').B.agg(['min', 'max'])         min  max A                bob      12   98 millor   15   15 >>> df.groupby('A').B.agg(['min', 'max']).reset_index()         A  min  max 0     bob   12   98 1  millor   15   15

这就是python小工具关于agg函数的介绍,挺有用 的一个函数。

pandas详解 聚合运算agg()

在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便进行聚合操作。

1. 创建DataFrame对象

import pandas as pd df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]}) 

在这里插入图片描述

grouped = df1.groupby(['sex','smoker']) # sex有 F M 二值,smoker有 Y N 二值,故分成四组。 

2. 单列聚合

grouped['age'].agg('mean') 

sex smoker F N 30.0 Y 28.0 M N 40.0 Y 17.5 Name: age, dtype: float64 

3. 多列聚合

grouped.agg('mean') 

在这里插入图片描述

4. 多种聚合运算

grouped['age'].agg(['min','max']) 

在这里插入图片描述

5. 多种聚合运算并更改列名

grouped['age'].agg([('A','mean'),('B','max')]) 

在这里插入图片描述

6. 不同的列运用不同的聚合函数

grouped.agg({'age':['sum','mean'], 'weight':['min','max']}) 

在这里插入图片描述

7. 使用自定义的聚合函数

def Max_cut_Min(group): return group.max()-group.min() grouped.agg(Max_cut_Min) 

在这里插入图片描述

8. 方便的descibe

grouped.describe() 

在这里插入图片描述

以上为个人经验,希望能给大家一个参考,也希望大家多多支持本网站。

您可能感兴趣的文章:

  • pandas数据分组groupby()和统计函数agg()的使用
  • 详谈pandas中agg函数和apply函数的区别
  • python中分组函数groupby和分组运算函数agg的使用
  • Python pandas用法最全整理