Pandas分组聚合之使用自定义函数方法transform()、apply()

创建一个dataframe结构

import pandas as pd df = pd.DataFrame( data={ 'name': ['z_s', 'l_s', 'w_w', 'z_l', 'y_s', 'j_j', 'l_b', 'z_f', 'hs_q', 'lbl_k', 'qy_n', 'mg_n'], 'score': [100, 97, 98, 89, 67, 59, 29, 87, 78, 89, 88, 80], 'group': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2], 'cls': ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B'], 'height': [178.0, 180.0, 176.0, 182.0, 189.0, 190.0, 172.5, 175.0, 165.0, 160.0, 158.5, 159.0] }, index=['stu_' + str(i) for i in np.arange(1, 13, 1)] ) print('df:\n', df) def func_add_one(x): return x + 1

transform方法

# 调用自定义函数 ret = df.loc[:, 'score'].transform(func_add_one) print('ret1:\n',ret) # 调用numpy指标 求均值 ret = df.groupby(by=['cls'])['score'].transform(np.mean) print('ret2:\n', ret) # 求 多列的均值 ret = df.groupby(by=['cls'])[['score','height']].transform(np.mean) print('ret3:\n', ret)

由结果可以发现，transform调用统计指标会将统计结果交给第一项，这样可以保证统计结果的行数与原数组相同，使得之后方便将其拼接到原数组中。

如果想将结果进行聚合，可以调用apply方法：

apply方法

# 调用自定义函数 ret = df.loc[:, 'score'].apply(func_add_one) print('ret1:\n',ret) # 调用numpy指标 ret = df.groupby(by=['cls'])[['score','height']].apply(np.mean) print('ret2:\n', ret)

补充

transporm 方法是将DataFrame或Series中的值同时放入指定的函数中执行，再将结果返回。

获取 name的第0个元素

def func_get_firstnameword(x): return x[0] ret = df['name'].transform(func_get_firstnameword) print('ret:\n', ret)

自定义方法拥有很大的可操作性，通过自定义方法可以对数据进行一系列操作，最终得到想要的结果。

str

除此之外，还可以使用str方法，这是一种类似于 dt 的方法（dt的使用）

ret = df['name'].str.split('_', expand=True)[0] print('ret:\n', ret)

str 的作用是将整个 Series当作str对象，对Series中的所有元素同时执行.split('_', expand=True)[0]方法，其中expand=True的作用是指定split()方法是对整个Series进行操作的，而不是只对第一个元素进行操作：

ret = df['name'].str.split('_')[0] print('ret:\n', ret)

总结

到此这篇关于Pandas分组聚合之使用自定义函数方法transform()、apply()的文章就介绍到这了,更多相关Pandas使用自定义函数方法内容请搜索本网站以前的文章或继续浏览下面的相关文章希望大家以后多多支持本网站！

您可能感兴趣的文章:

Python Pandas分组聚合的实现方法
pandas分组聚合详解
python pandas分组聚合详细
python Pandas中数据的合并与分组聚合
Pandas分组聚合之groupby()、agg()方法的使用教程
Python Pandas中的分组聚合操作详解
pandas分组聚合(agg,transform,apply)

Pandas分组聚合之使用自定义函数方法transform()、apply()

创建一个dataframe结构

transform方法

apply方法

补充

str

总结

您可能感兴趣的文章:

2023年最新react面试题总结大全(附详细答案)

python实现自动更换ip的方法

Python中的for循环示例详解

可爱松鼠微信头像图片

Ghost安装器怎么安装Win10-Ghost安装器下安装Win10专业版系统详细图文教程

VUE3使用JSON编辑器的详细图文教程

iphone X如何关闭后台？苹果iphone X关闭软件后台方法介绍

Uint 和 int 的区别解析

Headshot插件如何使用-Headshot插件使用教程

Filecoin(FIL)是什么币？如何挖掘Filecoin

华为手机怎么打开维修模式？华为手机开启维修模式教程

IDEA安装详细步骤（多图预警）

Photoshop时间轴之5个小技巧详细解析

手机怎么修改定位？手机虚拟定位教程

Python常用基础模块之os.path模块详解

有效免费的windows7旗舰版产品密钥激活码 win7永久激活密钥汇总

Oracle数据库导入导出超详细教程

AI怎么抠图- ai抠出某个图形的技巧

网站营销推广终极思路(经典)

Win10系统如何获取文件路径 Windows10系统下获取文件路径的两种方法