df.groupby

编程入门 行业动态 更新时间:2024-10-19 20:37:57

<a href=https://www.elefans.com/category/jswz/34/1733357.html style=df.groupby"/>

df.groupby

df.groupby根据分类变量进行分组,随后分别对各组的连续变量进行统计描述。


import pandas as pddf = pd.DataFrame({'id': [1, 2, 3, 4, 5],'sex': ['M', 'F', 'M', 'F', 'M'],'age': [25, 30, 28, 35, 40],'HUA': [0, 0, 0, 1, 1],'Scr': [1.2, 1.0, 1.5, 1.3, 1.8],'UA': [5.0, 4.5, 6.0, 5.5, 7.0]})# df为:id sex  age  HUA  Scr   UA
0   1   M   25    0  1.2  5.0
1   2   F   30    0  1.0  4.5
2   3   M   28    0  1.5  6.0
3   4   F   35    1  1.3  5.5
4   5   M   40    1  1.8  7.0

分组打印

for name,group in df.groupby('sex'):print('\n',name, '\n',group)# 输出:F id sex  age  HUA  Scr   UA
1   2   F   30    0  1.0  4.5
3   4   F   35    1  1.3  5.5M id sex  age  HUA  Scr   UA
0   1   M   25    0  1.2  5.0
2   3   M   28    0  1.5  6.0
4   5   M   40    1  1.8  7.0


分组计算平均值、样本标准差、样本标准误

"""根据sex进行分组,分别计算UA的平均值、样本标准差、样本标准误"""
"""不改列名"""
df.groupby(['sex'])['UA']\.agg(['mean','std', 'sem']).reset_index()# 输出为:sex  mean       std      sem
0   F   5.0  0.707107  0.50000
1   M   6.0  1.000000  0.57735"""改列名"""
df.groupby(['sex'])['UA']\.agg([('UA的平均值','mean'),('UA的样本标准差','std'), ('UA的样本标准误','sem')]).reset_index()# 输出为:  sex  UA的平均值  UA的样本标准差  UA的样本标准误
0   F     5.0  0.707107   0.50000
1   M     6.0  1.000000   0.57735

更多推荐

df.groupby

本文发布于:2023-11-15 11:03:02,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1598566.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:df   groupby

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!