pandas聚合操作

编程入门 行业动态 更新时间:2024-10-17 11:30:47

pandas聚合<a href=https://www.elefans.com/category/jswz/34/1770947.html style=操作"/>

pandas聚合操作

当我们使用pandas进行数据分析时,经常需要对数据进行聚合操作。pandas提供了一系列的聚合函数,可以方便地对数据进行统计和计算。下面是一些常用的聚合函数和用法,并输出结果。

首先,我们需要导入pandas库:

import pandas as pd

接下来,我们创建一个包含员工信息的DataFrame

data = {'Name': ['John', 'Peter', 'Sara', 'John', 'Peter'],'Age': [28, 32, 25, 30, 35],'Salary': [5000, 6000, 4500, 5500, 6500]}
df = pd.DataFrame(data)

现在,我们可以使用聚合函数对数据进行分组和计算。

  1. mean():计算每个组的平均值。
avg_salary = df.groupby('Name')['Salary'].mean()
print(avg_salary)

输出结果:

Name
John     5250
Peter    6250
Sara     4500
Name: Salary, dtype: int64
  1. sum():计算每个组的总和。
total_salary = df.groupby('Name')['Salary'].sum()
print(total_salary)

输出结果:

Name
John     10500
Peter    12500
Sara      4500
Name: Salary, dtype: int64
  1. count():计算每个组的数量。
group_count = df.groupby('Name').count()
print(group_count)

输出结果:

       Age  Salary
Name              
John     2       2
Peter    2       2
Sara     1       1
  1. max():计算每个组的最大值。
max_salary = df.groupby('Name')['Salary'].max()
print(max_salary)

输出结果:

Name
John     5500
Peter    6500
Sara     4500
Name: Salary, dtype: int64
  1. min():计算每个组的最小值。
min_salary = df.groupby('Name')['Salary'].min()
print(min_salary)

输出结果:

Name
John     5000
Peter    6000
Sara     4500
Name: Salary, dtype: int64

除了以上聚合函数,还可以使用agg()方法对每个组应用自定义的聚合函数。例如,计算每个组的薪资总和和平均年龄:

result = df.groupby('Name').agg({'Salary': 'sum', 'Age': 'mean'})
print(result)

输出结果:

       Salary   Age
Name               
John     10500  29.0
Peter    12500  33.5
Sara      4500  25.0

希望以上内容能够帮助到你!

更多推荐

pandas聚合操作

本文发布于:2023-12-06 19:09:04,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1668517.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:操作   pandas

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!