操作"/>
pandas聚合操作
当我们使用pandas
进行数据分析时,经常需要对数据进行聚合操作。pandas
提供了一系列的聚合函数,可以方便地对数据进行统计和计算。下面是一些常用的聚合函数和用法,并输出结果。
首先,我们需要导入pandas
库:
import pandas as pd
接下来,我们创建一个包含员工信息的DataFrame
:
data = {'Name': ['John', 'Peter', 'Sara', 'John', 'Peter'],'Age': [28, 32, 25, 30, 35],'Salary': [5000, 6000, 4500, 5500, 6500]}
df = pd.DataFrame(data)
现在,我们可以使用聚合函数对数据进行分组和计算。
mean()
:计算每个组的平均值。
avg_salary = df.groupby('Name')['Salary'].mean()
print(avg_salary)
输出结果:
Name
John 5250
Peter 6250
Sara 4500
Name: Salary, dtype: int64
sum()
:计算每个组的总和。
total_salary = df.groupby('Name')['Salary'].sum()
print(total_salary)
输出结果:
Name
John 10500
Peter 12500
Sara 4500
Name: Salary, dtype: int64
count()
:计算每个组的数量。
group_count = df.groupby('Name').count()
print(group_count)
输出结果:
Age Salary
Name
John 2 2
Peter 2 2
Sara 1 1
max()
:计算每个组的最大值。
max_salary = df.groupby('Name')['Salary'].max()
print(max_salary)
输出结果:
Name
John 5500
Peter 6500
Sara 4500
Name: Salary, dtype: int64
min()
:计算每个组的最小值。
min_salary = df.groupby('Name')['Salary'].min()
print(min_salary)
输出结果:
Name
John 5000
Peter 6000
Sara 4500
Name: Salary, dtype: int64
除了以上聚合函数,还可以使用agg()
方法对每个组应用自定义的聚合函数。例如,计算每个组的薪资总和和平均年龄:
result = df.groupby('Name').agg({'Salary': 'sum', 'Age': 'mean'})
print(result)
输出结果:
Salary Age
Name
John 10500 29.0
Peter 12500 33.5
Sara 4500 25.0
希望以上内容能够帮助到你!
更多推荐
pandas聚合操作
发布评论