pandas聚合操作

编程入门行业动态更新时间:2024-10-17 11:30:47

pandas聚合<a href=https://www.elefans.com/category/jswz/34/1770947.html style= 操作"/>

pandas聚合操作

当我们使用pandas进行数据分析时，经常需要对数据进行聚合操作。pandas提供了一系列的聚合函数，可以方便地对数据进行统计和计算。下面是一些常用的聚合函数和用法，并输出结果。

首先，我们需要导入pandas库：

import pandas as pd

接下来，我们创建一个包含员工信息的DataFrame：

data = {'Name': ['John', 'Peter', 'Sara', 'John', 'Peter'],'Age': [28, 32, 25, 30, 35],'Salary': [5000, 6000, 4500, 5500, 6500]}
df = pd.DataFrame(data)

现在，我们可以使用聚合函数对数据进行分组和计算。

mean()：计算每个组的平均值。

avg_salary = df.groupby('Name')['Salary'].mean()
print(avg_salary)

输出结果：

Name
John     5250
Peter    6250
Sara     4500
Name: Salary, dtype: int64

sum()：计算每个组的总和。

total_salary = df.groupby('Name')['Salary'].sum()
print(total_salary)

输出结果：

Name
John     10500
Peter    12500
Sara      4500
Name: Salary, dtype: int64

count()：计算每个组的数量。

group_count = df.groupby('Name').count()
print(group_count)

输出结果：

       Age  Salary
Name              
John     2       2
Peter    2       2
Sara     1       1

max()：计算每个组的最大值。

max_salary = df.groupby('Name')['Salary'].max()
print(max_salary)

输出结果：

Name
John     5500
Peter    6500
Sara     4500
Name: Salary, dtype: int64

min()：计算每个组的最小值。

min_salary = df.groupby('Name')['Salary'].min()
print(min_salary)

输出结果：

Name
John     5000
Peter    6000
Sara     4500
Name: Salary, dtype: int64

除了以上聚合函数，还可以使用agg()方法对每个组应用自定义的聚合函数。例如，计算每个组的薪资总和和平均年龄：

result = df.groupby('Name').agg({'Salary': 'sum', 'Age': 'mean'})
print(result)

输出结果：

       Salary   Age
Name               
John     10500  29.0
Peter    12500  33.5
Sara      4500  25.0

希望以上内容能够帮助到你！

更多推荐

pandas聚合操作

本文发布于:2023-12-06 19:09:04，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1668517.html

操作 pandas

上一篇：【yum包管理器常见用法】
下一篇： IT运维管理系统在国有大型企业网络中的应用和可以解决的问题

发布评论取消回复

评论列表（有 0 条评论）

pandas聚合操作

pandas聚合操作

发布评论取消回复

最近发表

热门文章

标签列表