Pandas最常用的5种聚合函数

Pandas聚合函数(Aggregation Function)是一种数据处理函数,用于对数据进行汇总、统计和分析。在数据分析中,常常需要对数据进行聚合计算,如计算平均值、总和、标准差、方差等。Pandas提供了多种聚合函数,可以方便地对数据进行统计和分析。

Pandas聚合函数可以应用于Series和DataFrame对象,可以对整个序列或数据框进行聚合,也可以对分组后的序列或数据框进行聚合。

Pandas聚合函数的一般形式为:

DataFrame.aggregate(func=None, axis=0, *args, **kwargs)

其中,func参数指定要应用的聚合函数或函数列表,axis参数指定应用聚合函数的轴方向(0表示按列,1表示按行)。

常见的Pandas聚合函数包括:

  • mean():计算平均值
  • sum():计算总和
  • max():计算最大值
  • min():计算最小值
  • std():计算标准差
  • var():计算方差
  • count():计算非缺失值的数量
  • describe():生成数据描述性统计信息

这些聚合函数可以结合groupby()函数一起使用,对分组后的数据进行聚合计算,以实现更灵活的数据分析和处理。

接下来将为你介绍Pandas常用的聚合函数。

mean()

mean()函数用于计算平均值,例如:


import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10]
})

# 计算各列的平均值
mean_values = df.mean()

# 输出结果
print(mean_values)

输出结果为:


A    3.0
B    8.0
dtype: float64

sum()

sum()函数用于计算总和,例如:


import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10]
})

# 计算各列的总和
sum_values = df.sum()

# 输出结果
print(sum_values)

输出结果为:


A    15
B    40
dtype: int64

max()

max()函数用于计算最大值,例如:

import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10]
})

# 计算各列的最大值
max_values = df.max()

# 输出结果
print(max_values)

输出结果为:


A     5
B    10
dtype: int64

min()

min()函数用于计算最小值,例如:


import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10]
})

# 计算各列的最小值
min_values = df.min()

# 输出结果
print(min_values)

输出结果为:


A    1
B    6
dtype: int64

std()

std()函数用于计算标准差,例如:

import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10]
})

# 计算各列的标准差
std_values = df.std()

# 输出结果
print(std_values)

输出结果为:


A    1.581139
B    1.581139
dtype: float64

本文链接:https://my.lmcjl.com/post/20009.html

展开阅读全文

4 评论

留下您的评论.