Pandas最常用的4种窗口函数

Pandas窗口函数(Window Function)是一种基于滑动窗口的函数,用于在序列或数据框上执行基于窗口的操作,如滚动平均、滚动求和、滚动方差等。

与一般的聚合函数不同,窗口函数可以计算滑动窗口内的值,并生成与原序列或数据框相同长度的序列或数据框。

接下来将为你介绍Pandas中常用的4种窗口函数。

滚动平均值

滚动平均值是指在滑动窗口内计算平均值。可以使用rolling()函数结合mean()函数计算滚动平均值。例如:

import pandas as pd
import numpy as np

# 创建一个Series对象
data = pd.Series(np.random.randn(1000))

# 计算滚动平均值
rolling_mean = data.rolling(window=50).mean()

# 输出结果
print(rolling_mean)

滚动标准差

滚动标准差是指在滑动窗口内计算标准差。可以使用rolling()函数结合std()函数计算滚动标准差。例如:


import pandas as pd
import numpy as np

# 创建一个Series对象
data = pd.Series(np.random.randn(1000))

# 计算滚动标准差
rolling_std = data.rolling(window=50).std()

# 输出结果
print(rolling_std)

滚动最大值和最小值

可以使用rolling()函数结合max()函数和min()函数计算滚动最大值和最小值。例如:


import pandas as pd
import numpy as np

# 创建一个Series对象
data = pd.Series(np.random.randn(1000))

# 计算滚动最大值和最小值
rolling_max = data.rolling(window=50).max()
rolling_min = data.rolling(window=50).min()

# 输出结果
print(rolling_max)
print(rolling_min)

滚动相关系数

可以使用rolling()函数结合corr()函数计算滚动相关系数。例如:


import pandas as pd
import numpy as np

# 创建两个Series对象
data1 = pd.Series(np.random.randn(1000))
data2 = pd.Series(np.random.randn(1000))

# 计算滚动相关系数
rolling_corr = data1.rolling(window=50).corr(data2.rolling(window=50))

# 输出结果
print(rolling_corr)

这里计算了两个随机序列data1和data2的滚动相关系数。

以上是一些常用的窗口函数及其示例,还有很多其他的窗口函数可以用于数据分析和处理。

本文链接:https://my.lmcjl.com/post/20006.html

展开阅读全文

4 评论

留下您的评论.