箱型图(box plot)是一种用于展示一组数据分散情况的图形方式。箱型图能够直观地反映数据的中位数、四分位数、最小值、最大值以及异常值等统计量。
在Matplotlib中,使用boxplot()函数可以绘制箱型图,其参数含义如下:
- x:数据集,可以是numpy数组,也可以是pandas序列;
 - notch:是否绘制缺口形式的箱型图,默认为False;
 - sym:指定异常值的形状,默认为‘+’;
 - vert:是否绘制垂直箱型图,默认为True;
 - whis:指定须的长度,默认为1.5,即1.5倍的箱体高度;
 - widths:指定箱体的宽度,默认为0.5;
 - labels:指定箱体的标签,用于刻画不同的数据集;
 - meanline:是否绘制平均数线,默认为False;
 - showmeans:是否绘制均值符号,默认为False;
 - showcaps:是否绘制限制线,默认为True;
 - showbox:是否绘制箱体,默认为True;
 - showfliers:是否绘制异常值,默认为True。
 
下面是使用Matplotlib绘制箱型图的示例代码:
import numpy as np
import matplotlib.pyplot as plt
# 生成一组随机数
np.random.seed(123)
data1 = np.random.normal(0, 1, 200)
# 绘制箱型图
plt.boxplot([data1], 
            notch=True, 
            vert=False, 
            sym='+', 
            whis=1.5, 
            widths=0.7, 
            labels=['data1'], 
            meanline=True, 
            showmeans=True, 
            showcaps=True, 
            showbox=True, 
            showfliers=True)
# 添加标题和标签
plt.title('Box plot of data1')
plt.xlabel('Value')
plt.ylabel('Data')
plt.show()
运行以上代码,即可绘制出如图所示的箱型图:
可以看到,Matplotlib的箱型图既可以展现单个数据集的信息,也可以展示多个数据集进行比较。此外,还可以使用subplots()函数将多个箱型图绘制在同一张图中,以便更加直观地对比数据。
本文链接:https://my.lmcjl.com/post/20133.html
展开阅读全文
                                                
                    
4 评论