提琴图(Violin plot)是一种常见的数据可视化方式,通常用于展示一个或多个连续型变量的分布情况和密度估计。Matplotlib是一个Python绘图库,提供了丰富的绘图工具和函数,也支持绘制提琴图。下面是Matplotlib绘制提琴图的使用方法和代码示例:
导入Matplotlib库和相关模块
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
其中,plt是Matplotlib库中的一个模块,用于绘制各种类型的图表;numpy是Python科学计算库,用于处理数值数据;seaborn是基于Matplotlib的高级数据可视化库,提供了更美观的绘图样式和更丰富的数据分析工具。
准备数据
我们可以使用Numpy库生成一些随机数据来演示提琴图的绘制。例如,生成5个正态分布的随机样本,每个样本有100个数据点:
data = [np.random.normal(size=100) for i in range(5)]
其中,np.random.normal()函数用于生成正态分布的随机数。
绘制提琴图
可以使用violinplot()函数绘制提琴图。这个函数的参数包括:
- data:要绘制的数据;
- showmeans:是否显示均值(默认为False);
- showmedians:是否显示中位数(默认为True);
- showextrema:是否显示最大值和最小值(默认为True);
- bw_method:核函数的带宽估计方法(默认为'scott');
- widths:提琴图的宽度;
- vert:提琴图的方向(水平或垂直);
- positions:提琴图的位置;
- ax:绘图的坐标轴。
-
下面是一个简单的绘制提琴图的代码示例:
# 绘制提琴图
sns.violinplot(data=data,
showmeans=True,
showmedians=True,
showextrema=True)
plt.show()
这个代码将会绘制一个包含5个提琴图的图表,每个提琴图表示一个随机样本的分布情况。其中,横轴表示数值范围,纵轴表示数据点的密度。在提琴图的两端还会显示最大值和最小值,中间的黑点表示中位数,白点表示均值。
显示结果如下图所示:
完整代码如下:
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
data = [np.random.normal(size=100) for i in range(5)]
# 绘制提琴图
sns.violinplot(data=data,
showmeans=True,
showmedians=True,
showextrema=True)
plt.show()
本文链接:https://my.lmcjl.com/post/20130.html
展开阅读全文
4 评论