后台-插件-广告管理-内容页广告位一(手机)

您现在的位置是:首页 > 编程语言 > pythonpython

Python数据分析入门(二十一):数据可视化之绘制箱线图

2021-04-18 18:37:01python人已围观

简介箱线图
箱线图(Box-plot)又称为盒须图、盒式图或箱型图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,它主要用于反映原始数据分

箱线图

箱线图(Box-plot)又称为盒须图、盒式图或箱型图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的上限值、下限值、中位数(Q2)和下四分位数(Q1)以及上四分位数(Q3);然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。

中位数:把数据按照从小到大的顺序排序,然后最中间的那个值为中位数,如果数据的个数为偶数,那么就是最中间的两个数的平均数为中位数。 上下四分位数:同样把数据排好序后,把数据等分为4份。出现在25%位置的叫做下四分位数,出现在75%位置上的数叫做上四分位数。但是四分位数位置的确定方法不是固定的,有几种算法,每种方法得到的结果会有一定差异,但差异不会很大。

上下限的计算规则是: IQR=Q3-Q1 上限=Q3+1.5IQR 下限=Q1-1.5IQR

使用matplotlib绘制箱线图:

matplotlib中有plt.boxplot来绘制箱线图,这个方法的相关参数如下:

  1. x:需要绘制的箱线图的数据。
  2. notch:是否展示置信区间,默认是False。如果设置为True,那么就会在盒子上展示一个缺口。
  3. sym:代表异常点的符号表示,默认是小圆点。
  4. vert:是否是垂直的,默认是True,如果设置为False那么将水平方向展示。
  5. whis:上下限的系数,默认是1.5,也就是上限是Q3+1.5IQR,可以改成其他的。也可以为一个序列,如果是序列,那么序列中的两个值分别代表的就是下限和上限的值,而不是再需要通过IQR来计算。
  6. positions:设置每个盒子的位置。
  7. widths:设置每个盒子的宽度。
  8. labels:每个盒子的label
  9. meanlineshowmeans:如果这两个都为True,那么将会绘制平均值的的线条。

示例代码如下:

data = np.random.rand(100)*100
# 添加两个异常值
data = np.append(data,np.array([-100,100]))
plt.boxplot(data,meanline=True,showmeans=True)

效果图如下:

箱线图的应用场景:

    1. 直观明了地识别数据中的异常值。
    2. 利用箱线图判断数据的偏态。
    3. 利用箱线图比较几批数据的形状。
    4. 箱线图适合比较多组数据,如果知识要看一组数据的分布情况,建议使用直方图。

文章来源:查看

Tags:线图   数据   可视化   二十一   绘制

很赞哦! ()

后台-插件-广告管理-内容页广告位二(手机)

相关文章

后台-插件-广告管理-内容页广告位三(手机)
后台-插件-广告管理-内容页广告位四(手机)

文章评论

留言与评论(共有 0 条评论)
   
验证码:

本栏推荐

站点信息

  • 文章统计13614篇文章
  • 浏览统计468次浏览
  • 评论统计1个评论
  • 标签管理标签云
  • 统计数据:统计代码
  • 微信公众号:扫描二维码,关注我们