小提琴图解读 - 统计学

小提琴图现在比较流行,在文章里很常见。

【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。


实例解析

在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。

数据化分析解读:

1.通常汽缸数量少的汽车每加仑汽油可以行驶更多里程数;

2.4缸汽车的油耗分布比较分散,6缸汽车的油耗分布相对集中,8缸汽车的油耗分布很不均匀(中间大两头小);

3.4缸和8缸汽车的油耗都存在比较明显的离散值(上侧的须或下侧的须较长)。

如何绘制【小提琴图】?

#在R软件中安装vioplot包

install.packages("vioplot")

#载入vioplot包

library("vioplot")

#定义需要绘制的变量数据

x1 <- mtcars$mpg[mtcars$cyl==4]

x2 <- mtcars$mpg[mtcars$cyl==6]

x3 <- mtcars$mpg[mtcars$cyl==8]

#绘制小提琴图

vioplot(x1,x2,x3,names=c("4缸", "6缸", "8缸"), col="gold")

title("小提琴图:不同缸数对应每加仑汽油行驶里程数分布")

参考书目:《R语言实战》

参考:数据分析实战之【小提琴图】

时间: 2024-11-20 16:50:18

小提琴图解读 - 统计学的相关文章

七张图解读Java多线程

七张图解读Java多线程 --by:coder-pig,转载请注明出处~ 本节引言: 如题,笔者把Java多线程一些概念性的东西以及一些基础的东西都归纳到这七张图中,其中囊括 基本的多线程概念,创建线程,线程组,线程池,以及自定义简单的线程池,还附有代码, 大家也可以像笔者一样,把这七张图mark后打印出来,偶尔回味回味~ J2SE多线程 Part 1 J2SE多线程 Part 2 J2SE多线程 Part 3 J2SE多线程 Part 4 J2SE多线程 Part 5 J2SE多线程 Part

两张图解读Java异常与断言

两张图解读Java异常与断言                                 --转载请注明出处:coder-pig 本节引言: 前天发布的"七张图解析Java多线程"大家的反响不错,嗯呢,今天再来两张吧, 关于Java异常与断言的,涉及到的东西有: ①什么是异常,为什么会出现异常,异常处理机制模型,常见异常信息总结,检验异常与非检验异常; 异常的捕获:try-catch块,finally块,多重catch块,try-catch块的嵌套; 异常的声明:throws回避异

箱图及其统计学意义

盒形图英文名称为boxplot,中文名称又有如下说法:箱图.箱线图.盒子图.盒形图相对简单,使用方便,相对于另外三种图形有自身独特优点. 例:图的左边一个是根据地区1 高三男生的身高数据所绘的盒形图:其右边的图代表另一个地区(地区2 )的高三学生的身高. 盒图(boxplot)对于显示数据的离散的分布情况效果不错 盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的.它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值

Web Page Diagnostics网页细分图解读

Web Page Diagnostics (以下简称WPD),这是LR Analysis中非常重要的一块,搞清楚这部分的内容会让你少走很多弯路,很多环境问题都可以通过它来定位,比如客户端,网络.通过它可以你可以比较好的来定位是环境的问题还是应用本身的问题,当然更重要的是Web页面本身的问题. Web Page Diagnostics:页面诊断图,也叫页面分解总图 “页面分解”显示某一具体事务在测试过程的响应情况,进而分析相关的事务运行是否正常. 此视图下面的文件结构大体上与scripts中act

Linux 系统性能分析工具图解读

最近看了 Brendan Gregg 大神著名的 Linux Performance Observability Tools,这么好的资料不好好学习一下实在是浪费了,又找到了大神的ppt 和 演讲(需爬墙),于是把相关的命令和概念连预习,学习,复习走了一遍. 首先学习的是大神提出的 Basic Tool 有如下几个: uptime top (htop) mpstat iostat vmstat free ping nicstat dstat uptime uptime 比较重要的能显示当前系统的

ADO.NET图解读

ADO.NET图形介绍    

开源项目spring-shiro-training思维导图

写在前面 终于完成了一个开源项目的思维导图解读.选spring-shiro-training这个项目解读是因为它开源,然后涉及到了很多我们常用的技术,如缓存,权限,任务调度,ssm框架,Druid监控,mybatis-plus,代码生成器等.同时也考虑到了安全方面,做了防止crsf攻击方面控制.作为一个简单易用的权限系统,它也足够我们学习了. 当然,可能解读不会很全,也可能有些写得不对.有些是基于个人的理解,一些网上参考的资料.如果想要理解一个项目单单看别人的解读是不够的,需要你去克隆下来在你的

PP图和QQ图

 一. QQ图 分位数图示法(Quantile Quantile Plot,简称 Q-Q 图) 统计学里Q-Q图(Q代表分位数)是一个概率图,用图形的方式比较两个概率分布,把他们的两个分位数放在一起比较.首先选好分位数间隔.图上的点(x,y)反映出其中一个第二个分布(y坐标)的分位数和与之对应的第一分布(x坐标)的相同分位数.因此,这条线是一条以分位数间隔为参数的曲线.如果两个分布相似,则该Q-Q图趋近于落在y=x线上.如果两分布线性相关,则点在Q-Q图上趋近于落在一条直线上,但不一定在y=x线

可视化库-Matplotlib-盒图(第四天)

盒图由五个数值点组成,最小观测值,下四分位数,中位数,上四分位数,最大观测值 IQR = Q3 - Q1  Q3表示上四分位数, Q1表示下四分位数,IQR表示盒图的长度 最小观测值 min =Q1 - 1.5*IQR 最大观测值 max=Q3 + 1.5*IQR  , 大于最大值或者小于最小值就是离群点 1. 画出一个盒图 plt.boxplot(tang_array, notch=False, sym='o', vert=True)  #  tang_array表示输入的列表, notch表