第2章 用图表展示数据

2.1 用图表表示定性数据

1、频数分布表

对数据进行分类,列出所有的类别,然后统计每一类别的频数。

频数:频数分布表中落在某一特定类别的数据个数叫做频数。

有两个变量交叉分类的频数分布表称为列联表,也称交叉表

定性数据,除了用频数分布表,还可以使用比例、百分比、比率等统计量进行描述。

比例:一个样本中各类别的频数与全部频数之比,通常用于反映样本的构成或结构。

百分比:将样本乘以100得到的数值称为百分比。

比率:样本(或总体)中各不同类别频数之间的比值。

定性数据的图示:条形图、帕累托特图、饼图、环形图。

帕累托特图:该图时按各类别出现的频数多少排序后绘制的条形图。

2.2 用图表展示定量数据

定性数据的图示方法基本上都适用于定量数据,但定量数据还有一些特定的图示方法。

1、频数分布表

需要先将原始数据按照某种标准分成不同的组别,然后统计出各组别的数据频数即可。

(1)对数据分组

一般数据所分组数K应不少于5且不多于15组.

(2)确定各组的组距

组距=(最大值-最小值)除以组数

2、分组数据看分布:直方图

用矩形的高度和宽度(即面积)来展示频数分布。

3、未分组数据看分布:茎叶图和箱线图、垂线图和误差图

箱线图:

不仅可以用于反映一组数据分布的特征,比如分布是否对称,是否存在离群点,还可以对多组数据的分布特征进行比较。

(1)首先找出一组数据的中位数和两个四分位数,并画出箱子

Q75%-Q25%称为四分位差或四分位距,用IQR表示。用两个四分位数画出箱子,并画出中位数在箱子里的位置。

(2)计算出内围栏和相邻值,并画出须线。

内围栏:是与Q25%和Q75%的距离等于1.5倍四分位差的两个点。

下内围栏:Q25%-1.5*IQR

上内围栏:Q75%+1.5*IQR

一般内围栏不在箱线图中显示,只是作为确定离群点的界限。

相邻值:上下内围栏之间的最大值和最小值,其中Q25%-1.5*IQR范围内的最小值为下相邻值,Q75%+1.5*IQR范围内的最大值称为上相邻值。

用直线将上下相邻值分别与箱子连接,称为须线

(3)找出离群点,并在图中单独标出。

离群点:大于上内围栏或小于下内围栏的数值,也称外部点。

垂线图

可用于展示多个变量或多个样本取值的分布状况。它是将属于同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其分布状况。

误差图

误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定倍数的标准误差)绘制而成的(该图也可以绘制均值的一定置信水平下的置信区间)。

误差图可用于展示多个样本或分类的不同取值的分布情况和离散情况。

3、两个变量之间的关系:散点图

散点图使用二维坐标展示两个变量之间关系的一种图形。

同时比较一个变量与其他变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图。

注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较。

同时比较多个变量两两之间的关系,可以绘制矩阵散点图。

4、比较多个样本的相似性:雷达图和轮廓图

雷达图:从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接称线,即围成一个区域,多个样本围城多个区域,就是雷达图。利用它可以研究多个样本之间的相似程度。

 

轮廓图:平行坐标图或多线图,用横坐标表示各样本(或变量),纵轴表示每个样本的多个变量(或样本)的取值,将不同样本的同一个变量的取值用折线连接,即为轮廓图 。

原文地址:https://www.cnblogs.com/dataAnalysis/p/9392063.html

时间: 2024-10-12 09:04:36

第2章 用图表展示数据的相关文章

Linechart + Datagrid 互动展示数据 (Linechart自定义数据点选择线)

如上图示,在linechart中添加红色Y线,拖动该线的过程中,经过数据点时,会实时更新datagrid中对应的X.Y值数据. 实现要点: 1.linechart添加Y线 继承mx.charts.chartClasses.ChartElement,自定义Y线. package { import flash.display.Graphics; import flash.geom.Point; import flash.text.TextField; import mx.charts.chartCl

knockout+echarts实现图表展示

一.需要学习的知识 knockout, require, director, echarts, jquery.简单的入一下门,网上的资料很多,最直接就是进官网校习. 二.效果展示 三.require的配置 require.config.js中可以配置我们的自定义模块的加载. require.config({ baseUrl: ".", paths: { text: "requirejs/text", jquery: "jquery/jquery-1.11.

用旭日图展示数据的三种方法

什么是旭日图? 旭日图(Sunburst Chart)是一种现代饼图,它超越传统的饼图和环图,能表达清晰的层级和归属关系,以父子层次结构来显示数据构成情况.旭日图中,离远点越近表示级别越高,相邻两层中,是内层包含外层的关系. 在实际项目中使用旭日图,可以更细分溯源分析数据,真正了解数据的具体构成.而且,旭日图不仅数据直观,而且图表用起来特别炫酷,分分钟拉高数据汇报的颜值!很多数据场景都适合用旭日图,比如,在销售汇总报告中,方便看到每个店铺的销售业绩分布(如下图): 做旭日图的三种方法 1. 用E

MySQL性能调优与架构设计——第 14 章 可扩展性设计之数据切分

第 14 章 可扩展性设计之数据切分 前言 通过 MySQL Replication 功能所实现的扩展总是会受到数据库大小的限制,一旦数据库过于庞大,尤其是当写入过于频繁,很难由一台主机支撑的时候,我们还是会面临到扩展瓶颈.这时候,我们就必须许找其他技术手段来解决这个瓶颈,那就是我们这一章所要介绍恶的数据切分技术. 14.1 何谓数据切分 可能很多读者朋友在网上或者杂志上面都已经多次见到关于数据切分的相关文章了,只不过在有些文章中称之为数据的 Sharding.其实不管是称之为数据的 Shard

【软件构造】第三章第三节 抽象数据型(ADT)

第三章第三节 抽象数据型(ADT) 3-1节研究了"数据类型"及其特性 ; 3-2节研究了方法和操作的"规约"及其特性:在本节中,我们将数据和操作复合起来,构成ADT,学习ADT的核心特征,以及如何设计"好的"ADT. Outline ADT及其四种类型 ADT的基本概念 ADT的四种类型 设计一个好的ADT 表示独立性 ADT的特性 不变量 表示泄露 抽象函数AF 表示不变量RI 以注释的形式撰写AF.RI Notes ## ADT及其四种类型

智销功能_图表展示

什么是报表 向上级报告情况的表格.简单的说:报表就是用表格.图表等格式来动态显示数据,可以用公式表示为: “报表 = 多样的格式 + 动态的数据 表格:详细数据 图表: 直观 图表展示 两种技术:flash(actionscript),h5(画布) flash缺点:不安全,容易崩溃 IE的话只能是flash的方式 两个框架:highchart(收费,支持IE),echart(百度,开源免费) 前端使用 1引入相应的js <!-- 引入highcharts的js支持 --> <script

repeater灵活运用、repeater的commmand用法、如何不用repeater展示数据

实体类: using System; using System.Collections.Generic; using System.Linq; using System.Web; /// <summary> /// gouwu 的摘要说明 /// </summary> public class gouwu { public gouwu() { // // TODO: 在此处添加构造函数逻辑 // } public int ids { get; set; } public strin

Repeater控件 ---表格展示数据

简介: Repeater控件是Web 服务器控件中的一个容器控件,它使您可以从页的任何可用数据中创建出自定义列表. Repeater 控件不具备内置的呈现功能,这表示用户必须通过创建模板为 Repeater 控件提供布局.当该页运行时, Repeater 控件依次通过数据源中的记录为每个记录呈现一个项. Repeater控件不具备内置的呈现功能,所以我们得用一些模板来实现他的数据呈现 下表描述了 Repeater 控件支持的模板.  模板属性                           

Windows程序==&gt;&gt;使用ListView控件展示数据

使用ListView控件展示数据 01.ImageList控件 1.了解了解         属性 说明 Images 储存在图像列表中的所有图像 ImageSize 图像列表中图像的大小 Transparent 被视为透明的颜色 ColorDepth 获取图像列表的颜色深度 Images中图像的存放方式与存放在数组中一样,通过Count属性可以获得Images中图像的个数.每个图像都有一个索引值,从0开始,使用Images[索引值],可以定位到一个图像. ImageList控件所包含的图像可以