统计描述指标的选择与应用

一、统计描述指标的选择与应用

计量资料：集中趋势与离散趋势
（1）正态分布：均数?标准差

（2）非正态分布（偏态、不规则分布）：中位数（M），四分位数（P25、P75）

无序分类资料：率、构成比

二、集中趋势与离散趋势
集中趋势：用平均数（指标体系）反映一组观察值的中心位置或平均水平。
　　（1）算数均数 — 正态分布/单峰对称分布资料
　　（2）中位数 — 偏态分布、不规则分布、开口资料
　　（3）几何均数 — 抗体滴度等各变量之间成倍数关系/对数正态分布资料

离散趋势：
　　（1）标准差、方差— 正态分布/单峰对称分布资料
　　（2）四分位数间距— 偏态分布、不规则分布、开口资料
　　（3）极差（全距）：最大值与最小值之差
　　（4）变异系数 — 度量衡单位不同、均数相差悬殊的几组资料间的比较

三、相对离散度
对于单位不同的变量，不能直接比较标准差，如身高的标准差与体重的标准差没有可比性，此时用
变异系数 (coefficient of variation, CV)来衡量。
变异系数 (coefficient of variation, CV)指标准差与均数之比，常用百分位数表示。

CV=标准差/均数*100%

另外一个应用场景：均数相差悬殊的几组资料间的比较。

原文地址：https://www.cnblogs.com/quietwalk/p/8259720.html

时间： 2024-10-20 17:34:03

统计描述指标的选择与应用的相关文章

数据资料的统计描述

一.集中趋势 1.算术平均数 1.1 简单的算术平均数 1.2 加权的算术平均数均值的计算要根据分组的资料进行,要涉及到频数的考虑,即所谓的加权问题. 2.几何平均数 2.1 简单几何平均数数据资料的统计描述

dplyr 数据操作统计描述（summarise）

在R中,summary()是一个基础包中的重要统计描述函数,同样的在dplyr中summarise()函数也可以对数据进行统计描述. 不同的是summarise()更加的灵活多变,下面来看下summarise这个函数 summarise(.data, ...) 其灵活性和其他dplyr函数一样,主要在于条件的使用上下面看些具体的例子 library(dplyr) x<-data.frame(id=1:6, name=c("wang","zhang",&quo

R vs Python：构建data.frame、读取csv与统计描述

一.Python 数据框就是典型的关系型数据库的数据存储形式,每一行是一条记录,每一列是一个属性,最终构成表格的形式,这是数据科学家必须熟悉的最典型的数据结构. 1.构建数据框 import pandas as pd data = {'year':[2010, 2011, 2012, 2010, 2011, 2012, 2010, 2011, 2012], 'team':['FCBarcelona', 'FCBarcelona', 'FCBarcelona', 'RMadrid', 'RMadr

3.2.4. 计量资料的统计描述

1.1.1.1. 集中趋势的描述(central tendency) 描述集中趋势的主要统计指标有算术平均数.几何平均数.中位数,这些指标也称为位置度量指标(measures of location) 1.1.1.1.1. 算术平均数(arithmetic mean) 算术平均数适用于频数分布对称数据.在有离群值的情况下,或频数分布不对称时,不适合选用算术均数描述数据的平均水位. (1)一般地,总体均值用μ表示,样本均数用符号表示,观察n个个体,X表示观察值,则均数的计算公式为: (2)当样本

3.2.4. 计数资料的统计描述

1.1.1.1. 常用的相对数指标 1.1.1.1.1. 比(ratio) 比表示两个相关指标的值之商.这描述了一个指标的值是另一个指标值的几倍或几分之几.其计算公式为: 1.1.1.1.2. 比例(proportion) 比例表示某事物内部各组成部分的观察单位数与所有组成部分的总观察单位数之比. (1)表示分布结构的比例, (2)表示某现象发生强度的比例, 式中:K是比例基数,它可以取值100%.1000‰.10000/万.100000/10万等. 1.1.1.1.3. 率(frequency

WAP流量统计与传统WEB流量统计的区别与选择

时下,对于很多中小FreeWAP站长而言,可以选择的第三方流量统计站非常有限,尤其是专业面向WAP的站点就更少了.现在从网上搜索可以找到很多家能提供WAP流量统计的站并不多, 现在很多WAP流量统计站都是从PC(WEB)流量统计站简单修改过来的,结果很多统计功能根本实现不了,比如来源页统计,用户访问页记录,在线用户统计等等:也由于WAP1.2(1.1)并不支持Javascript,导致这些统计站不但统计数据不完整,而且统计效率低下,经常出现反应慢以及不稳定的问题. 那么怎么样的统计系统才算

Python数据分析之pandas学习

Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利用pandas的DataFrames进行统计分析5.利用pandas实现SQL操作6.利用pandas进行缺失值的处理7.利用pandas实现Excel的数据透视表功能8.多层索引的使用一.数据结构介绍在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame.Ser

Pandas常用操作

参考天池AI github博客传送门 csdn博客传送门安装pandas 通过命令提示符 pip install pandas 或者通过第三方发放版 Anaconda 进行鼠标操作安装 Numpy学习教程传送门 https://blog.csdn.net/zhanghao3389/article/details/82791862 Series 的创建 import numpy as np, pandas as pd # 通过一维数组创建序列 arr1 = np.arange(10) # 创建一

排序——选择排序(java描述)

百度百科的描述如下:选择排序(Selection sort)是一种简单直观的排序算法.它的工作原理是每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾.以此类推,直到全部待排序的数据元素排完. 选择排序是不稳定的排序方法. public class Sorting { public static void main(String[] args) { int[] a = { 6, 2, 5, 3,

猜你喜欢

Linux发邮件之mail

1.安装 (需要sendmail或postfix服务) sendmail # yum install sendmail # systemctl start sendmail.serv ...

javascript 内部函数的定义及调用

内部函数,定义在另一个函数中的函数 function outer() { console.log("out"); function inner () { console.log(& ...

project03日志分析工具AWStats

++++++++++++++++++++ 日志分析工具AWStats ++++++++++++++++++++ http://www.oschina.net/project http://www.os ...

对于前段时间编程体会

1.程序整体结构上的改善在最开始编写程序,我还没有接触到框架,并没有框架的概念.编写程序的目标也只是纯粹的能够实现要求,在纠正.拓展很多方面,程序是难以去进行改进的,因为很乱,往往无从下手.所以说, ...

Java中Map值得注意的坑！

Map<Long, String> map = new HashMap<Long, String>(); map.put(1L, "v1"); map.pu ...

Linux如何查看进程、杀死进程、启动进程等常用命令

1.查进程 ps命令查找与进程相关的PID号: ps a 显示现行终端机下的所有程序,包括其他用户的程序. ps -A 显示所有程序. ps c 列出程序时,显示每个程序真正的 ...

hdfs源码分析之configuration

如何有效管理应用的大量配置目前现在应用的大量配置信息全部保存在xml文档中,方便修改和读取,Hadoop同样采取这样的方式. 那么让我们来看看Hadoop是如何管理自己的配置信息的. Hadoop中 ...

给定一个英文原文,统计文件里面一共有多少个不同的英文单词

wordsCounter.cpp // wordsCounter.cpp : Defines the entry point for the console application.// #inclu ...

C++预处理命令

预处理语句是由一系列和预处理相关的命令符组成的.预处理语句以#作为起始标记,其后紧跟预处理命令关键字,之后是空格,空格之后是预处理命令的内容.C++提供多种预处理功能,如宏定义,文件包括,条件编译等. ...

Pydev配合eclipse开发Python

<1>windows中下载准备(Linux中差别不大). eclipse下载:http://www.eclipse.org/downloads/ jdk下载:http://www.java ...

给定n m k n和m为一个矩阵的行和列,都从1开始,矩阵的每个元素的值即为 i*j(行*列),求里面第k个数还想找什么规律,发现虽然矩阵里面很有规律,但是n 和m在不断变化根本不好找其实元素从 ...

ubuntu14.04中设置如何设置网络

在搭建lamp 环境时,虚拟机没有见网络不能更新包和下载软件包进行编译安装.所以,需要设置虚拟机的网络可以上网才行. 1.在安装ubtuntu时,设置的网络连接方式为 Network Adapter ...

JS判断浏览器版本

<script type="text/javascript"> //判断访问终端 var browser={ versions:function(){ var u = ...

Linux-配置虚拟IP实例

在日常linux管理工作中,需要为应用配置单独的IP地址,以达到主机与应用的分离,在应用切换与迁移过程中可以做到动态切换,特别是在使用HA的时候,这种方案可以保证主机与应用的隔离,对日常的运维有很大的 ...

编译是报error: 'EVNET_COME_TO_FOREGROUND' was not declared in this scope

Compile++ thumb : game_shared <= main.cpp jni/hellocpp/main.cpp: In function 'void Java_org_coco ...

JMeter创建FTP测试服务器上传下载性能

在工作中,有时候我们会对服务器的上传下载性能进行测试,于是就整理了工作中测试ftp上传下载的是实战总结. 测试环境: jmeter 我使用的是apache-jmeter-2.13 测试服务器是阿里云上 ...

关于项目的可行性

可行性分析是通过对项目的主要内容和配套条件,如市场需求.资源供应.建设规模.工艺路线.设备选型.环境影响.资金筹措.盈利能力等,从技术.经济.工程等方面进行调查研究和分析比较,并对项目建成以后可能取得 ...

Python开发（二）

python提供三种内置的数据结构: 列表元组字典一.列表(你可以对列表进行查,插,删,改) #!/usr/bin/python #filename:using_list.py shoplist ...

Tomcat下整合Spring、CXF报错 Failed to start component [StandardEngine[Tomcat].StandardHost[localhost]]

执行tomcat7:run时出现以下错误: java.util.concurrent.ExecutionException: org.apache.catalina.LifecycleExceptio ...

Remove-Azureaccount (Can't get Azure credentials to stick in Powershel)

https://social.technet.microsoft.com/forums/azure/en-US/260df055-7c4e-4ce2-8f8d-190ad20a4b76/cant-ge ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.