基本统计方法的选择与应用

一、确定资料的类型:分类资料、定量资料;
 选择适当的统计方法,资料不同,设计不同,采用的分析方法不同;
1、计量资料的比较(比较集中趋势是否不同):
    (1)两组:t检验、Wilcoxon秩和检验 …

  如:医保患者与自费患者住院天数是否不同?
资料与设计:两组独立的计量资料比较
统计方法:两独立样本 t 检验(independent samples t-test)
分析结果:t=2.17,P=0.033

参数统计方法(t检验、ANOVA)有应用前提条件:
A:资料满足正态性;
B:比较的各组资料之间方差相等(满足方差齐性)。

(2) 三组(及以上):方差分析、Kruskal-Wallis检验 …

如:医生、护士、医护人员的期望收入指数是否有差别?
资料与设计:三组独立的计量资料比较
统计方法:完全随机设计的方差分析(one-way ANOVA)
分析结果:F=20.89,P<0.0001
结论:有差别。

两变量之间关系的分析:
    相关分析、回归分析、秩相关 …
    如研究门急诊量与收入的关系、床位数与护士人数的关系

变化趋势分析:
    Cochran-Armitage趋势检验、卡方检验 …
     如分析两周患病率随年龄变化的趋势

综合评价:
   层次分析法、TOPSIS法、秩和比法 …
    如评价三甲医院医疗质量、综合绩效

示例:

研究医院床位数与护士人数之间是否有相关性。
研究目的:床位数(X)与护士人数(Y)之间是否有关?关系如何(线性、非线性)?关系大小?
                  (由样本推断总体)
资料与设计:来自于同一医院的两个指标
统计方法:
        相关分析(correlaion analysis)衡量两指标之间是否有线性关系,及关系的强度和方向。
        回归分析(regression analysis)定量进行X到Y的量化估计或预测。
变量关系的描述:散点图(scatter plot)
相关分析的结果:r=0.83,P<0.0001   95%CI:(0.61,0.93)
回归分析的结果:Y=-4.84 + 0.36X R平方=0.69
结论:
     1. 可认为床位数与护士人数之间有关,护士人数随床位数的增加而增加。
     2. 实有床位数的信息可以解释注册护士数信息量的69%,还有剩余的31%的信息需通过实有床位数以外的其他因素来解释。

2、分类资料

  (1)无序分类资料的比较(比较率或构成是否不同):
       卡方检验、Fisher精确概率法 …

  如:

两样本率的比较(卡方检验)
用抗凝剂和不用抗凝剂治疗急性心肌梗塞患者的生存率是否不同?
P<0.01,按α=0.05水准拒绝H0 ,接受H1 ,可认为用与不用抗凝剂治疗急性心肌梗塞的效果不同,用抗凝剂后的生存率较高。

  (2)有序等级资料的比较(比较平均程度、等级是否不同):
       Wilcoxon秩和检验、Kruskal-Wallis检验 …

  如:

比较三家医院门诊候诊时间是否有差别。统计很长,较长,一般,较短,很短有多少例。
资料与设计:三组独立的等级资料比较
统计方法:Kruskal-Wallis秩和检验(Kruskal-Wallis H test)

----------------------------------------------------------------------------------

多元统计方法的选择与应用
探索影响因素:
多重线性回归、logistic回归 …
如探索影响肺炎患者住院总费用的因素

综合多个指标进行事物的分类或判别:
聚类分析、判别分析 …

多指标的降维及潜在因素的探索:
主成分分析、因子分析 …

预测事物的发展趋势:
指数平滑法、ARIMA预测方法 …

示例:研究目的:住院总费用的影响因素分析(年龄、性别(0-男;1-女)、住院天数、费别(0-自费;1-医保)、入院情况(0-一般;1-急症;2-危重)、所在医院(1-医院1;1-医院2;2-医院3;)、住院总费用)

资料与设计:目标指标(应变量)为计量资料
统计方法:多重线性回归(multiple linear regression)
筛选自变量的方法:
 逐步法(stepwise)
 前进法(forward)
 后退法(backward)
 注意:自变量的量化与赋值

原文地址:https://www.cnblogs.com/quietwalk/p/8270237.html

时间: 2024-08-03 16:18:40

基本统计方法的选择与应用的相关文章

PCFG -- 基于统计方法生成语法树

语法树的作用 一棵语法树不仅包括了词性(part of speech), 还包括了短语(如名词短语, 动词短语)和结构化的信息(如主语, 谓语和宾语). 这些信息是进行机器翻译所必须的, 例如机器翻译中就需要使用到结构化信息, 来根据不同的语言规定调整主谓宾的顺序. 上下文无关语法 上下文无关语法(CFG)定义了描述语法树的要素. CFG 是一个四元组, 即(S, sigma, R, N), 其中 S 表示开始符号, sigma 表示词汇表, R 表示语法规则, N 表示非终端词. CFG 的问

关于机器学习中规则与统计方法的思考

最近工作了一段时间,今天跟大家讨论一下关于“规则与模型”的问题. 大家肯定都知道,机器学习方法主要分两类,一类是基于统计的方法,比如贝叶斯.KNN等,都是对数据的某种特征进行归类计算得到数据划分的依据的:另一类是基于规则的方法,比如,语义规则,语法规则或者业务规则等等,这些规则主要是根据数据本身的特征人为地对分类细节进行限定,没有什么太高深的理论,但是实用性很强.当然,我觉得还有第三种方法,就是基于统计与基于规则相结合的方法,比如关联规则,apriori方法,或者决策树方法.这些方法在分类或者求

pandas学习(常用数学统计方法总结、读取或保存数据、缺省值和异常值处理)

pandas学习(常用数学统计方法总结.读取或保存数据.缺省值和异常值处理) 目录 常用数学统计方法总结 读取或保存数据 缺省值和异常值处理 常用数学统计方法总结 count 计算非NA值的数量 describe 针对Series或DataFrame列计算统计 min/max/sum 计算最小值 最大值 总和 argmin argmax 计算能够获取到最小值和最大值的索引位置(整数) idxmin idxmax 计算能够获取到最小值和最大值的索引值 quantile 计算样本的分位数(0到1)

jquery的add()方法扩大选择返回

1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="UTF-8"> 5 <script type="text/javascript" src="jquery-1.11.3.min.js"></script> 6 <title>Title</title> 7 &

pandas 常用统计方法

统计方法 pandas 对象有一些统计方法.它们大部分都属于约简和汇总统计,用于从 Series 中提取单个值,或从 DataFrame 的行或列中提取一个 Series. 比如 DataFrame.mean(axis=0,skipna=True) 方法,当数据集中存在 NA 值时,这些值会被简单跳过,除非整个切片(行或列)全是 NA,如果不想这样,则可以通过 skipna=False 来禁用此功能: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

语音通信系统网络资源分析统计方法

语音通信系统网络资源分析统计方法 针对语音通信中资源占用情况,本文档数据统计从两方面分析,磁盘读写和网络资源带宽分配, 磁盘读写 磁盘读写分析统计是通过iostat(linux系统自带工具)进行的. 用法:iostat 环境:20服务器两个号码4901和4902 结论:单路视频情况下,对磁盘读写影响非常小,近乎不占用磁盘 网络资源带宽分配 网络资源带宽分析统计是通过iftraf工具(linux系统自带工具)进行的. 用法:iptraf -deth6  #eth6是监控的网口 按"q"退

ASP.net中网站访问量统计方法代码(在线人数,本月访问,本日访问,访问流量,累计访问)

一.建立一个数据表IPStat用于存放用户信息 我在IPStat表中存放的用户信息只包括登录用户的IP(IP_Address),IP来源(IP_Src)和登录时间 (IP_DateTime),些表的信息本人只保存一天的信息,如果要统计每个月的信息则要保存一个月.因为我不太懂对数据日志的操作,所以创建此表,所 以说我笨吧,哈哈. 二.在Global.asax中获取用户信息 在Global.asax的Session_Start即新会话启用时获取有关的信息,同时在这里实现在线人数.访问总人数的增量统计

Shell 中常见的日志统计方法

前面我发布过"Hadoop兮,杀鸡别用牛刀,python+shell实现一般日志文件的查询.统计", 需要结合python, 可能还是有一定的门槛, 现将shell部分剥离出来. 举例一些最基本的日志统计方法. (1)查看文件 more crawler.log 查看crawler.log日志 tail -n 100 crawler.log 查看crawler.log的最后100行 (2)匹配统计 cat *.log | grep "ERROR" |wc -l 统计在

php排序方法之选择排序

//选择排序法 $arr = array(3,55,45,2,67,76,6.7,-65,85,4); function selectSort($arr){ for ( $i=0; $i<count($arr);$i++ ){ $index = $i; $min_val = $arr[$i]; for ($j=$i+1;$j<count($arr);$j++){ if ( $arr[$j]<=$min_val ){ $min_val = $arr[$j]; $index = $j; }