ch7-偏态分布的激素水平影响因素分析-深入学习方差分析模型

分类变量、连续变量分布的描述

bootstrap抽样、秩和检验探索变量关联:比较均值、独立样本

变量变换:P-P图

秩变换分析:个案排秩

Cox回归模型

方差分析实质是自变量含有分类变量的一般线性模型。

方差分析属于参数检验,有一定的假设条件。当不满足方差分析的假设条件时,就选择

(1)非参数检验(bootstrap抽样、秩和检验)方法-实际上是一种初判的方法;

(2)或考虑变量变换,对变换后的变量进行方差分析;-应用广泛

(3)或变量变换无法解决时,考虑秩变换分析方法。即对原变量的秩次进行方差分析;-应用更广

(4)秩变换分析方法会损失一些数据信息,考虑用生存分析中的Cox回归模型分析。

对于本章案例,三种方法的分析结果一致,不同组的激素水平差异显著,性别、年龄对激素水平无影响。

1、案例背景

在控制其他因素的作用下,研究激素水平是否在对照组和试验组(患有胃癌)两个组间存在差异。

2、数据理解

单变量描述:

看分类变量的频数分布,常用的方法是描述过程、频率过程或制表过程。下面是用制表过程来简化输出分类变量的频率分布。

看连续变量的分布在描述过程,通过画直方图看连续变量是否是正态分布。

结论:激素水平是呈明显的右偏态分布。下面要考虑激素水平的分布是否满足模型对数据分布的要求,若不满足,则如何处理。

变量关联探索:

目标:非参数检验就是在不假定参数服从正态分布的前提下,识别不同组间差异的显著性。

上面分析了单变量的分布情况,那要想看下如:激素水平在不同组、性别、年龄段的分布情况,需要进行变量关联探索,比较不同因素下的激素水平均值大小。

由于激素水平是偏态分布,所以用bootstrap抽样、秩和检验进行组别间的均值比较。

下面是bootstrap抽样:

bootstrap抽样有参数法和非参数法。参数法是先假定参数的分布状况,非参数法是不假定分布。

当频数分布近似正态时,用均值做点估计,用正态原理估计bootstrap可信区间;当频数分布为偏态分布时,用中位数做点估计,用上下2.5%分位数估计95%置信区间。

此处用中位数表示各组平均水平,计算中位数的置信区间来大致估计不同因素下的激素水平有无统计差异。

“分析-比较均值-均值”

初步结论:激素水平的中位数在两个组别间存在差异。

下面是秩和检验:

给出更精确的组间是否存在差异的结果。

SPSS提供新老两套秩和检验的操作界面,分别如下:

用散点图探讨年龄与激素水平的关系:

对于探索两个连续变量的联系,绘制散点图是第一选择。

3、对因变量变换后的建模分析

常见的变量变换方法:

对数变转换、平方根转换、倒数转换等等。

本案例的具体操作:

对因变量激素水平进行对数变换,看是否满足方差分析的要求。

变量变换,即通过对原始数据的数学变换,使其成为满足或近似满足方差分析的要求,对变换后的变量进行方差分析。

检验对数变换后的激素水平是否进行满足正态分布:P-P图

结果显示:对数变换后的激素水平已较为接近正态,可建立方差分析模型。

“缺乏拟合优度检验”是检验已建模型与饱和模型(即包括所有主效应和交互效应的模型)相比,当前模型的预测效果是否存在差异。

4、秩变换分析

当变量变换无法解决问题时,考虑使用非参数统计分析方法中的秩变换分析方法。

所谓秩变换分析方法就是先求出原变量的秩次,然后使用求出的秩次代替原变量进行参数分析。即对求出的秩次进行方差分析。

5、利用Cox模型进行分析

秩变换分析方法通过利用秩次的方式来绕开数据非正态分布的问题,但会丢失一些信息。解决办法是使用生存分析中的Cox回归模型分析。

事件:由研究者规定的生存时间的终点。

Cox回归模型的基本思想:在风险函数与研究因子之间建立类似于广义线性模型的关联。

激素水平:理解为生存时间;

由于每个样本都有明确的激素水平测量值,即生存时间,则每个人的生存结局都是出现了失效事件。失效事件数值=1.

时间: 2024-12-21 15:51:21

ch7-偏态分布的激素水平影响因素分析-深入学习方差分析模型的相关文章

ch9-脑外伤急救后迟发性颅脑损伤影响因素分析案例-logistic回归

卡方检验-考察分类变量相关性-“交叉表”或“设定表”中进行: t检验-考察连续变量与分类变量相关性-“设定表”中进行: 线性logsitic回归-研究分类因变量与一组自变量(可连续可分类)的关系: 树结构模型-研究自变量间是否存在交互作用 广义线性模型-在更广范畴建立模型. 1.案例背景 收集脑外伤急救病例样本,分析哪些因素导致急救后的脑损伤发生.因变量:是否出现迟发性脑损伤,为两分类变量:自变量:有连续性变量.分类变量. 卡方检验:研究分类变量之间的关系: 由于因变量是两分类变量,所以不能用普

webkit浏览器渲染影响因素分析

前言:浏览器的渲染对性能影响非常大,特别是在移动端页面,在宏观上,我们可以参考雅虎那20几条军规来操作,但在微观渲染层面,实际还没有一套相对成型的理论做为依据. 本文只是抛砖引玉,带大家进入微观的优化领域,实际在渲染优化这块上,还有很多技巧及方法需要大家去挖掘.本文写的也比较凌乱,望包涵!! 先来看个chrome timeline 工具上的一个图: 在timeline上,我们看到有6种颜色的柱子,这6个类型的柱子构建了整个webkit浏览器的渲染过程. 简单的分类一下:蓝色表示加载,黄色表示脚本

Python:Lasso方法、GM预测模型、神经网络预测模型之财政收入影响因素分析及预测

问题重述 通过研究,发现影响某市目前及未来地方财源的因素.结合文中目标:(1)选择模型,找出影响财政收入的关键因素:(2)基于关键因素,选择预测方法.模型预测未来收入. 具体来讲 本文分析了地方财政收入.增值税收入.营业税收入.企业所得税收入.个人所得税收入的影响因素并对未来两年采用灰色预测(GM(1,1))并以已有年度序列训练神经网络(NN),再以得到的模型预测包括未来两年在内的所有年份收入的预测值,由此可以根据预测相比于实际值情况及未来收入变化作出相应的决策判断. 文中的操作流程步骤非常值得

Entity Framework性能影响因素分析

1.对象管理机制-复杂为更好的管理模型对象,EF提供了一套内部管理机制和跟踪对象的状态,保存对象一致性,使用方便,但是性能有所降低. 2.执行机制-高度封装在EF中,所有的查询表达式都会经过语法分析.解析SQL语句.然后调用底层的ADO.NET对象去执行,中间的这些环节导致性能有所降低. 3.SQL语句-低效EF采用映射机制将对象操作转换成SQL语句,SQL语句一般的基于标准模块生成的,不会进行特殊优化,和直接编写SQL语句操作数据库相比,效率会打折扣,复杂操作更为明显. 状态管理机制优化AsN

有哪些方面影响服务器的性能你知道吗?

服务器的重要性对于站长是不言而喻的,服务器的选择当然也要看所处机房了.比如壹基比网络科技有限公司他们是直营机房位于香港将军澳,所处环境性能都是十分好的.选择性价比高的服务器是每个站长所追求的,对于影响服务器性能的因素,站长是否了解呢?面对市场多如毛牛的服务器托管商家,我们该怎么选呢?1,网络带宽的影响邮件设计技术的影响:是使用LDAP协议还是数据库方式进行用户登录认证和管理,以及是否采用SSL\TLS进行加密处理,是否提供防病毒模块,病毒处理机制等等,都是影响服务器系统性能的主要因素2,服务器配

30岁之后生的宝宝更聪明吗

最佳的生育年龄是多少,肯定有很多人说是二十多岁,但是近日英国有一项研究表明30多岁的女人比较有机会生下聪明宝宝,但40多岁生下的宝宝则有较高的肥胖概率. 女人30岁备孕须知 有数据显示女方年龄每增加5年,妊娠率则下降22.2%.当女性的年龄超过30岁时,备孕时遇到的困难会更多.一些女性朋友在想要孩子前并没有注意爱惜自己的身体,因而难免长期积累了一些影响生育的健康问题.下面亲润专家整理出女人30岁备孕须知,各位想要孩子的女同胞们赶紧来看看吧. 1容易遭遇怀孕困难 随着年龄的增加,工作压力越来越大,

美好生活

做人 自信.乐观.积极.努力.向上自信.乐观来源于积极,要想要能够积极你必须努力,努力之后你就能大胆的积极了,积极达到成效之后一方面达到了向上的目的,并且这成效另一方面促进了你的自信,乐观.由此看来,努力是很重要的 做事 做事其实没有必要这么急躁,一步一个脚印要做到心里不急,但手头上要急,不断去实践和面对,逼着自己离开自己的舒适区,勇敢跨出第一步,提高自己的心理素质和科学文化知识,一切都在自己掌握之中,你会发现人生因为有挑战而变得更加美好.要有计划,有组织,讲究方法,不必事无巨细,但要注意细节,

线性模型(1)

在方差分析中,我们初步介绍了线性模型的思想,实际上,线性模型只是方法分析的模型化,其统计检验仍然是依照方差分解原理进行F检验. 线性模型作为一种非常重要的数学模型,根据分析目的可以分为线性回归模型和方差分析模型,根据表现形式又可以分为一般线性模型.广义线性模型.一般线性混合模型.广义线性混合模型. 下面我们就根据分析目的来介绍线性模型 一.方差分析模型: 使用线性模型进行方差分析的时候涉及一些基本概念: ==============================================

新疆阿波罗妇科医院电话

新疆阿波罗妇科医院电话[〓★〓乌鲁木齐妇科医院www.xjnkyy120.net〓★〓健康热线:0991-8842888〓专业妇产诊疗中心〓★〓]乌鲁木齐阿波罗医院经过多年来不断探索和积累,历经几代人的共同努力,医院已经发展成为集医疗.教学.科研.预防.保健为一体的现代化医院,为医院我们依靠资深的专家队伍.高质量的专科护理.先进的医疗设备和专注于服务的价值理念形成了成熟.规范和科学的诊疗模式,为社会提供一流的专业医疗服务. 检测怀孕有哪些方法? (1)早孕试纸检测 早孕试纸的问世给诊断早孕带来了