生存模型(Survival Model)介绍

https://www.cnblogs.com/BinbinChen/p/3416972.html

生存分析,维基上的解释是: 生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析存活率分析

生存分析的方法也可以用在其他的商业应用中,比如顾客流失,等模型。大概可以从两个方向上去考虑生存分析的研究对象

1. 估计(各期的)生存函数,某个人病人可以活多久(e.g. 5年)的概率。常用的是Kanplan-Meier 估计。

2. 研究影响生存期长短的因素及关系,这个关系有两种,

  a) 哪些素是最主要的因素,侧重qulitative,可以用决策树,随机森林等模型

  b)各因素的相关系的数量表示,侧重quantitative。可以用cox,等等模型。

一、关于删失数据(censored data)

删失数据是生存分析的一个最主要的特征。删失数据不是缺失数据,它是可以观察到的,但是数据常常由于各种原因而被截断。主要有三种

  • 右删失:这个是最常见的类型。比如,一项肺癌的研究,某些人活了6年之后,他移民了,那么这个数据就是删失的,信息是,这个人至少活了6年。
  • 左删失:
  • 区间删失:这个也比较常见。比如一项关于艾滋病的研究,某个患者是大概2012.6-2013.1得的艾滋病,因为他没半年会做一次检查。

由于删失数据的存在导致传统的一些方便需要作一些调整,比如后面给要提到的利用极大似然估计(MLE)去估计参数时,会稍有不同。

二、描述生存时间分布规律的函数

  • 生存率:又称为生存概率或生存函数,它表示一个病人的生存时间长于时间t的概率,用S(t) 表示:    s(t)=P(T3t)。生存率是一条下降的曲线。
  • 概率密度函数:它表示死亡速率的大小。如以t为横坐,f(t) 为纵坐标作出的曲线称为密度曲线,由曲线上可看出不同时间的死亡速率及死亡高峰时间。纵坐标越大,其死亡速率越高,如曲线呈现单调下降,则死亡速率越来越小,如呈现峰值,则为死亡高峰。
  • 危险函数:称为生存到时间t的病人在时间t的瞬时死亡率或条件死亡速率或年龄别死亡速率。当用t作横坐标,h(t)为纵坐标所绘的曲线,如递增,则表示条件死亡速率随时间而增加,如平行于横轴,则表示没有随时间而加速(或减少)死亡的情况。风险函数的不同情况:
    • 常数,    如:死于飞机失事。
    • 下降,    如:急性损伤。
    • 上升,    如:持续接触危险因素。
    • 澡盆样,如:人的一生。

二、非参数法估计生存函数

估计生存分析函数是生存分析一块很重要的部分,它可以给人一些基本的直观的信息。比如说,某个患者是采用化疗,还是手术会活的长久, 某个新药对治疗某种疾病是否有显著的效果。最常用的方法是Kanplan-Meier。非参数的方法的优势在于,只需要生存时间和数据是否是删失,就可以给人一个直观的图形,从图形也可以看到患者能活多久的概率是多少。一下是用R做的一个乳腺癌的案例:

原文地址:https://www.cnblogs.com/ying-chease/p/9257751.html

时间: 2024-10-08 15:55:29

生存模型(Survival Model)介绍的相关文章

ThinkPHP 的模型使用详细介绍--模型的核心(七)

原文:ThinkPHP 的模型使用详细介绍--模型的核心(七) 注意:本节是ThinkPhp框架对数据操作的核心处理部分 大家还是在这里看清楚可以将其剪切放到代码编辑器中查看 本章节给大家着重介绍模型的: 一.普通查询方式    . 二.表达式查询方式 . 三.区间查询      .  四.统计查询  .    五.SQL直接查询 回顾初步模型的-"增删改查": // 直接连接数据库,但是得先去配置文件中配置下才行 class IndexAction extends Action {

Java内存模型-jsr133规范介绍

原文地址:http://www.cnblogs.com/aigongsi/archive/2012/04/26/2470296.html; 最近在看<深入理解Java虚拟机:JVM高级特性与最佳实践>讲到了线程相关的细节知识,里面讲述了关于java内存模型,也就是jsr 133定义的规范. 系统的看了jsr 133规范的前面几个章节的内容,觉得受益匪浅.废话不说,简要的介绍一下java内存规范. 什么是内存规范 在jsr-133中是这么定义的 A memory model describes,

Django - 模型(model)-- ORM

一.ORM介绍 ORM概念 对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对象与关系数据库存在的互不匹配的现象的技术. 简单的说,ORM是通过使用描述对象和数据库之间映射的元数据,将程序中的对象自动持久化到关系数据库中. ORM在业务逻辑层和数据库层之间充当了桥梁的作用 ORM由来 让我们从O/R开始.字母O起源于"对象"(Object),而R则来自于"关系"(Relational). 几乎所有的软件开发过程中都

美国模型风险监管体系介绍_模型验证重要性

python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 美国模型风险监管体系介绍以及同盾的建议 原创: 余旭鑫 博士 小盾分析咨询部落 First things first. 为避免有些读者一上来就把标题理解偏了.我先澄

模型绑定(Model Binding)

模型绑定是值用浏览器以HTTP请求方式发送数据来创建.NET对象的过程.(负责生成适当的动作方法参数值) 动作调用器(Action Invoker):调用控制器的动作方法的组件,负责在调用动作方法之前获取动作方法的参数值. 默认的动作调用器(ControllerActionInvoker)依赖于模型绑定器,而模型绑定器(Model Binder)是有IModelBinder接口定义的. public interface IModelBinder { object BindModel(Contro

盒子模型(Box Model)

盒子模型(Box Model) ■ 盒子模型--概念 在网页设计中常用的属性名:内容(content),填充(padding),边框(border),边界(margin),CSS 盒子模式都具备这些属性. 细节说明: ?html 元素都可以看成一个盒子 ?盒子模型的参照物不一样,则使用的 css 属性不一样.比如:从 div1 的角度看,是 margin-right,从 div2 看,则是 margin-left. ?如果你不希望破坏外观,则尽量使用 margin 布局,因为 padding 可

LVS专题: LVS的工作模型和调度算法介绍

LVS专题: LVS的工作模型和调度算法介绍 前言 什么是负载均衡? 什么是LVS? LVS的架构: LVS的实现模型: NAT实现原理: DR实现原理: TUN实现原理: FULLNAT实现原理: LVS的调度算法 静态调度算法(4种) 动态调度算法(6种): 总结 前言 本文大概介绍一下LVS的工作方式和实现的模型以及调度算法,流程图方面只上了两张图, 如果有需要LVS各工作模式的流程图请看张小凡:LVS原理详解 什么是负载均衡? 当单台服务器性能不足时我们有两种对其进行扩展的方式, 分别是

判别式模型和产生式模型 (discriminative model and generative m

最经典的莫过于 Andrew Ng在NIPS2001年有一篇专门比较判别模型和产生式模型的文章: On Discrimitive vs. Generative classifiers: A comparision of logistic regression and naive Bayes (http://robotics.stanford.edu/~ang/papers/nips01-discriminativegenerative.pdf) 转: 判别式模型和产生式模型 (discrimin

CSS 框模型(Box Model)

CSS 框模型(Box Model) 所有HTML元素可以看作盒子,在CSS中,"box model"这一术语是用来设计和布局时使用. CSS盒模型本质上是一个盒子,封装周围的HTML元素,它包括:边距,边框,填充,和实际内容. 盒模型允许我们在其它元素和周围元素边框之间的空间放置元素. 下面的图片说明了框模型(Box Model): 不同部分的说明: Margin - 清除边框区域.Margin没有背景颜色,它是完全透明 Border - 边框周围的填充和内容.边框是受到盒子的背景颜