数学之路-数据分析进阶-Cox比例风险回归模型

Cox比例风险回归模型(Cox’s proportional hazards regression model),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。

h(t/X)=h0(t) exp (β1 X1 + β2 X2 + …… + βp Xp )

h0(t): 基准风险函数 即所有变量取零时的t时刻的风险函数,即没有协变量下的,风险函数

X1、X2 …… Xp:影响因素 变量

β1、β2 …… βp:回归系数

协变量(covariate)在心理学、行为科学中,是指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制的变量。常用的协变量包括因变量的前测分数、人口统计学指标以及与因变量明显不同的个人特征等。

举个例子就是:降雨量(t) = K*温度(t) + e

其中,t是自变量时间,降雨量(t)是因变量,而温度(t)则是协变量

K 为一个常数。

时间: 2024-08-04 22:20:28

数学之路-数据分析进阶-Cox比例风险回归模型的相关文章

COX 比例风险回归模型--有感

生存分析 三大块内容: 1,描述性的 生存率.中位生存期.生存曲线等,常用Kaplan-meier法 2,比较分析 两组的生存曲线是否有差别,log-rank检验(单个因素) 3,cox比例风险回归 类似logistic回归,多个变量对Y的影响,得到一个概率值,只不过加了时间 多花点时间聊聊cox的感受 首先理解一个概念 风险函数(hazard function)h(t)=f(t)/S(t) f(t)为瞬时死亡率,其实就是时间趋近于零时刻的死亡率,又称死亡概率密度函数,曲线下面积为1. S(t)

数学之路-数据分析进阶-区间估计与假设检验(2)

某商城需要针对某类商品建立该类VIP大客户,定期向该客户推送相关广告,客户服务部门推荐了客户A,在数据库随机抽取了100个客户资料的前4个季度平均季消费数据(在这里用平均随机数模拟数据),客户A平均季消费为元,检测其是否消费处于中上水平(位于中位数以上) > sample(200:50000,100)->sale > sale [1]  8447 13987 8809 44437 22973 28093 30594 28060 21101 45155 36128 30129 [13]  

数学之路-数据分析进阶-广义线性模型

在统计学上, 广义线性模型 (Generalized linear model) 是一种受到广泛应用的线性回归模式.此模式假设实验者所量测的随机变量的分布函数与实验中系统性效应(即非随机的效应)可经由一链结函数(link function)建立起可资解释其相关性的函数. 广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在广义线性模式中,假设每个资料的观测值来自某个指数族分布. 该分布的平均数  可由与该点独立的X解释: 其中为的期望值

数学之路-数据分析进阶-区间预计与如果检验(2)

某商城须要针对某类商品建立该类VIP大客户,定期向该客户推送相关广告.客户服务部门推荐了客户A,在数据库随机抽取了100个客户资料的前4个季度平均季消费数据(在这里用平均随机数模拟数据),客户A平均季消费为元,检測其是否消费处于中上水平(位于中位数以上) > sample(200:50000,100)->sale > sale [1]  8447 13987 8809 44437 22973 28093 30594 28060 21101 45155 36128 30129 [13]  

数学之路-数据分析进阶-多变量数据分析(2)

皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数.皮尔森相关系数是用来反映两个变量线性相关程度的统计量,用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1.相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值.r描述的是两个变量间线性相关强弱的程度.r的绝对值越大表明相关性越强.之间 相关性 负 正 无

数学之路-数据分析进阶-多变量数据分析(3)

继续那个地区销量分析的例子 > mygoods 1   2    3    4   5    6    7   8    9   10  11   12 1 1200 3210  123 1111 688 2110 1123 6894 1470 1071 2250 1241 2 2222 1500 3200 1580 5562 58411860  981 658  789 1020 1120 3 2144 2243  134 235  486  985 235 1020  558  995 88

数学之路-数据分析进阶(1 )-多变量数据显示

> ejdqz<-read.csv("ejdqz.csv")> ejdqz  年.度 求职人数 绝对求职指数 相对求职指数1  2008  3045412          100          1002  2009  3413202          112          1123  2010  3902961          128          1214  2011  3675531          121          1065  2012

数学之路-python计算实战(18)-机器视觉-滤波去噪(双边滤波与高斯滤波 )

高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到.高斯滤波的具体操作是:用一个模板(或称卷积.掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值. #滤波去噪 lbimg=cv2.GaussianBlur(newimg,(3,3),1.8) cv2.imshow('src',newimg) cv2.imshow('dst',lbimg) cv2.waitKey() cv2.destroyAllW

数学之路-python计算实战(16)-机器视觉-滤波去噪(邻域平均法滤波)

# -*- coding: utf-8 -*- #code:[email protected] #邻域平均法滤波,半径为2 import cv2 import numpy as np fn="test3.jpg" myimg=cv2.imread(fn) img=cv2.cvtColor(myimg,cv2.COLOR_BGR2GRAY) #加上椒盐噪声 param=20 #灰阶范围 w=img.shape[1] h=img.shape[0] newimg=np.array(img)