IBM-SPSS第19章生存分析与Cox模型(1)定义生存分析,是一种将生存时间和生存结果综合起来对数据进行分析的一种统计分析方法。生存分析源于古老的寿命表研究,在医学领域相应的数据主要来自对随访事件的研究。随访资料的特点主要有:存在截尾数据;数据呈正偏态分布。(2)基本的概念①生存时间:指从某个起始事件开始,到出现我们想要得到的终点事件发生所经历的时间,也称为失效时间。生存时间具有:分布类型不确定,一般表现为正偏态分布;数据中常含有删失数据。(2)基本的概念②完全数据:指从事件开始到事件结束,观察对象一直都处在观察范围内,我们得到了事件从开始到结束的准确时间。删失数据:指在研究分析过程中由于某些原因,未能得到所研究个体的准确时间,这个数据就是删失数据,又称为不完全数据。产生删失数据的原因有很多:在随访研究中大多是由于失访所造成;在动物实验研究中大多由于观察时间已到,不能继续下去所造成。(2)基本的概念③生存概率:指从某单位时间段开始,存活的个体到该时间段结束时个体仍存活的可能性。生存概率=下一时段开始的人数/该时段开始的人数=1-死亡概率。生存函数:指个体生存时间T大于等于t的概率,又称为累积生存概率,或生存曲线。S(t)=P(T>t)=生存时间大于等于t的病人数/随访开始的病人总数。S(t)为单调不增函数S(0)为1,S(∞)为0。(2)基本的概念④半数生存时间:指50%的个体存活且有50%的个体死亡的时间,又称为中位生存时间。因为生存时间的分布常为偏态分布,故应用半数生存时间较平均生存时间更加严谨。风险函数:指在生存过程中,t时刻存活的个体在t时刻的瞬时死亡率,又称为危险率函数、瞬时死亡率、死亡力等。一般用h(t)表示。h(t)=死于区间(t,t+t)的病人数/在t时刻尚存的病人数t。生存分析的方法①参数方法,数据必须满足相应的分布。常用的参数模型有:指数分布模型、Weibull分布模型、对数正态分布模型、对数Logistic分布模型、gamma分布模型。②半参数方法,是目前非常流行的生存分析方法,相对而言,半参数方法比参数方法灵活,比非参数方法更容易解释分析结果。常用的半参数模型为Cox模型。③非参数方法,当数据没有参数模型可以拟合时,通常可以采用非参数方法进行生存分析。常用的非参数模型包括生命表分析和Kalpan-Meier方法。模块解读---寿命表寿命表—定义事件寿命表—定义范围寿命表—选项模块解读---Kaplan-M...