1 / 19

中医药统计学

新世纪全国高等中医药院校规划教材. 中医药统计学. 主编 周仁郁. 9 生存分析. 9.1 生存时间. 9.1.1 生存函数. 生存分析,是把事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计方法.. 例 1 6 名肝癌病人在 1~12 月进入观察,其中 A , D , E 在研究结束前死亡, C 由于某种原因失访, B 、 F 到研究结束仍未获得确切的生存时间. 可以看出, A 、 D 、 E  在研究结束前死亡, C 由于某种原因失访, B 、 F 到研究结束仍未获得确切的生存时间.

cain-wilson
Télécharger la présentation

中医药统计学

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 新世纪全国高等中医药院校规划教材 中医药统计学 主编 周仁郁

  2. 9 生存分析 9.1 生存时间 9.1.1 生存函数 生存分析,是把事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计方法. 例16名肝癌病人在 1~12月进入观察,其中A,D,E在研究结束前死亡,C由于某种原因失访,B、F到研究结束仍未获得确切的生存时间

  3. 可以看出,A、D、E在研究结束前死亡,C由于某种原因失访,B、F到研究结束仍未获得确切的生存时间

  4. 生存时间是指从某事件开始发生到出现某种反应所经历的时间,可分为完全数据与截尾数据两种类型完全数据是指从起点到死亡所经历的时间,截尾数据,是指由于病人发生迁移或死于其他疾病造成失访、或者改变方案、结束时间尚未发生等截尾情况生存时间是指从某事件开始发生到出现某种反应所经历的时间,可分为完全数据与截尾数据两种类型完全数据是指从起点到死亡所经历的时间,截尾数据,是指由于病人发生迁移或死于其他疾病造成失访、或者改变方案、结束时间尚未发生等截尾情况

  5. 生存时间有其特定的分布,描述生存时间的分布规律,可以使用死亡密度函数、生存函数、危险函数等3种方法生存时间有其特定的分布,描述生存时间的分布规律,可以使用死亡密度函数、生存函数、危险函数等3种方法 死亡密度函数f(t)表示患者在时间t的瞬间死亡概率 其中,F(t) 称为死亡分布函数。以 t 为横轴、f(t)为纵轴绘制的曲线,称为死亡密度曲线

  6. 生存函数S(t),表示患者生存时间大于t的累积概率生存函数S(t),表示患者生存时间大于t的累积概率 S(t)=P(T>t)=1-F(t) S(t)为t右边死亡密度曲线下面积,也称为生存率。以t为横轴、S(t)为纵轴绘制的曲线,称为生存率曲线或Kaplan-Meier曲线 危险函数h(t)又称风险函数,表示t的瞬间死亡概率

  7. 以t为横轴、h(t)为纵轴绘制的曲线称危险函数曲线 9.1.2 生存率计算 生存率的计算,有非参数方法与参数方法。参数方法虽然效率较高,但对生存时间的分布要求符合某种类型,而且计算复杂。非参数方法,主要有寿命表与概率乘积两种方法,计算比较容易,应用广泛 概率乘积法也称为乘积极限法,对不分组资料用概率乘法估计生存率,1958年由Kaplan-Meier提出

  8. 把生存时间t从小到大排序,重复数据只列一次。分别计算各时段的初始例数n及该时段的死亡例数d,得到死亡概率q及生存概率p把生存时间t从小到大排序,重复数据只列一次。分别计算各时段的初始例数n及该时段的死亡例数d,得到死亡概率q及生存概率p q=d/n,p=1-q 生存率S(tk)的估计式 S(tk)=P(T≥t)=p1p2…pk 生存率S(tk)的标准误为

  9. 例2中药组与对照组两种疗法治疗白血病,估计两组的生存率 对照组按生存时间t排序,并分段进行计算 在第1时段,t1=2,存活时间大于等于2例数为11,死亡时间为2的例数为1,得初始例数n1=11,死亡例数d1=1,死亡概率q1=1/11,生存概率p1=10/11 生存率S(t1)=p1=10/11

  10. 在第2时段,死亡概率q2=1/10,生存概率p2=9/10

  11. 类似计算中药组的生存率 9.1.3 时序检验 时序检验也称对数秩检验(Log-Rank Test), 可用于两个或多个样本生存时间的比较,条件是生存率曲线不能交叉。有交叉时采用分层处理或多因素分析

  12. 若k(≥2)组的生存时间相同,则在ti点有相同的死亡率di/ni,由此算出第j组在ti时点理论死亡例数Eji若k(≥2)组的生存时间相同,则在ti点有相同的死亡率di/ni,由此算出第j组在ti时点理论死亡例数Eji Eji=njidi/ni 第j组理论数Ej与实际数Oj构成卡方统计量 理论数有小于5者取修正值

  13. 在假设检验有统计学意义时,可以从生存率曲线目测判断、或半数生存期比较、或相对危险度比较几方面来考察效果的好坏。第i组与第j组相对危险度 例3 对例2数据用时序检验比较两组的生存时间 H0:两组的生存时间相等,H1:两组生存时间不等 两组数据混合排序,k=2,分别计算两组及合计组的n、d,并分段进行计算 在第一时段,n1=22、d1=1,中药组n11=11、E11=11×1/22=0.5,对照组E21=0.5

  14. 死亡例数各列分别竖加得 O1=7,O2=9,E1=10.825,E2=5.175 χ2=(7-10.825)2/10.825+(9-5.175)2/5.175=4.1787 df=2-1=1,单侧概率0.025<P<0.05 ,以水准0.05拒绝H0 ,两组的生存时间不等,可以认为中药加化疗方法治疗白血病的效果优于单纯化疗方法 9.1.4 Gehan比分检验 各组生存分布之间呈比例风险关系, h1(t)/h2(t)保持相对稳定水平,时序检验效率较高。若h1(t)/h2(t) 没有保持相对稳定水平,则应使用Gehan比分检验

  15. 各组数据按生存时间由小到大统一排序,在时间ti,各组死亡数与截尾数之和记为mji,合计数记为mi。从上到下统计各生存时间小于ti的例数,记为R1i,从下到上统计各生存时间大于ti的例数,记为R2i各组数据按生存时间由小到大统一排序,在时间ti,各组死亡数与截尾数之和记为mji,合计数记为mi。从上到下统计各生存时间小于ti的例数,记为R1i,从下到上统计各生存时间大于ti的例数,记为R2i 以Vji=mji(R1i-R2i)为各组的比分, Vi2=mi(R1i-R2i)为合计数的比分,构成标准正态变量进行检验 其中,Nj=∑mji,N=∑mi,且∑V1i=-∑V2i

  16. 例4对例2数据,用Gehan比分检验比较两组的生存时间是否相同例4对例2数据,用Gehan比分检验比较两组的生存时间是否相同 H0:两组的生存时间相等,H1:两组生存时间不等 两组数据混合排序,R1i从上到下统计,t1=2时无生存时间小于2的,R11=0;t4=5时不能肯定 4+ 比它小,R14=2。R2i 从下到上统计,t17=40+ 时,截尾数据无法判断确切的生存时间,R2,17=0;t16=39时生存时间大于39的有3例,R2,16=3。其余类似计算 N1=11,N2=11,N=22,∑V1i=66,∑V2i=-66,∑ Vi2=3034

  17. 双侧概率P<0.05,以 =0.01水准拒绝H0,两组的生存时间不等,可以认为中药加化疗方法治疗白血病的效果优于单纯化疗方法

More Related