750 likes | 915 Vues
肿瘤登记的基本统计方法. 孙喜斌 河南省肿瘤肿瘤防治研究办公室. 登记资料统计分析. 肿瘤登记数据的结果一般以比值 ( 率、比、比例等 ) 的形式呈现 , 不同时间、不同人群间的比较是对各种率或比例值的比较。 同时 , 一些比值也是评价登记质量的常用指标。. 内容. 率 (rate) 及率的标化 比例 (proportion) 比 (ratio). 率及率的标化. 定义、率、人年 粗率 年龄别率 标化率(年龄标化 - 直接法). 发生率 / 死亡率的计算需要两个元素: 1 、限定时期内限定人群中事件(发病、死亡 ) 发生数 — 分子。
E N D
肿瘤登记的基本统计方法 孙喜斌 河南省肿瘤肿瘤防治研究办公室
登记资料统计分析 • 肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现, 不同时间、不同人群间的比较是对各种率或比例值的比较。 • 同时,一些比值也是评价登记质量的常用指标。
内容 • 率(rate)及率的标化 • 比例(proportion) • 比(ratio)
率及率的标化 • 定义、率、人年 • 粗率 • 年龄别率 • 标化率(年龄标化-直接法)
发生率/死亡率的计算需要两个元素: 1、限定时期内限定人群中事件(发病、死亡) 发生数—分子。 2、限定时期内限定人群的人年数—分母。
xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________ 门诊号______________ 住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口 患者姓名___________ 性别__________ 实足年龄__________岁 出生年月——年——月——日 民族____________________ 职 业 (具体工种、性质)______________ 工作单位_____________________ 正式户口 详细地址_______________ 区、县_____________ 街道、乡________________ 诊 断_____________________________ 病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位) 诊断日期______年____月____日 报告单位____________________报告医师__________报告时间_______年_____月_____日 死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床 6 病理(继发) 2X线、CT、超声 7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病
肿瘤登记病例信息 • 基本数据: • 年龄(发病/死亡) • 性别 • 原发部位(ICD) • 其它信息: • 时间(发病/死亡年份) • 诊断依据 • 病期 • 组织学类型 • 职业/婚姻 • 随访结果 • 生存时间
人口数据 • 登记地区相应年度内的(分性别、年龄组) 人口数 • 标准人口年龄构成(中国、世界)
理想中,想要知道人群中某一年龄个体在特 定时间点发生(癌症)的危险度: ——发病力或 ——即刻发生率 实际上,我们只能估计到人群在某一时间段 内新病例(如癌症)的发生的频率(概率): ——发病率
新发病例数据 统计指标: • 年龄别率 • 粗率 • 标化率 • 截缩率 • 累积率 发病率:反映登记地区人群癌症负担指标
肿瘤发病率 公式 发病率= ×100000 男女性别、年龄别发生率 年龄组发病数过少时变化意义不大(随机波动较大) 分部位的肿瘤发生率 合计年份资料的发病率计算
人口数(分母) • 如果是计算某年份的率则用年中人口数或 年初人口数+年末人口数/2 • 如一个时期(如5年)合计发病率则将5年的平均人口相加做分母(或中间年份人口数×时期长度),这一时期合计的发病数做分子。
年龄别发病率 • 考虑年龄分组:0-4,5-9,10-14,…80-84, 85+. 年龄分18组(i=1,2,3,……18; A=18) 以ri 代表(一定时期内)第i年龄组的肿瘤发生数; 全部年龄组的肿瘤发生数为R,则: R= r1 +r2 + r3+…...+ rA 同样以ni 为相同时期的第i年龄组的人口数,各年龄人 口数合计为N, 则: N= n1 +n 2 + n3+…...+ nA
每100,000人年的粗率(全部年龄组)为: 粗率=C = ×100000 i.e. C= ×100000 各年龄组发病率为ai ,则: ai= ×100000
例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据
年龄别发病率的计算 例如40-44岁组(i=9): a9= ×100000 = ×100000 = 21.1/10万
粗率计算 发病粗率 C 各年龄组合计发病数为16404, R= =16404 各年龄组合计人口数为12420220, N= =12420220 C= = ×100000 =132.1/10万
男性胃癌粗率比较 卡里,哥伦比亚 新发病例数(1982-86) 620 男性人口数(1984) 622922 年均粗率 19.9/10万 =620/(5×622922) 伯明翰, 英格兰 发病率数 (1983-86) 3468 男性人口数(1984) 2556200 年均粗率 33.9/10万 =3468/(4×2556200) 伯明翰男性发生胃癌的危险高于卡利的男性吗??
粗率 • 描述癌症负担的指标。 • 比较时往往产生误导。 • 年龄是癌症发生的重要决定因素。 • 进行率的比较时,一定要考虑不同年龄构成的影响。 • 粗率没有考虑年龄的影响。 • 因此,要对年龄别发病率进行比较。
男性胃癌年龄别率比较 卡利CR=19.9 per 100000 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年均发病率(/10万) 1.5 69.7 281.3 人口年龄构成比(1984) 84 12 4 伯明翰CR=33.9 per 100000 年龄 0-44 45-64 65+ 病例数(1983-86) 79 1037 2353 男性人口数 (1984) 1683600 581500 291100 年均发病率(/10万) 1.2 44.6 202.0 人口年龄构成比(1984) 66 23 11
不同地区的胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂)
年龄调整发病率(标准化) 适用情况 不同人群之间的比较 不同时间之间的比较 除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别 发病率进行比较。 计算方法 直接法 间接法 截缩调整发病率 35-64岁组(i=8 ~ i=13) 标准人口
直接法计算年龄调整发病率 i -----------年龄组标 ai -----------年龄组发病率 wi -----------标准人口的年龄组人口数 计算步骤(5步) 1、计算人群的年龄别率ai 2、 ai 与标准人口的年龄组人口数(wi)相乘 3、各年龄组的ai 与wi 的积相加得到∑aiwi 4、各年龄组wi 相加得到∑wi 5、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi
ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。 • 参照人口被称作标准人口。 • 标准人口的各年龄组(i)的人口数称为权数Wi。 • 有很多套权数可以运用。 • 不同的标准人口计算出的标化率不同。 • 通常用世界标准人口(Segi‘s世界标准人口)、中国82年人口构成。 • 进行率的比较时,强调参照“新”的标准人口无任何意义(只会造成混乱与不便)。
年龄调整发病率 ASR=48.8/10万
截缩(年龄)调整发病率(TASR) TASR= = 0.35+…+10.63/6000+…+4000 = 截缩率往往在数据质量不可靠时(如老年组及低年组率)用的多。
截缩率考虑到癌症发生的高峰年龄及 老年人群癌症登记数据的完整性和有效性问题,数据的灵敏度及稳定性佳。 儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为0-14岁,即i从1到3,计算方 法相同。
胃癌标化率比较举例 卡利,哥伦比亚: 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年龄别发病率ai(/10万) 1.5 69.7 281.3 世界标准人口wi 74000 19000 7000 ai × wi 111000 132400 196900 ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000 =3404000/100000=34.04/10万
伯明翰,英格兰: 年龄 0-44 45-64 65+ 病例数(1982-86) ri 79 1037 2352 男性人口数 (1984) ni 1683600 581500 291100 年龄别发病率ai(/10万) 1.2 44.6 202.0 世界标准人口wi 74000 19000 7000 ai × wi 89000 847000 141400 ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000 =2350000/100000=23.5/10万
卡利与伯明翰地区男性胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂) 去除年龄的混杂影响: 伯明翰 Crude=33.9; ASR=23.5 卡利 Crude=19.9; ASR=34.0
年龄调整率(直接法)的标准误及可信区间 年龄调整率方差: Var(ASR)= 标准误 s.e.(ASR)= 可信区间 ASR ± Zα/2× (s.e.(ASR))
方差公式为Binomial 近似法(另一种为Poisson近似法) • 可信区间常用 95% 和 99% , Zα/2值分别为1.96和2.58
调整率方差: 标准误: ASR 95%可信区间: ASR±Zα/2 × (s.e.(ASR))=90.62±1.96×0.73 =89.19 — 92.05
两个标化(年龄调整)率(直接法)的比较 公式: (ASR1/ASR2) 1±2α/2/x ASR1/ASR2 为标准化率比(SRR) X= Zα/2 =1.96 为95%水平 Zα/2 =2.58 为99%水平 第一步计算出SRR 第二步计算X值 第三步计算SRR 95%(或99%)的上下限值,区间内不包括1.0,差异 有显著性意义
举例 苏格兰:1980-84年男性肺癌标化发病率90.6(ASR1),标准误0.73。 1960-64年男性肺癌标化发病率68.3(ASR2),标准误0.67。 计算SRR=ASR1/ASR2=90.6/68.3=1.326 X= = = =22.51 95%可信区间( Zα/2 =1.96)下限=(1.326) 1-(1.96/22.51)=1.29 上限=(1.326) 1+(1.96/22.51)=1.36 如果两个率相同那么SRR等于1,现SRR为1.326,而且95%区间(1.29-1.36) 不包括1,则两率的差异在5%的水平上有显著性意义。
累积率 定义 累积率(Cumulative rate):出生到74岁每岁的发病率相加后,以百分 数表示(儿童肿瘤为0-14岁)。 累积危险度(Cumulative risk):个体在某一年龄期间(如0-74)发 某种疾病的危险度,以百分数表示。 0-74岁累积率:如;0.0+0.0+………..265.7+354.1+369.2=1263.8 1263.8×5=6319.0 (6319.0 /1000000)×100(%)=6.3%
累积危险度 相互关系 例子 6.1% 累积率可作为累积危险度的近似估计值
比、比例 • 比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到的商。这两个变量可以是单位相同,也可以不同。比的分子和分母是彼此分离的(不相包含或重叠)。比没有单位,其数值代表两个两个指标对比的一个指数。 如:男女性别发病比,死亡发病比等。 • 比例(proportion),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分。 如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例, 死亡补发病的比例,未指明部位的肿瘤新病例的百分比等。
各死因死亡数占死亡总数百分比 恶性肿瘤占死亡总数的百分比(发病的百分比?) 胃癌占恶性肿瘤发生(死亡)总数的百分比(发病指标?)
内容 审核:数据质量 • 主要完整性指标 • 主要有效性指标 整理:表和图
数据审核 分子-病例数 分母-人口资料 (1)年度间人口总数的比较(不应出现较大的波动) (2)人口数的年度变化趋势是否合理 (3)如果各年人口数出现较大变动或不合理的变化趋势,应查找原因 (行政区的从新划分、人口的迁移(入)、自然灾害等),并作出充 分说明。 登记处内不同时间的发病动态稳定(存在随机波动,但不应出现突然 明显变化) 相似地区(登记处内、外)的肿瘤发病数(率)应大体一致
xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________ 门诊号______________ 住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口 患者姓名___________ 性别__________ 实足年龄__________岁 出生年月——年——月——日 民族____________________ 职 业 (具体工种、性质)______________ 工作单位_____________________ 正式户口 详细地址_______________ 区、县_____________ 街道、乡________________ 诊 断_____________________________ 病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位) 诊断日期______年____月____日 报告单位____________________报告医师__________报告时间_______年_____月_____日 死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床 6 病理(继发) 2X线、CT、超声 7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病
简单地讲:主要就是对发病报告卡上有关的变 量作频数。 查看报告卡内变量取值分布是否合理。 主要讲述:病理组织学诊断的比例 死亡补发病的比例 同期死亡发病比 未指明部位的肿瘤新发病例的百分比
组织学诊断确认的比例(HV%) (对诊断依据中编码5、6、7、8的做频数) • 登记病例中组织学(或镜检)方法作出诊断的百分比(HV%)是广泛地用 作评价数据完整性和有效性的一个指标。 • HV%的比例应在合理的范围,而非越高越好,较高比例的组织学诊断病 例,可能是由过多依赖于病理学实验室作为信息来源的病例发现的过程 引起,而通过其它信息来源的病例就会漏掉。因此非常高的HV%应当怀疑 病例的漏报(不完整性)。 • 不同肿瘤的HV%变化很大,同时依赖于当地医疗服务状况。 • 影像学技术(放射、超声)及生物技术的发展与应用影响HV%的高低。
组织学诊断确认比例 • 组织学确认(HV%)比是评价肿瘤登记有效性的正向指标。 • 组织学确认的诊断暗含部分可疑肿瘤病例已被病理学家排除。 • 一些难做病理学诊断的器官(脑、胰腺、肝脏等),如果HV%高,则被认为是转移癌的可能性小。 • 细胞学检查包括在组织学确认的范畴内。 • HV%计算时,登记的全部肿瘤作分母(包括DCO病例)
组织学确认(HV%)的比例 所有部位肿瘤的HV%接近100%,可能有漏报。 不同部位、不同地区(医疗服务水平不同) HV%存在差异。