研究对象：总体和样本

研究对象：总体和样本 上海交通大学护理学院侯晓静

教学目标 • 掌握抽样原则、过程及方法 • 掌握基本概念：样本、总体、误差 • 熟悉样本含量估计的参数、方法及注意事项

基本概念 1 抽样过程及方法 2 样本含量估计 3 总体和样本

第一节基本概念 总体(population) 根据研究目的确定具有相同性质的个体所构成的全体，总体所包含的范围随研究目的不同而改变。

总体类型 无限总体可得总体有限总体目标总体

观察单位（observed unit） 也称个体或研究单位。指研究总体的单位组成部分，是科学研究中的最基本单位。观察单位可以是一个人，也可以是特指的一群人，甚至是一个器官或一个细胞等。

样本（sample） 从总体中抽取、进行研究的部分观察单位组成的集合称为样本。抽样目的在于用样本信息推断总体特征。样本必须对于其所属的总体具有代表性。

误差（error） 护理研究中，研究者的观察结果与真实值的偏离，称为误差。误差的常见类型系统误差抽样误差

系统误差 定义：由某些不能准确定量但较为恒定因素的所致，原因通常可以把握。来源：受试者、观察者、仪器、外环境等非试验因素控制：正确的实验设计、严格的技术措施抽样误差定义：随机抽样产生的样本指标与总体指标存在差异，是一类无规律、不恒定的随机变化的误差。抽样误差不可避免来源：随机抽样引起控制：重复原则、增加样本量、提高精密度系统误差与抽样误差区别

第二节抽样过程及方法 抽样（sampling）从总体抽取部分观察单位获得样本的过程。总体样本

抽样过程 • 明确总体 • 列出抽样标准 • 选择合适的样本量和抽样方法 • 确定样本诊断标准纳入标准排除标准

抽样原则 • 保证样本的可靠性指样本中每一个观察单位来自同质总体，即研究对象的选择要有明确的诊断标准、纳入标准、排除标准。 • 选取有代表性的样本随机化原则、足够样本量。

随机化原则 • 随机抽样：总体中的每一个观察单位都有同样的几率被选入样本 • 随机分配：每一个被选入样本的观察单位都有同样的几率被分配入实验组和对照组

概率抽样：使用随机的方法进行抽样，使总体中的每一个观察单位都有同样的几率被选入样本概率抽样：使用随机的方法进行抽样，使总体中的每一个观察单位都有同样的几率被选入样本非概率抽样：抽样时未采取随机的方法，总体中的每个个体并非由相同的几率进入样本。抽样方法

概率抽样(随机) 单纯随机抽样系统抽样分层抽样整群抽样多级抽样非概率抽样(非随机) 方便抽样配额抽样目的抽样网络抽样抽样方法

概率抽样--单纯随机抽样 方法：将全体研究对象统一编号，再用随机数字表、计算机随机抽样、或抽签的方法随机抽取部分个体组成样本优点：研究个体进入样本完全随机，使概率抽样中最基本的方法。缺点：研究对象较多时，将所有对象统一编号往往难以做到。

例:单纯随机抽样--抽签法 准备从某校 2000名学生中抽取100人调查考试焦虑问题对2000名学生编号并做成签号混匀签号随机抽取100个签号签号对应100名学生为调查对象

例：单纯随机抽样--随机数字表法 对2000名学生进行编号随机表中任意指定一数字，向任一方向摘录四个数字为一组，共100组。小于或等于4000，大于2000则减2000，小于或等于6000，大于4000则减4000，余数相对应学生编号即为样本如随机数字为2050、6112、1125，则编号为50、112、1125的学生进入样本

概率抽样--系统抽样 又称等距抽样方法：先将总体的每个研究个体按某一特征顺序编号，并根据抽样比例（样本含量与总体含量之比）规定抽样间隔H，再随机确定一个小于H的数字K，以K为起点，每间隔H抽取一个研究个体组成样本。

例：系统抽样法 准备在某社区共1200户居民中抽取120户做家庭功能调查按门牌号对1200户居民进行编号计算抽样间隔H=总体含量/样本含量 =1200/120=10 随机确定K（K<H），如K=6，按门牌号为6、16、26…1196，共抽取120户居民进入样本

优点：抽样方法简单易行；进入样本的个体在总体中的分布均匀，对总体的估计较准确。优点：抽样方法简单易行；进入样本的个体在总体中的分布均匀，对总体的估计较准确。缺点：当编号呈递增递减或有一定的周期性趋势时，抽样误差较大。

概率抽样--分层抽样 方法：按照与研究目的明显有关的某种特征将总体分为若干层，然后从每一层内按比例随机抽取一定数量的个体，组成该层的样本，各层样本之和代表总体。

例：分层抽样法 为研究某医院护士心理应激水平，准备抽取200人作为样本该医院本科学历护士10%，大专学历护士50％，中专学历护士40％，样本按分层抽样法（200x10%+200x50%+200x40%）分别从本科、大专、中专学历护士中随机抽取20、100、80人，合起来组成样本。

优点：层内具有均质性，样本对总体的代表性更好；各层可分别得到独立的样本进行分析研究 。缺点：当分层使各层个体含量不相等可导致各层样本比例失衡。注意：分层指标的选择应能使层内差异较小，层间差异较大。

概率抽样--整群抽样 方法：将总体中所有的个体按某种属性分成若干个群体，再从所有的群体中随机抽取一部分群体构成样本。适用情况：由于时间等原因不能进行简单随机和分层随机抽样；或组成总体的个体名单不明确。

类型 • 单纯整群抽样 • 两阶段抽样优点：易组织实施，节省人力物力，适用于大规模调查缺点：抽样误差较大

抽样误差从低到高排序 分层抽样系统抽样单纯随机抽样整群抽样

非概率抽样--方便抽样 方法：用最容易找到的人为研究对象。如护士调查本病区的病人。优点：方便易行缺点：代表性和准确性最差，分析结果时要慎重。

非概率抽样--配额抽样 方法：研究者根据总体内分层的特性，利用总体内各层的构成比抽取与总体相似的样本。方便+分层优点：确保方便抽样中被排除在外的个体能进入样本。缺点：代表性和准确性差。

非概率抽样--目的抽样 方法：研究者根据自己的专业知识和经验以及对调查总体的了解，有意识的选择某些研究对象。适用范围：适于某些新技术措施，在探索性、前瞻性研究中常用；质性研究中常用。缺点：没有客观指标来判断样本的代表性。

非概率抽样--网络抽样 方法：利用社会网络的优势和朋友间具有共性的特点来进行抽样。也称滚雪球式抽样。适用范围：适用于寻找某些特殊总体中的个体，如药物滥用者、离婚者等。

第三节样本含量估计 样本含量（sample size）是按照总体客观存在的性质与特征和研究者所欲承担的误差风险而决定的最小样本量。

样本含量过小 指标不稳定检验效能低样本含量过大增加研究困难难于控制条件浪费人力物力样本含量

样本含量估计的参数 TEXT TEXT TEXT TEXT 总体标准差检验水准检验效能容许误差

检验水准（a值） 本次研究允许的第一类错误概率，是统计学上的显著水平。a在假设检验前人为指定，一般为0.05或0.01，a越小所需样本量越大，另外还应明确是单侧或双侧检验。第一类错误（用a表示）：在统计学假设检验中，拒绝了实际上成立的无效假设（HO），即假阳性错误。

检验效能（1-β） 又称把握度，即在特定的α水准下，若总体间确实存在差异，该研究能发现此差异的概率。（1-β）越大，所需样本含量越大。一般取β为0.2，此时，检验效能为0.8。β表示第二类错误的概率。第二类错误（用β表示）：在统计学假设检验中为拒绝实际上不成立的无效假设（HO），即假阴性错误。

总体标准差σ 总体中各观察单位计量值的变异程度。在其他条件相同的情况下，σ越大，所需样本含量越大。

容许误差δ 即预计样本统计量和相应总体参数的最大相应误差控制在什么范围，常取可信区间长度之半。在其他条件确定的情况下，δ越小，所需样本含量越大。

样本含量估算的2个用途： • 在实验组设计阶段，设差值δ=u1-u2，期望达到的预期的检验效能（如power=1-β=1-0.01=0.90，表示有10％的机会犯第二类错误）按规定检验水准a=0.05或0.01，计算样本量。 • 在已知临床实验中（文献），根据样本含量、总体差值估算该试验检验效能是否够大。（一般检验效能power≥0.80）

估算样本含量的方法 计算法查表法经验法

n 样本含量 检验水准a所对应的u值，可查表第二类错误的概率β相对应u值，可查表 δ两总体均数之间的差值u1-u2 每对观察对数差值的标准差 π总体率 π1 和π2分别代表两组的总体率 πc 代表两组的合并率 б总体标准差公式各符号意义

估计样本含量公式 估计检验效能（）公式两样本均数比较（n相等）-计算法

估计样本含量公式 估计检验效能（）公式配对试验两组均数比较-计算法

估计样本含量公式 样本均数和总体均数的比较-计算法估计检验效能（）公式

估计样本含量公式 估计检验效能（）公式两样本率的比较（n相等）-计算法

估计总体均数样本含量- 计算法，适用于调查性研究

估计总体率的样本含量-计算法，适用于调查性研究估计总体率的样本含量-计算法，适用于调查性研究

例1： 用新药降低高血脂患者胆固醇，研究者规定试验组与对照组相比，血清胆固醇平均降低0.5mmol/L以上，才有推广价值。引用文献中胆固醇的标准差为0.8mmol/L，规定单侧a=0.05，power=0.90，β=0.10，规定两组例数相等，请估计样本含量？

估计总例数为88人，每组44例。 该资料属于两样本例数相等的均数比较，按照两样本均数比较公式：

例2： 欲调查某地高血压的患病率，并希望误差不超过10%，已知高血压患病率一般为8%。问需要调查多少样本量？规定双侧a=0.05，μ0.05=1.96， β=0.10，power=0.90； π= 0.08 ，δ=0.02

研究对象：总体和样本