9. 두 표본의 가설 검정

9. 두 표본의 가설 검정 : Two Sample Test - paired t-test - t-test - modified t-test

Two Sample Test • 단일표본의 평균치 검정에서는 한 개의 모집단의 알려지지 않은 평균치 를 알려진 모평균 0와 비교하였다.. • 더 흔한 경우는 두 개의 서로 다른 모집단의 평균 1와 2를 비교하는 것이다. : Two Sample Test • 그래서 두 모평균이 같은지를 증명하고자 한다. • 이때 두 모평균 1와 2는 알려져 있지 않은 (unknown) 값들이다.

두 모평균들이 짝을 지은 표본으로부터 도출된 평균들인지, 두 개의 독립적인 표본으로부터 도출된 평균들인지에 따라 가설 검정 방법이 달라진다. • 1and 2came from two dependent data (= a paired data) • 1and 2came from two independent data

Paired data • 짝을 지은 두 표본을 비교하는 경우 한 집단의 각 측정치는 다른 집단의 특정 값과 대응하게 된다. (paired or dependent data)

An example of pairing 1: 자가 짝짓기 • 자가 짝짓기(self-paring)는 한 사람에게서 두 개의 측정이 일어났을 때 사용한다. • 수면제의 효과를 파악하기 위하여 10명 환자에게 수면제 한 번, 위약 한 번을 투여하였다. • 환자 별로 수면제를 준 날 밤의 수면 시간과 위약을 준 날 밤의 수면 시간을 각각 측정하였다. • 환자당 1 쌍의 수면 시간, 즉 (수면제를 준 날 수면 시간, 위약을 준 날의 수면 시간) 이 기록될 것이다.

Sleep duration under pill A Sleep duration under Placebo A sleep duration under A and the sleep duration under placebo are from the same participant. Participant 2 Participant 1 Participant 2 Participant 1 Participant 3 Participant 3 Participant 4 Participant 4 Participant 10 Participant 10

An example of pairing 2: 두 독립표본의 matching • 첫 집단에 속한 사람과 성, 연령 등에 있어 비슷한 성격을 가진 사람을 두 번째 집단에서 골라 짝을 지을 수 있다. • We want to know if BP is higher in renal syndrome patients than in healthy persons. • Blood pressure was measured from patients with renal syndrome and healthy controls. • We want to compare the mean BP of patients with renal syndrome and that of healthy controls. • By design, we match (or pair) a patient with a control person based on his/her sex, age and race.

Patients with renal syndrome Healthy control persons Female, age=49, Asian Male, age=29, White Female, age=44, Asian Male, age=25, White Male, age=35, Black Male, age=31, Black Male, age=31, White Male, age=27, White Matching Variable: -Sex -Age(5) -Race

Why do we pair? • 짝짓기를 하는 이유는 외적 변이도를 최소한으로 유지하고자 하는 목적에 있다. • Ex1) We want to control the variations in BP due to other factors such as age, sex, race, obesity, genetic composition etc. By paring BPs from the same patient, we are able to control the variation for everything other than the treatment A. • Ex2) By paring BPs from a patient and a control with the same sex, age, and race, we are able to control the variation for sex, age, and race other than the disease status.

Paring 을 무시하고 분석하면? • Example 1에서 수면제를 준 날의 평균 수면 시간과 위약을 준 날의 평균 수면 시간을 비교하여 수면제 효과를 평가하게 되면, 같은 사람의 측정치가 2회 들어가게 되는 특수 상황을 무시하게 된다. • 즉, 불필요한 외적 변이도를 계속 유지한 채로 분석하게 되어 연구 검정력을 떨어뜨린다. • 따라서 Treatment A 군의 특정 값은 placebo군의 특정값 하고만 비교한다.

Hypothesis test for paired data

Hypothesis for paired data • If=0, the pill has no effect. H0:  = 0 = 0 H1: 0 • 각 약을 주었을 때의 수면시간을 두 개의 독립적인 측정으로 간주하지 않고 각 쌍의 값의 차이에 초점을 맞춘다. • i번째 사람의 수면 시간의 차는, 이다.

각 사람들의 수면 시간의 차 가 정규분포를 하고 그 평균이 라 하자. • 각 차들은 한 개의 관측치로 취급할 수 있으며, 알려진 모평균 0 에 대한 단일표본 t-검정을 시행할 수 있게 된다. • The test method becomes the same as the one-sample t-test.

짝지은 t 검정Paired t-test • Sample mean of the is, • And the standard deviation is, where n is number of pairs. • Test statistics is , d.f.=n-1 • If or then we reject H0.

Example • 위약과 비교하였을 때 개인별로 수면제를 주어서 증가한 수면 시간을 10명에 대해 평균을 내면 이며, 그 표준편차는 이다. • 표준오차는 =0.56 시간이 된다. • 수면 시간의 차이가 정규 분포를 따른다면 t= 은자유도 9인 t분포를 따른다. with d.f.=9

T-distribution table 읽기 • 자유도 9인 t분포의 양측 (two-sided) 5% 퍼센티지 포인트는 2.26이고, 이는 절대값이 2.26이 넘는 t값이 관찰될 확률은 5%임을 의미한다. 2% 퍼센티지 포인트가 2.82, 1%의 경우 3.25이다. 따라서 관찰된 t값인 3.18은 2.82와 3.25 사이에 있으므로, 이 값을 관찰할 확률은 2%와 1% 사이이다.

t-distribution table • What is the degrees of freedom? • What is the p-value? t-distribution with 10 d.f.

검정 결론 • 수면 시간의 차이는 따라서 2% 수준에서 유의하다 (significant at the 2% level)고 말할 수 있다. 왜냐하면 이 정도의 큰 차이가 우연에 의해서 나타날 확률은 2%가 안 되기 때문이다. P 값은 P<0.02 또는 0.01<P<0.02로 표시한다. • 결론: 귀무가설을 기각한다. 수면제와 위약간에 수면 시간에 있어서 차이가 있으며 사실상 수면 시간을 늘려준다.

정확한 t1-α/2 혹은 p-value 구하기 • 이론적으로는 3.18이라는 t값에 대응되는 정확한 확률을 계산할 수 있으며 일부 컴퓨터 프로그램은 그러한 기능을 가지고 있다. • 그러나 손으로 계산으로 하기 위해서는 각 자유도에 대하여 다양한 t 값에 대한 확률표를 가지고 있어야 한다. • 이는 매우 방대한 양이기 때문에 대부분의 경우 해당 자유도에 있어 몇 가지 퍼센티지 포인트만 제시해 준다. • 만일 계산된 t값이 표에 존재하지 않는 값이라면 그 값에 가장 가까운 두 값을 찾아 p-값의 범위를 제시할 수 있다. 이 정도도 가설검정의 결론을 내리는 데는 지장이 없다.

Estimation of true increase • 일단 약이 실제 효과가 있다는 사실을 파악한 후에는 일반적으로 그 약에 의하여 증가하는 수면 시간이 어느 정도인지 제시할 필요가 있다. • 이것은 (예를 들어) 95% 신뢰 구간으로 제시된다.

100(1-α)% Confidence Interval in paired data • 짝을 지은 두 표본의 모평균들의 차이의 모평균에 대한 100%x(1-α) 신뢰구간은, • 위의 예에서 투약으로 인해 증가한 수면시간의 모평균의 95% 신뢰구간은, 1.78±(2.26×0.56) (0.51, 3.05) • 즉, 0.51에서 3.05 시간이다.

신뢰구간의 가설검정적 해석 • 이 결과를 가지고 가설검정에 준하는 해석을 내려보자. • 이 구간에는 귀무가설인“0 시간 증가” 가 포함되지 않으므로 결론은 “투약으로 인해 수면시간이 1.78시간 증가하며 이는 5% 유의수준에서 통계학적으로 유의한 증가이다.”

독립된 두 표본의 t 검정 • 지금부터는 두 개의 독립된 표본들에서의 평균치 비교를 해 보고자 한다. • 독립된 표본들이라 함은 한 표본의 측정치는 다른 표본의 측정치와 아무 관련 없이 측정되는 자료들이다. • 한 표본의 모평균과 다른 표본의 모평균은 둘 다 알려지지 않은 값이다. • 우리는 두 독립된 표본 평균치들이 같은 모평균에서 나온 것인지 서로 다른 모평균에서 나온 것인지를 판정하고자 한다.

두 독립 표본의 예 • Cystic fibrosis(낭성섬유증) 아동과 정상 아동의 혈중 철분 수준을 비교하고자 한다. • 정상아 중 무작위로 n1=9명을 뽑고 Cystic fibrosis 환아 중 무작위로 n2=13명을 뽑았다. • 두 집단의 표본 수는 달라도 된다. • 두 집단의 혈중 철분 값은 독립적이며 정규분포를 한다. • 정상아군은 평균 1분산 12을 갖고 cystic fibrosis 군은 평균 2분산 22을 갖는다.

Cystic Fibrosis Patients Normal Control Children Fe levels in normal children and those in cystic fibrosis patients are independently measured. 2, 22 1, 12

Two sample t-test • 귀무가설과 대립가설은: H0 : 1 = 2 H1 : 12 • 만일 두 표본의 평균치가 너무 많이 차이 나면, 즉 | | 가 0 에서 너무 많이 떨어져 있으면 H0를 기각한다. 1 = 2 = 0?

Distribution of the differences of the two means • 우리는 이면, 임을 배웠다. Controls Cystic fibrosis 12 22 n2 n1

Variance of the differences of the two means • 두 집단의 평균 차의 분산을 추정하는 과정에서 두 가지 상황이 벌어질 수 있다. 1) 두 집단의 분산이 같은 경우 2) 두 집단의 분산이 다른 경우

등분산가정시Equal Variances • 두 집단의 분산이 같고 모분산을 알고 있다고 하자.( ) • 그러면 위의 식은, • 따라서 검정 통계량 z 로 가설검정 한다.

Z- distribution (표준정규분포)

Unknown but Equal Variances • 두 집단의 분산이 같되 모분산을 모르면 표본 분산 sp2 을 사용해야 한다. • 이 경우 t 검정통계량을 산출한다. with d.f.=n1+n2-2 • 여기서 쓰인 공통표본분산 sp2 (pooled estimate of the variance)는 다음과 같이 구한다. Controls Cystic fibrosis s12 s22 (즉 s12과 s22의 가중평균) n2 n1

t-distribution • A collection of distribution depending on the degrees of freedom.

Two sample t-test • 귀무가설1 - 2=0 하에서 t 검정통계량은 t 분포를 따르며, 자유도는 n1 + n2-2 이다. • t 검정통계량을 이용하여 우리가 관찰한 | | 값 혹은 이보다 더 큰값을 관찰할 확률이 얼마인지 구하면 그것이 p-value 이다. • 만일 이 p-value < 면 귀무가설을 기각한다. • 만일 이 p-value 면 귀무가설을 기각하지 못한다. • 이러한 가설 검정 방법을 두 표본 t 검정법 (two-sample t test)이라고 한다.

Cystic Fibrosis Example • Cystic fibrosis의 예로 유의수준 0.05에서 가설검정을 시행하자. • 9명의 정상아들에서 혈중 철분을 잰 결과 평균은 mol/l, 그리고 표준편차 s1=5.9 mol/l이었다. • 13명의 cystic fibrosis 환아들의 혈중 철분 평균값은mol/l, 그리고 표준편차 s2=6.3mol/l이었다. • We will assume the two samples are normally distributed and .

두 군의 모집단의 공통분산 2를 모르고 있으므로 공통 표본분산을 구해야 한다. • 따라서 검정통계량 t 는,

t-distribution table • What is the degrees of freedom? • What is the p-value? t-distribution with 10 d.f.

검정 결론 • 자유도 20인 t 분포에서 2.63은 윗 꼬리 부분 확률이 0.01(t20,0.99=2.528) 과 0.005(t20,0.995=2.845) 사이인 지점에 해당한다. • 따라서양측 p-value는, 2(0.005) < p < 2(0.01) 또는 0.01 < p < 0.02 이다. • p < 0.05 이므로 귀무가설을 기각한다. • 결론: 두 집단의 평균 혈중 철분 농도에 차이가 있다. 사실상cyctic fibrosis 환아들에서의 철분 농도가 정상아들보다 더 낮다.

등분산 가정하에서의 100(1-α)% CI • t 분포 하에서의의 100(1-)% 신뢰구간은 • If the 95% CI does not include the null hypothesis value (=0), “The mean difference of the two samples is statistically significant at 5% significance level”.

True difference of iron levels • cystic fibrosis 환아와 정상아의 혈중 철분농도의 평균치 차는 = 7.0 이다. • 이 값은 의 점추정치 이다. • 자유도 20인 t분포에서 95%의 관찰치가 -2.086과 2.086 사이에 존재한다. 즉 t20,0.975=2.086이다. • 의 95% 신뢰구간은 =(1.4, 12.6) • 이 구간은 0을 포함하지 않으므로 ( )%유의 수준에서 유의한 결과이다.

두 집단의 분산이 다른 경우 Unequal Variances • 이런 경우에는 공통표본분산을 산출하는 의미가 없어진다.(no sp). • 따라서 약간 변형된 t 검정법을 사용하여야 한다. (modified version of the two-sample t test) 이므로 σ대신 s 를사용한다. 따라서 검정통계량은, • 불행히도 이 통계량의 분포가 어떤 모양을 가지는지 정확하게 그려내기가 힘들다.(don’t know the d.f.)

Satterthwaite approximation • 그러나 귀무가설1 - 2=0 하에서는 이 통계량이 대략적으로 자유도 d” 하에서 t 분포를 따르게 된다. • d’ 를 다음과 같다고 하자. • d” 는 d’를 내림한 값이다. (즉 d’=12.6 면 d”=12) • 이런 방법을Satterthwaite approximation 이라 한다. • 사실상 두 분산이 다를 때 두 평균치 분석에서 가장 어려운 부분은 바로 이 자유도를 계산해 내는 일이다. • Modified two sample t-test 는 Satterthwaite approximation으로 자유도를 구한 t-test 이다.

이분산에서의100(1-α)% CI • 두 표본의 분산이 다를 경우 신뢰구간은, 이다. • 두 집단의 분산이 같은 경우와 비교해d.f.변화로 인해 t 값이 달라짐에 유의하자.

Cystic Fibrosis Example • (Homework) 앞의 Cystic Fibrosis 예에서 분산이 다르다고 가정하고 t-test를 시행하고 95% CI를 구해보라.

두 분산의 동질성 검정(test for equal variance) • 두 분산이 같은지 다른지를 알아보기 위해 또 검정을 시행할 수 있다. H0: 12=22 H1: 1222 • 우리는 표본에서 얻어진 두 분산의 비 (s12/s22) 를 계산하여 이 값이 너무 작거나 너무 크면 (즉 1에서 멀어질수록) 두 분산의 크기가 다르다고 판단한다. • 이를 위해 s12/s22의 분포가 어떤 모양을 가지는지 알 필요가 있다.

F ratio for equal variances • 귀무가설 하에서 s12/s22는 F 분포를 따른다. with d.f. of n1-1 and n2-1 ( ) • 양측검정을 시행한다.

F distribution • t 분포와 마찬가지로 자유도에 의해 모양이 결정되는 일련의 분포들의 집합체이다. • F 분포는 분자의 자유도와 분모의 자유도를 따로 갖는다. • F 분포는 positively skewed 되어있으며 양의 값만 갖는다.

F-distribution

F 분포는 upper percentile points 만 제시한다. F 분포의 대칭성을 이용하여 lower percentile points를 유추한다. • F 분포에서 분자와 분모의d.f.가 n1-1, n2-1인 lower pth percentile 값은 분자와 분모의d.f.가 n2-1, n1-1인 upper pth percentile 값의 역수와 같다.

The table for F distribution presents upper percentage points only.

F-distribution Table

9. 두 표본의 가설 검정

9. 두 표본의 가설 검정

Presentation Transcript