310 likes | 481 Vues
統計學. 郭信霖 許淑卿. 第七章 抽 樣 分 配. ■ 7 - 1 抽樣簡介 ■ 7 - 2 抽樣分配 ■ 7 - 3 樣本平均數的抽樣分配 ■ 7 - 4 樣本比例的抽樣分配 ■ 7 - 5 兩樣本平均數差的抽樣分配 ■ 7 - 6 兩樣本比例差的抽樣分配 ■ 7 - 7 三個重要的抽樣分配 ■ 7 - 8 常態母體之檢查及轉換. 7-1 抽樣簡介. 抽樣調查目的在於如何根據所抽出的樣本資料計算的樣本統計量的值,以推論母體的未知特徵性質參數。
E N D
統計學 郭信霖 許淑卿
第七章 抽 樣 分 配 ■ 7 - 1抽樣簡介 ■ 7 - 2 抽樣分配 ■ 7 - 3樣本平均數的抽樣分配 ■ 7 - 4樣本比例的抽樣分配 ■ 7 - 5兩樣本平均數差的抽樣分配 ■ 7 - 6兩樣本比例差的抽樣分配 ■ 7 - 7三個重要的抽樣分配 ■ 7 - 8常態母體之檢查及轉換
7-1 抽樣簡介 • 抽樣調查目的在於如何根據所抽出的樣本資料計算的樣本統計量的值,以推論母體的未知特徵性質參數。 • 在抽樣的調查中,母體的參數皆未知,需以樣本的統計量來估計推斷,其表示的符號,如下表7-1:
表7-1 2 = S 2 = s2 =
抽樣方法會造成誤差的原因有二: 一為抽樣誤差(sampling errors)或為隨機誤差(random errors)。 另一為非抽樣誤差。 常用抽樣方法可分為兩大類: 一類為隨機抽樣(random sampling),純依隨機原理抽取樣本。 另一類為非隨機抽樣,純憑人為意志選擇母體中具有代表性的樣本。
設母體的隨機變數X,每次抽出一個隨機變數Xi,則n次抽樣X1, X2, …, Xn須滿足下列二條件: 1. X1, X2, …, Xn互為獨立(independent, i)。 • X1, X2, …, Xn之機率分配與X之機率分配相同(identically distributed, i.d.)。 • 此時X1, …, Xn即為一組隨機樣本,有時簡寫為r.s.。
隨機抽樣的方法大可分為如下: (一)簡單隨機抽樣(simple random sampling) 從大小為N的母體中,抽取大小為n的樣本,若每一樣本被抽到的機會均等。 一般常採用的方法有: 抽籤方法 隨機號碼表方法 (二) 系統抽樣(systematic sampling) 將大小為N的母體編號,以最初k (k )個個體隨機抽出一個作為第1個樣本,往後再每隔k個個體抽取一個,直到抽出n個大小之樣本為止,此種抽樣法稱為k取1系統抽樣法或等距抽樣法。
(三) 分層隨機抽樣(stratified random sampling) 將一母體所含個體,按某種標準,分類成互斥而窮儘的各層(strata),再從各層中,按一定比例隨機抽出若干個體,合併即得一分層隨機樣本,稱此種抽樣方法,為分層隨機抽樣法。 1. 決定各層樣本數ni之方法有二: (1) 比例配置法(Proportion Allocation)(2) 紐曼配置法(Neyman Allocation) 2. 性質 此抽樣法希望層內差異小,層間差異大,即層內資料性質相同,層間資料性質不同。
(四) 集群抽樣(cluster sampling) 將母體個體依特殊標準合成若干集群,以集群為抽樣單位,用簡單隨機抽樣法自這些集群中抽取一個或數個集群作為樣本,此即集群抽樣法。 性質: 此抽樣法與分層隨機抽樣法不同,希望層內資料差異大,層間資料差異小,即層內資料性質不同,層間資料性質同。
7-2 抽樣分配(sampling distribution) 樣本統計量(sample statistic):是一個隨機變數,其值隨樣本不同而不同。也就是為隨機樣本的實數值函數。 抽樣分配(sampling distribution):表示樣本統計量的機率分配。
7-3 樣本平均數的抽樣分配 設(X1 , X2 , …, Xn)來自具有平均數為 X,變異數為的 母體之一組隨機樣本,則稱 = 為樣本平均數,且 E( ) = X,Var( ) = 1. 無限母體: 若樣本夠大,樣本中n個隨機變數X1, X2, …, Xn可視為相互獨立,則Var( ) = = 統計量的標準誤(standard errors),以 = X/表示,此乃強調變異的來源為抽樣誤差所造成。
2.有限母體: 若樣本對母體而言不夠小(或母體不夠大),則樣本平均數的變異數應修正為Var( ) = 。 樣本平均數的抽樣分配,有兩個重要的結果: 一個是由常態母體隨機抽出的情形。 另一個是由非常態母體隨機抽出大樣本的情形。
1. 來自常態母體: 設(X1, X2, …, Xn)來自常態母體N(, 2)且2為已知之一組隨機樣本,則樣本平均數的抽樣分配為 N 或 Z = ~N(0, 1) 由上可知,若X為常態分配,且2已知,則不管n的大小,的抽樣分配一定為常態分配。
2. 來自非常態母體之大樣本: 『中央極限定理(Central limit Theorem,CLT)』 設(X1, X2, …, Xn)來自具有平均數為 ,變異數為2 < ,之任意母體隨機抽出的一組樣本,則當n足夠大時(通常,當n 30), 的抽樣分配會近似於N。 或Z=~N(0, 1)
7-4 樣本比例的抽樣分配 由二項分配,可知X~B(n, p)且E(X) = np,Var(X) = np(1 - p),當n很大且np 5,n(1 - p) 5,X的分配會近似於N(np, np(1 - p)),或樣本比例 = 的抽樣分配會近似於常態分配,即 ~N 或Z = ~N(0, 1)
7-5 兩樣本平均數差的抽樣分配 假設有兩個獨立母體,分別具有平均數為1,2,變異數為1,2,隨機抽出n1,n2個樣本,則兩樣本平均數差 -的抽樣分配為何呢? 不管來自常態母體或是來自非常態母體之大樣本,則 - ~N 或 Z = ~N(0, 1) 2 2
7-6 兩樣本比例差的抽樣分配 設從兩個二項母體B(1, p1),B(1, p2)分別隨機抽出(X1 , X2 , …, ),(Y1 , Y2 , …, )兩組獨立樣本,當n1,n2夠大時,(通常,n1p1 5,n1(1 - p1) 5,n2p2 5,n2(1 -p2) 5),依CLT,可知兩樣本比例差 - = -的抽樣分配為近似於常態分配, 則 - ~ N 或 Z = ~N(0, 1)
7-7 三個重要抽樣分配 一、自由度 二、卡方(2)分配 (1) 定義: 設X1, X2, …, Xn為自常態母體N(, 2)抽得之一組隨機樣本,則 2= = ~2(n- 1) 稱為自由度n-1之卡方分配,以2(n- 1)表之。
(2) 性質: 卡方分配之圖形為右偏,唯當自由度愈大,圖形愈趨於對稱。 加法性:若X~ (v1),Y~ (v2),XY, 則X + Y~2(v1 + v2)。 若X~N(, 2),則Z2 = ~2(1)。 (3) 特徵數: = v = 2v,v為自由度。 其圖形如下:
圖7-2 (4) 卡方分配之基本用途在於變異數之估計及檢定,主要尚可應用於無母數檢定中,如適合度檢定、齊一性檢定、獨立性檢定等等。
三、t分配 定義: 設Z及2為獨立之隨機變數,Z~N(0, 1),2~2(v),則T = 稱為自由度是v之t分配,,以T~t(v)表示。 此隨機變數T之抽樣分配,稱為學生t分配(Student’s t distribution),係1908年Gosset研究成果以筆名“Student”首先發表,創小樣本統計方法之先河。
(2) 性質: t分配與標準常態分配相似,均為0以為對稱中心。 t分配之變異數較標準常態分配變異數為大,故其雙屬分散較廣。 當n值增加,t分配圖形與標準常態分配圖形相近。 t (v) = F(1, v) ; z = t() ; t1-(v) = -t(v) (3) 特徵數: E(T ) = 0 V(T ) = ,v > 2
(4) 應用:若(X1, X2, …, Xn)來自常態分配N(, 2)且 與2皆未知的一組隨機樣本,同時 = ,S 2 = ,則T = 之分配稱為自由度v = n - 1之t分配,以T~t(n- 1)表之。其圖形如下:
四、F分配 • 定義:設及為兩獨立之隨機變數,且~2(v 1), ~2(v 2),則F = 為具有自由度為v1,v2之F分配,以F~F(v1, v2)表之。 (2) 性質: a. F分配之圖形為右偏。 其圖形如下:
b. F1-(v1, v2) = 。 c. 當v1 → ,v2 = 1則 之分配為標準常態分配。 d. 當v1 = 1,v2 → ,則 之分配為標準常態分配。 • 當v1 = 1,則 之分配為自由度v2之t分配。 (3) 特徵數: E(F ) = ,v2 > 2 V(F ) = ,v2 > 4
(4) F分配之用途是作變異數分析,或作檢定兩常態母體變 異數是否相等之推論。(4) F分配之用途是作變異數分析,或作檢定兩常態母體變 異數是否相等之推論。 應用: 若 = ~2(n1- 1); = ~2(n2-1), 則 F = ~ F(n1- 1, n2- 1) 4. 卡方分配,F分配,t分配之特性: (1)皆為重要之抽樣分配。(2)皆為小樣本分配。 (3)皆來自常態母體。(4)皆為連續分配。 (5)均有自由度。
7-8 常態母體之檢查及轉換 1. 常態母體之檢查: 2. 常態母體之轉換: (1)使大的數轉換為更大: x1, x2, x3, x4, x5, …, ex等。 (2)使大的數轉換為更小: , , , …, log10x等。 (3)使大的變小,小的變大: , , , , ……等。