1 / 44

5.いろいろな確率分布

5.いろいろな確率分布. χ 2乗分布( chi-square distribution ) t - 分布( t distribution ) F 分布( F distribution ) 2 項分布( binominal distribution ) ポアソン分布( Poisson distribution. χ 2  分布 (chi-square). 確率変数X 1 ,X 2 ,・・・・ X n が互いに独立で同一の正規分布 N(μ, σ) に従うとき、統計量 の分布は、自由度 n - 1 の χ 2  分布に従う。

Télécharger la présentation

5.いろいろな確率分布

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 5.いろいろな確率分布 • χ2乗分布(chi-square distribution) • t- 分布(t distribution) • F分布(F distribution) • 2項分布(binominal distribution) • ポアソン分布(Poisson distribution

  2. χ2 分布 (chi-square) • 確率変数X1,X2,・・・・ Xn が互いに独立で同一の正規分布 N(μ, σ) に従うとき、統計量の分布は、自由度 n- 1 のχ2 分布に従う。 • χ2 分布は母集団の分散の推定・検定に用いる。

  3. χ2 分布

  4. t – 分布(t distribution) • 確率変数X1,X2,・・・・ Xn が互いに独立で同一の正規分布 N(μ, σ) に従うとき、とおくとき、統計量の分布は自由度 n – 1 の t 分布に従う。

  5. t 分布は 母集団の平均の推定・検定に用いる。

  6. 自由度nが大きいと正規分布に近くなる

  7. t – 分布(別の表現) • 確率変数Xが N(0, σ) に従い、確率変数Yが自由度n-1のχ2分布に従うとき、統計量の分布は自由度 n – 1 の t 分布に従う。

  8. F分布(F distribution) • 確率変数X, Yが独立で、各々自由度n1, n2のχ2分布に従うとき、統計量は、自由度(n1, n2)のF分布に従う。 • F分布は2つの母集団の分散比の推定・検定のときに利用される。

  9. ガンマ関数(Gamma function)

  10. 2項分布(binominal distribution) • 確率pで存在する当たりくじから、復元抽出でn個とりだしたとき、x個当たる確率。B(n,p)X=0, 1, 2, …….,nf(x)=nCx px (1-p) n-x • E(X)=np, V(X)=np(1-p) • B(n,p) は、n∞で、N(np, np(1-p)) となる。

  11. ポアソン分布 (Poisson):rare probability • 2項分布において、npを一定値λに固定して、n→∞ としたものが ポアソン分布めったに起こらない事象が起こる確率分布λ=1だと、        P(X=x) = 0.36788/x!例:馬に蹴られて死ぬ人数、交通事故死亡者数

  12. 6.統計的推定(statistical estimation) 母集団 Population 母数 Parameterθ 例:平均μ 標本 Sample 推定値 Estimateθ* 例:Xbar ランダム抽出 • 不偏推定値(unbiased estimate)E(f(X1,X2,…….,Xn))=θとなるf(X1, X2,…..Xn) を不偏推定量という。 推定

  13. 不偏推定値(unbiased estimate) *母平均(mean) μの不偏推定値(unbiased estimate) *母分散σ2の不偏推定値(μ既知) *母分散σ2の不偏推定値(μ未知)

  14. 区間推定母分散(σ2)が未知で平均を推定 標準誤差(standard error)

  15. もし、データ数が21だったら、自由度は20。両側で5%危険率で推定するとする。もし、データ数が21だったら、自由度は20。両側で5%危険率で推定するとする。 t(α)=2.086 標準誤差(SE)を計算して、 誤差範囲は、 t(α)・SE

  16. 自由度10、95%信頼区間なら  X +- 2.228 S.E. • 自由度60、95%信頼区間なら  X +- 2.000 S.E.無限大なら 1.96 S.E.

  17. 母平均が未知な場合の母分散の推定

  18. 7.統計的検定(statistical testing)7.1 考え方(method) •  帰無仮説H0 検定統計量   棄却(裏に対立仮説)nil hypothesis  statistical variable  reject   ランダムである。 =  確率は小さい∴ ランダムではない!  有意水準                  5%、1%の                 危険率  

  19. 7.2 母平均の検定 • 正規母集団 N(μ,σ) とする。母分散が既知(σ2)、平均μ0(既知) • 帰無仮説H0:母集団の平均μはμ0である。対立仮説H1:母集団の平均μはμ0でない。        (本当は対立仮説を示したい) • 検定統計量 

  20. 7.2 母平均の検定 • 正規母集団 N(μ,σ) とする。母分散が未知、平均μ0(既知) • 帰無仮説H0:母集団の平均μはμ0である。対立仮説H1:母集団の平均μはμ0でない。        (本当は対立仮説を示したい) • 検定統計量 

  21. 7.3 平均の差の検定 • 2つの正規母集団とする。N(μ1,σ1), N(μ2,σ2)μ1とμ2が違うことを示したい。 • σ1,σ2既知 • σ1,σ2未知だが等しい。

  22. 7.4 母相関係数の検定 - t 分布 ー無相関が帰無仮説大きさNの標本の相関係数が r のとき

  23. QBOの西風シアの5年と東風シアの5年の1月の帯状平均オゾン混合比の差(実線)。QBOの西風シアの5年と東風シアの5年の1月の帯状平均オゾン混合比の差(実線)。 単位はppmv。 有意性で差が有意な領域を影で示す。 影が90, 95, 99%で有意な差。t検定

  24. 図2 1月の50 hPaにおけるオゾン混合比。等値線の単位はppmv。 (a)QBOの西風シアの5年平均。 (b)QBOの東風シアの5年平均。 (c)差(西風-東風)。  影は有意性を表し図1と同じ。

  25. 7.5 ノンパラメトリック検定non-parametric test • 母集団の分布の型に関する情報を仮定せずに検定する手法。これまで述べた検定は母集団が正規分布をすると仮定したが、その仮定を行わない。 • それぞれの検定の名前がある。Wilcoxen’s rank sum test

  26. ウィルコクスン検定Wilcoxen’s rank sum test • 2つの分布型は同じだが、位置がずれている。これを検定する順位和検定。 2つのグループの標本を1つにまとめて、Xij の小さいほうから順位を付けたときの順位を rij とする。

  27. 帰無仮説:2つのグループの分布の中央値は同じである。帰無仮説:2つのグループの分布の中央値は同じである。 (グループG1の順位の総和) • 検定量Wは (N1,N2)が小さいときは、ウィルコクスン検定の数表で決める。 大きいときは、Wは以下の正規分布に近似されることを使う。

  28. ウィルコクスン検定(中央値の差)Wilcoxen’s test • アンサリー・ブラッドレィ検定(分布の広がり)Ansari-Bradley test • ラページ検定(上記を同時に検定)Lepage test • モンテカルロ法(いろいろ場合によって統計量を考える。サンプルを乱数で発生させ、確率を求める。コンピュータ向き)

  29. 8.重回帰分析(Multiple Regression Analysis) • P個の説明変数 x1, x2,….,xpから目的変数y を予測する。y = f( x1, x2, … , xp) + e • 線形重回帰モデルY = a0 + a1x1 + a2X2 + ….. + apxp + e

  30. データ X35 変数番号 データ番号

  31. データのn組(n>=p+1)から最小2乗法により係数の最良不偏推定値を求める。ai : y の xiに関する偏回帰係数。以下の仮定をおく • eαの期待値はゼロ:E[eα]=0: 不偏性 • eαと eα’ は互いに独立:E[eαeα’]=0: 独立性 • eαの分散はすべて等しい:E[eα2]=σ2: 等分散性 • Eαは N(0, σ2) に従う。: 正規性予測誤差の平方和を最小にするように、係数を求める。係数に関する連立方程式を正規方程式という。

  32. 分散・共分散行列

  33. 8.3 分散分析 -回帰の有意性 全変動(分散)=残差変動 + 回帰による変動

  34. 重回帰の分散分析表 F は a1=a2=….=0 の帰無仮説のもとで、自由度(p, n-p-1) の F 分布となる。(全体として回帰式が意味があるかどうかの検定となる)

  35. 8.4 重相関係数と決定係数

  36. R2を寄与率または決定係数という回帰で全分散が説明できる割合。R2を寄与率または決定係数という回帰で全分散が説明できる割合。 F検定が R2の有意性検定と一致。 • 重回帰の注意点 • ai の値そのもので寄与は決まらない。 • Xiと Xjに相関があるとき、注意。単回帰と符号さえ変わる。

More Related