220 likes | 355 Vues
Statistik: 11.11.04. Konfidenzintervall und Testen für den Mittelwert und Anteile. Schließende Statistik. oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter ( m , p , etc.)
E N D
Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile
Schließende Statistik oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter (m, p, etc.) • Das Schätzen von Parametern: für den unbekann-ten Wert eines Parameters (m, p, etc.) ist zu bestimmen • ein numerischer Wert (Punktschätzer) oder • ein Intervall, in dem der unbekannte Wert mit vorgegebener Wahrscheinlichkeit enthalten ist (Konfidenzintervall) • Entscheidung zwischen Behauptungen (Hypothesen) PI Statistik, WS 2004/05 (8)
Beispiel A: Abfüllmenge • Der unbekannte Mittelwert μder Füllmenge soll geschätzt werden • Stichprobe (n = 25): = 126.7, s = 0.5. • Punktschätzer für μ ist • Konfidenzintervall für μ: ±c. • Testen von H0: μ = 126.4 gegen H1: μ > 126.4 PI Statistik, WS 2004/05 (8)
Beispiel B: Anteil der Berufstätigen unter Studierenden • Anteilθist unbekannt • Stichprobe (n = 200) gibt Anteil von p = 32% • Punktschätzer fürθist p = 0.32 • Konfidenzintervall p ± c • Testen die Nullhypothese H0:θ= 0.20 gegen H1: µ >0.20 PI Statistik, WS 2004/05 (8)
Stichprobenverteilungen • Wahrscheinlichkeitsverteilungen von und p sind Basis von statistischen Entscheidungsverfahren • Zentraler Grenzwertsatz PI Statistik, WS 2004/05 (8)
Stichprobenmittelwert • Grundgesamtheit: X mit (beliebiger) Verteilung, und . • Stichprobenmittelwert : • Mittelwert von ist • Standardabweichung (Standardfehler, standard error) von ist StdAbw( ) = /n • Für nicht zu kleines n: ist näherungsweise normalverteilt PI Statistik, WS 2004/05 (8)
Konfidenzintervall für μ • Konfidenzintervall zur Konfidenzzahlγ • Mit γ = 0.95 c = 2/n genauer: c = 1.96 /n • 99.7%-iges KI:±3 /n • 90%-iges KI:±1.645/n PI Statistik, WS 2004/05 (8)
Beispiel A: Abfüllmenge • Stichprobe (n = 25): = 126.7, s = 0.5. • Punktschätzer für μ ist = 126.7 • 95%-iges Konfidenzintervall für μ: • Einsetzen gibt • oder: 126.5 ≤ m ≤ 126.9 PI Statistik, WS 2004/05 (8)
Konfidenzintervall: Wahl von c • Näherungsweise gilt • Wahl von c0 so, dass oder • Aus folgt und das 0.975-Perzentil c0 = 1.96 PI Statistik, WS 2004/05 (8)
100g%iges Konfidenzintervall für μ Symmetrisches Intervall um so, dass 100g% aller so konstruierten Intervalle das wahre m enthalten Wahl von z für gegebenes g : PI Statistik, WS 2004/05 (8)
Wahl des Stichprobenumfanges • Halbe Länge c des Konfidenzintervalls hängt ab von n, g und s • Bei Vorgabe von c und g kann n berechnet werden: n =(z(1+g)/2σ/c)2 PI Statistik, WS 2004/05 (8)
Unbekanntes s • Verwendung der t -Verteilung statt der standardisierten Normalverteilung • Student‘sche t -Verteilung: • hat einen Parameter (n-1), die „Zahl der Freiheitsgrade“ • tabelliert, in EXCEL: Funktionen TVERT, TINV • symmetrisch, glockenförmig • für wachsendes n der Normalverteilung immer ähnlicher PI Statistik, WS 2004/05 (8)
t -Verteilung: Perzentile p-Quantile der t -Verteilung für wachsende Zahl der Freiheitsgrade und der Normalverteilung PI Statistik, WS 2004/05 (8)
Test für μ Verfahren • Lege die Nullhypothese H0 (μ = μ0) und die Alternative H1 fest • Wähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit bezeichnet); z.B. 0.05 • Ziehe die Stichprobe, berechne • Berechne den p-Wert • Verwerfe H0, wenn der p -Wert kleiner als ist PI Statistik, WS 2004/05 (8)
Beispiel A: Abfüllmenge • Nullhypothese H0:μ= 125g • Alternative H1:μ> 125g • Die Entscheidung soll für a = 0.05 getroffen werden • Stichprobe (n = 9): = 126.0, s = 1.5 • Wir verwerfen H0! PI Statistik, WS 2004/05 (8)
Testen von Hypothesen • Methode, auf Basis einer Zufallsstichprobe eine Entscheidung zwischen zwei Behauptungen (Vermutungen) zu treffen • Nullhypothese H0: ist jene Vermutung, über die entschieden werden soll (z.B. m = 125) • Alternativhypothese: eine konkurrierende Vermutung • p -Wert: Wahrscheinlichkeit, den erhaltenen oder einen noch extremeren Wert für die Teststatistik zu erhalten, wenn H0 zutrifft; ein Maß für die Glaubwürdigkeit von H0 • Fehlentscheidungen: • Fehler 1. Art (a-Fehler): richtige H0 wird nicht akzeptiert; der p -Wert ist die Wahrscheinlichkeit, diesen Fehler zu begehen • Fehler 2. Art: zutreffende Alternativhypothese wird nicht akzeptiert • Signifikanzniveau a: maximal tolerierter p -Wert PI Statistik, WS 2004/05 (8)
Wahl der Alternativhypothese • Das, was ich „beweisen“ möchte • Beispiel: Abfüllmenge; H0: m=125g • Konsumentenschützer möchte erkennen, wenn m<125g; • er möchte ziemlich sicher sein, dass er recht hat, wenn er „m<125g“ behauptet • Test mit Signifikanzniveau a=0.05: er irrt höchstens in 5 von 100 Entscheidungen • Analog: Produzent möchte erkennen, wenn m>125g oder wenn m≠125g PI Statistik, WS 2004/05 (8)
Inferenz bei Anteilen • Schätzwert für Anteil aus Stichprobe (Umfang n): relative Häufigkeit pn • Stichprobenverteilung von pn (Zentraler Grenzwert-satz): • mit • Faustregel für „großes n'': n q > 5, n (1-q) > 5 PI Statistik, WS 2004/05 (8)
100g%iges Konfidenzintervall für q Symmetrisches Intervall um pn so, dass 100g% aller so konstruierten Intervalle das wahre q enthalten Wahl von z für gegebenes g : In sp ist q durch pn zu ersetzen! PI Statistik, WS 2004/05 (8)
Beispiel B: Berufstätige • Anteil derBerufstätigen unter den Studierendenθist unbekannt • Stichprobe (n = 200) gibt Anteil von p200 = 32% • Punktschätzer fürθist p = 0.32 • 95%-iges Konfidenzintervall für θ: oder: 0.255 ≤ θ ≤ 0.385 Achtung! nθ ≈ 200 (0.32) = 64 > 5, n(1-θ) ≈ 200 (0.68) = 136 > 5 PI Statistik, WS 2004/05 (8)
Beispiel B: Berufstätige • Nullhypothese H0:θ= 30% • Alternative H1:μ> 30% • Die Entscheidung soll für a = 0.05 getroffen werden • Stichprobe (n = 200): p200 = 0.32 • Wir verwerfen H0 nicht! Beachten Sie! PI Statistik, WS 2004/05 (8)