1 / 51

STATISIK

STATISIK. LV Nr.: 1375 SS 2005 10. März 2005. Normalverteilung. Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern. Normalverteilung.

thiery
Télécharger la présentation

STATISIK

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISIK LV Nr.: 1375 SS 2005 10. März 2005

  2. Normalverteilung • Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung • Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.

  3. Normalverteilung • Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt. • Additionstheorem der Normalverteilung: • Die Summe (X) von n unabhängig normalverteilten Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt. X = X1 + … + Xn • Der Erwartungswert von X ist die Summe der einzelnen Erwartungswerte μ1,…,μn E(X) = μ=μ1 + … + μn • Die Varianz von X ist die Summe der einzelnen Varianzen σ1²,…σn² Var(X) = σ² = σ1²+ … + σn²

  4. Stichproben • Aufgabe: Aussagen über Grundgesamtheit • Stichprobe (Kosten, Zeit, Möglichkeit) • Zufallsstichprobe (theoretisch fundierte Aussagen über Zuverlässigkeit der Ergebnisse sind möglich) • Quotenstichprobe (keine theoretisch fundierten Aussagen über die Zuverlässigkeit der Ergebnisse) • Stpr. heißt repräsentativ, wenn ein Schluss auf Grundgesamtheit erlaubt ist • Stichprobe „verkleinertes Abbild“ der Grundgesamtheit.

  5. Stichproben • Arithmetische Mittel der Stichprobe: • Varianz der Stichprobe: • Anteilswert P einer Stichprobe:

  6. Stichprobenverteilung • Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): • Zufallsvariable X1,…,Xn • Konkrete Realisation: x1,…,xn • Arithmetische Mittel: • Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)

  7. Stichprobenverteilung • Erwartungswert der Verteilung des arithmetischen Mittels: • Varianz der Verteilung des arithm. Mittels • Standardabweichung od. Standardfehler

  8. Stichprobenverteilung • Erwartungswert u. Varianz bekannt • Verteilung des arithm. Mittels? • Annahme: Grundgesamtheit ist N(μ,σ²)-vt. • Reproduktionseigenschaft der N-Vt: Summe von n unabhängig normal-vt. ZV ist wieder n-vt • Daher ist auch das arithm. Mittel normalverteilt

  9. Grenzwertsätze Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞) • Gesetz der Großen Zahlen • Satz von Glivenko-Cantelli • Zentraler Grenzwertsatz

  10. Grenzwertsätze • Gesetz der Großen Zahlen: • Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.

  11. Grenzwertsätze • Gesetz der Großen Zahlen: • Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.

  12. Grenzwertsätze • Satz von Glivenko-Cantelli: • Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.

  13. Grenzwertsätze • Zentraler Grenzwertsatz: • Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn). Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung (Φ … Vt-Fkt. der N(0,1) Vt.)

  14. Grenzwertsätze • Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n. • Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“. • Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.

  15. Stichprobenverteilung • Verteilung der Varianz S² der Stichprobe: • Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n) • Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.

  16. Stichprobenverteilung • Verteilung der Varianz S² der Stichprobe: • Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1 • Es gilt: • Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden. Anzahl der unabhängigen ZV, die Z² bilden, nennt man Anzahl der Freiheitsgrade.

  17. Stichprobenverteilung • χ²v Verteilung: • Erwartungswert: E(Z²)=v • Varianz: Var(Z²)=2v • Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.

  18. Stichprobenverteilung • Anteilswert P einer Stichprobe (P=X/n) • 2 Modelle: • Ziehen mit Zurücklegen • Ziehen ohne Zurücklegen • Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.

  19. Stichprobenverteilung • Ziehen mit Zurücklegen • Exakte Verteilung: Binomialverteilung Wahrscheinlichkeitsfunktion der ZV X: • Erwartungswert: E(X) = nθ • Varianz: Var(X) = nθ(1- θ)

  20. Stichprobenverteilung • Ziehen mit Zurücklegen • Erwartungswert des Stichprobenanteilswertes P: E(P) = 1/n E(x) = θ • Varianz des Stichprobenanteilswertes P: Var(P) = 1/n² Var(X) = θ(1- θ) / n • Standardfehler des Anteilswertes:

  21. Stichprobenverteilung • Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9) • Erwartungswert: E(P) = µ = nθ • Varianz: Var(P) = σP² = nθ(1- θ)

  22. Stichprobenverteilung • Ziehen ohne Zurücklegen • Exakte Verteilung: Hypergeometrische Vt. • Wahrscheinlichkeitsfunktion der ZV X: • Erwartungswert: E(X) = n M/N • Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)

  23. Stichprobenverteilung • Ziehen ohne Zurücklegen: • Erwartungswert des Stichprobenanteilswertes: E(P) = 1/n E(X) = θ • Varianz des Stichprobenanteilswertes: Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1) • Standardfehler des Anteilswertes: • Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)

  24. Stichprobenverteilung • Approximation durch Normalverteilung µ = E(P) = θ σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)

  25. Stichprobenverteilung • Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.

  26. Stichprobenverteilung • Differenz zweier arithmetischer Mittel: • Annahmen: • 2 unabhängige Stichproben • Beide Grundgesamtheiten sind annähernd N-vt • Stichprobenverteilung der Differenz: N-Vt • Erwartungswert: • Varianz:

  27. Stichprobenverteilung • Differenz zweier Anteilswerte: • Annahmen: • 2 unabhängige Stichproben • P1,P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist. • Stichprobenverteilung: N-Vt • Erwartungswert: • Varianz:

  28. Stichprobenverteilung • Quotient zweier Varianzen: • Annahmen: • 2 unabhängige Stichproben (n1, n2) • σ1² und σ2² aus n-vt Grundgesamtheiten • Quotient:

  29. Stichprobenverteilung • Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt: • Erwartungswert: E(F) = v2 / (v2-2) • Varianz:

  30. Schätzverfahren • Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) • Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) • Unterscheidung: • Punktschätzer (einziger Schätzwert) • Intervallschätzer (Konfidenzintervall)

  31. Schätzverfahren • Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. • Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μdurch das arithm. Mittel der Stichprobe • Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.

  32. Schätzverfahren • Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). • Irrtumswahrscheinlichkeit ≤α • Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)

  33. Schätzverfahren • Ges: Konfidenzintervall für das arithm. Mittel: ZV • Symmetrische Wahrscheinlichkeitsintervall • Symmetrie: z(α /2) = –z(1-α/2) daher: z = –z(1-α/2) und –z = z(α /2) und

  34. Schätzverfahren • In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. • Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. • Varianz σ² der Grundgesamtheit bekannt • Varianz σ² der Grundgesamtheit unbekannt

  35. Schätzverfahren • Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: Konkreter Stichprobenmittelwert

  36. Schätzverfahren • Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: • Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. • Zufallsvariable: T ist t- verteilt mit v=n-1 Freiheitsgraden

  37. Verteilungen • Es gilt: • Ist T der Quotient einer Standardnormalverteilung und der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden. • Zufallsvariable: T ist t- verteilt mit v=n Freiheitsgraden T~tn • t-Verteilung ist symmetrisch

  38. Verteilungen • t-Verteilung mit v Freiheitsgraden: • Erwartungswert (für n>1): E(T) = 0 • Varianz (für n>2): Var(T) = n / (n-2) • Für n→∞ geht die t-Verteilung in die N(0,1) über. • Approximation durch N(0,1)-Vt für n ≥ 30

  39. Schätzverfahren • Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz: • Wobei t = t(1-α/2);n-1= – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.

  40. Schätzverfahren • Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz: Konkreter Stichprobenmittelwert Konkrete Stichprobenvarianz

  41. Schätzverfahren • Konfidenzintervall für den Anteilswert: • Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP² • Standardisierte ZV:

  42. Schätzverfahren • Wahrscheinlichkeitsintervall: • Konfidenzintervall: • Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.

  43. Schätzverfahren • Konfidenzintervall für die Varianz • ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden • Wahrscheinlichkeitsintervall: • Konfidenzintervall:

  44. Stichprobenumfang • Bisher: • Geg: Stichprobenumfang n, Sicherheitsgrad 1-α • Ges: Konfidenzintervall • Jetzt: • Geg: Konfidenzintervall, Sicherheitsgrad 1-α • Ges: Stichprobenumfang • Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung • Breite des Konfidenzintervalls: 2Δμ

  45. Stichprobenumfang • Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

  46. Eigenschaften von Schätzern Eigenschaften von Schätzfunktionen: • Erwartungstreue • Effizienz • Konsistenz • Suffizienz

  47. Eigenschaften von Schätzern • Erwartungstreue • Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt. • Bedingung: • Es gilt:

  48. Eigenschaften von Schätzern • Effizienz: • Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist. • Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:

  49. Eigenschaften von Schätzern • Konsistenz: • Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.

  50. Eigenschaften von Schätzern • Suffizienz: • Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.

More Related