1 / 81

STATISIK

STATISIK. LV Nr.: 0028 SS 2005 6. Juni 2005. Varianzanalyse. Varianzanalyse od. ANOVA Frage: Hat ein Faktor Einfluss auf ein Merkmal? Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen Merkmal (durch Faktor beeinflusst): Metrische Größe. Varianzanalyse.

desma
Télécharger la présentation

STATISIK

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISIK LV Nr.: 0028 SS 2005 6. Juni 2005

  2. Varianzanalyse Varianzanalyse od. ANOVA • Frage: Hat ein Faktor Einfluss auf ein Merkmal? • Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen • Merkmal (durch Faktor beeinflusst): Metrische Größe

  3. Varianzanalyse Varianzanalyse • Einfache Varianzanalyse: Ein Faktor • Zweifache Varianzanalyse: Zwei Faktoren • …

  4. Varianzanalyse • Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. • Test, ob die Differenz der arithmetischen Mittel von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

  5. Varianzanalyse • Modellannahmen der Varinazanalyse: • Unabhängigkeit der Stichproben (i=1,…,r) • Normalverteilung der Merkmale mit µi und σi² • Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²

  6. Varianzanalyse • Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ H0: µ1 = µ2 = … = µ • Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ H1: mindestens zwei µi sind ungleich

  7. Varianzanalyse • Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)? • Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen). • Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

  8. Varianzanalyse • Modell der einfachen Varianzanalyse: • xij = µ + αi + eij • µ … Gesamtmittelwert • αi … Effekt auf der i-ten Ebene • eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene. eij = xij – µi = xij – (µ + αi)

  9. Varianzanalyse • Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit?

  10. Varianzanalyse Vorgehensweise: • Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen • Bestimmung der Abweichungen • Zerlegung der Abweichungsquadratsumme • Teststatistik und Testverteilung bestimmen • Entscheidung, Interpretation

  11. Varianzanalyse • Gesamtmittelwert über alle Faktorstufen r • Mittelwerte der r Faktorstufen

  12. Varianzanalyse • Beispiel: Drahtsorten

  13. Varianzanalyse • Abweichungen: Quadratsumme der Abweichungen (Sum of Squares) • Abweichungen der Beobachtungen vom Gesamtmittelwert. • Summe der Quadratischen Abweichungen • Bezeichnungen: SST (Total), SSG (Gesamt)

  14. Varianzanalyse • Sum of Squares: • Abweichungen der Beobachtungen der einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe. • Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität • Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).

  15. Varianzanalyse • Sum of Squares: • Abweichungen der Mittelwerte der einzelnen Messreihen vom Gesamtmittelwert. • Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors. • Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),

  16. Varianzanalyse • Quadratsummenzerlegung: • SST = SSB + SSW • Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.

  17. Varianzanalyse • Idee für Test: • Vergleich der Variation zwischen den Messreihen mit der Variation innerhalb der Messreihen • Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).

  18. Varianzanalyse • Teststatistik – Idee: • Aus den Beobachtungswerten werden zwei voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt. • Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich. • Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².

  19. Varianzanalyse • Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz): • Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)

  20. Varianzanalyse • Mittlere Quadratsummen (MSS = Mean Sum of Squares): • Quadratsummen dividiert durch entsprechende Freiheitsgrade • MSB und MSW sind erwartungstreue Schätzer der Varianz zwischen- und innerhalb der Messreihen.

  21. Varianzanalyse • Varianzanalysetafel (r Messreihen):

  22. Varianzanalyse Teststatistik: • F = MSB / MSW • F ~ F(r-1),(N-r) • Entscheidung: Ist F ≤ Fc, lehne H0 nicht ab (Fc = kritischer Wert der F-Verteilung mit (r-1) und (N-r) Freiheitsgraden).

  23. Varianzanalyse • Beispiel: Drahtsorten • Quadratsummenzerlegung: SST = SSB + SSW • 324,62 = 108,04 + 216,58 • Mittlere Quadratsummen: • MSB = 108,04 / (3-1) = 54,02 • MSW = 216,58 / (18-3) = 14,44 • Teststatistik: • F = MSB / MSW = 3,74 • Kritischer Wert der F2;15 Vt. 3,68 • Entscheidung: 3,74 > 3,68 => H0 ablehnen, d.h. es besteht ein signifikanter Unterschied zw. den Sorten

  24. Varianzanalyse • Zweifache Varianzanalyse: • 2 Faktoren (A und B, wobei r Faktorstufen bei A und p Faktorstufen bei B) • 1 metrische Variable • Unterscheidung: • Modell ohne Wechselwirkungen zw. den Faktoren • Modell mit Wechselwirkungen zw. den Faktoren

  25. Varianzanalyse • Modell ohne Wechselwirkungen zw. den Faktoren • xijk = µ + αi + βj + eijk (für i=1,…,r, j=1,…,p, k=1,…,n) • µ gemeinsamer Mittelwert • α, β Faktoreffekte • eijk zufällige Fehler

  26. Varianzanalyse • Mittelwerte: • Gesamt • Faktor A • Faktor B

  27. Varianzanalyse • Schätzer für Gesamtmittel und Effekte • Gesamtmittel • Effekt von Faktor A • Effekt von Faktor B

  28. Varianzanalyse • Quadratsummen • SSR = SST – SSE(A) – SSE(B)

  29. Varianzanalyse • Quadratsummenzerlegung • SST = SSE(A) + SSE(B) + SSR • Mittlere Quadratsummen: • MSE(A) = SSE(A) / (r-1) • MSE(B) = SSE(B) / (p-1) • MSR = SSR / (rpn-r-p+1)

  30. Varianzanalyse • Prüfgrößen und kritische Werte: • Faktor A: • F(A) = MSE(A) / MSR • Fr-1,(nrp-r-p+1);1-α • Faktor B: • F(B) = MSE(B) / MSR • Fp-1,(nrp-r-p+1);1-α

  31. Varianzanalyse • Beispiel: 2 Faktoren (Erreger, Antibiotikum)

  32. Varianzanalyse • Modell mit Wechselwirkungen zw. den Faktoren • xijk = µ + αi + βj + (αβ)ij + eijk (für i=1,…,r, j=1,…,p, k=1,…,n) • µ gemeinsamer Mittelwert • α, β Faktoreffekte • αβ Wechselwirkung • eijk zufällige Fehler

  33. Varianzanalyse • Mittelwerte: • Gesamt • Faktor A • Faktor B • Wechselwirkung

  34. Varianzanalyse • Gesamtmittel und Effekte • Gesamtmittel • Effekt von Faktor A • Effekt von Faktor B • Effekt der Wechselwirkung

  35. Varianzanalyse • Quadratsummen SSR = SST – SSE(A) – SSE(B) – SSE(AB)

  36. Varianzanalyse • Quadratsummenzerlegung • SST = SSE(A) + SSE(B) + SSE(AB) + SSR • Mittlere Quadratsummen: • MSE(A) = SSE(A) / (r-1) • MSE(B) = SSE(B) / (p-1) • MSE(AB) = SSE(AB) / (p-1)(r-1) • MSR = SSR / (rpn-r-p+1)

  37. Varianzanalyse • Prüfgrößen und kritische Werte: • Faktor A: • F(A) = MSE(A) / MSR • Fr-1, pr(n-1); 1-α • Faktor B: • F(B) = MSE(B) / MSR • Fp-1, pr(n-1); 1-α • Wechselwirkung: • F(AB) = MSE(AB) / MSR • F(p-1)(r-1), pr(n-1); 1-α

  38. Varianzanalyse • Beispiel: 2 Faktoren + Wechselwirkung

  39. Varianzanalyse • Beispiel: Varianzanalysetafel • Faktor Erreger: kein Effekt • Faktor Antibiotikum: Effekt • Interaktion: Effekt (impliziert, dass auch Faktor Erreger eine Wirkung hat).

  40. Varianzanalyse

  41. Nichtparametrische ANOVA • Kruskal-Wallis Test • Unterscheiden sich die Mittelwerte von p Messreihen (n1, …, np)? • Voraussetzungen: • Stetige Verteilung der Messreihen • Mindestens Ordinalskala • Setzt weder Normalverteilung, noch Varianzhomogenität voraus. • Hypothese: • H0: Mittelwerte der p Messreihen sind gleich • H1: Mittelwerte unterscheiden sich

  42. Nichtparametrische ANOVA • Vorgehensweise: • N Messwerten X11, …, Xpnp werden Rangzahlen rij zugewiesen. • Summe der Ränge der einzelnen Messreihen berechnen: • Bindungen (mehrere Messwerte sind gleich): Mittelwert der Ränge

  43. Nichtparametrische ANOVA • Prüfgröße: • g … Anzahl der verschiedenen Messwerte • t … wie oft tritt ein Messwert auf • Treten keine Bindungen auf, ist B = 1

  44. Nichtparametrische ANOVA • Entscheidung: • H0 ablehnen, wenn H > hp(n1,…,np);1-α • h … kritische Werte (Tabelle, z.B. Hartung S. 615) • Approximation durch χ²p-1,1-α Verteilung: • H0 ablehnen, wenn H > χ²p-1,1-α (Quantile der χ² Verteilung)

  45. Regressionsanalyse • Beziehung zwischen zwei oder mehr metrisch skalierten Merkmalen. • Art der Abhängigkeit bestimmen, mathematische Funktion, durch die sich die Abhängigkeit zwischen den Variablen am besten beschreiben lässt.

  46. Regressionsanalyse • Abhängige Variable (Regressand): Y • „zu erklärende Variable“ • Unabhängige Variable/n (Regressor): X • „erklärende Variable/n“ • Regressionsfunktion: Mathematische Funktion, die die Abhängigkeit zwischen den Variablen beschreibt. • Regression von Y auf X, Y=f(X).

  47. Regressionsanalyse • Art der Beziehung zw. den Variablen? • Welche Form hat die Regressionsfunktion? • Antworten darauf aus: • Theorie • Empirische Beobachtung, z.B. Punktwolke zeichnen, welche Funktion passt sich gut an die Punktwolke an? Durch welche Funktion lässt sich die Grundtendenz des Zusammenhangs darstellen?

  48. Regressionsanalyse • Punktwolke • Regressionsfunktion

  49. Regressionsanalyse • Lineare Regression: • Regressionsfunktion ist linear • Nichtlineare Regression: • Regressionsfunktion ist nicht linear

  50. Regressionsanalyse • Einfachregression: • Beziehung zwischen 2 Variablen • Regressand: Y • Regressor: X • Mehrfachregression = multiple Regression: • Beziehung zwischen 3 oder mehr Variablen • Regressand: Y • Regressoren: X1, X2, …, Xk

More Related