1 / 55

Gliederung

1. Einführung 2. Anwendungsvoraussetzungen und –empfehlungen 3. Einfaktorielle Varianzanalyse 4. Zweifaktorielle Varianzanalyse 5. Erweiterungen der Varianzanalyse. Gliederung.

avinoam
Télécharger la présentation

Gliederung

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1. Einführung 2. Anwendungsvoraussetzungen und –empfehlungen 3. Einfaktorielle Varianzanalyse 4. Zweifaktorielle Varianzanalyse 5. Erweiterungen der Varianzanalyse Gliederung

  2. Die Varianzanalyse untersucht die Wirkung, aber nicht die Stärke, ein (oder mehrerer) unabhängiger Variablen auf ein (oder mehrerer) abhängiger Variablen. Unabhängige Variable muss mindestens nominal skaliert sein. Abhängige Variable muss metrisch sein. Unabhängige Variablen = Faktoren Ausprägungen der unabhängigen Variablen = Faktorstufen 1. Einführung

  3. Zahl der abhängigen Variablen Zahl der unabhängigen Variablen Bezeichnung des Verfahrens 1 1 Einfaktorielle Varianzanalyse 1 2 Zweifaktorielle Varianzanalyse 1 3 Dreifaktorielle Varianzanalyse usw. Mindestens 2 Ein oder mehrere Mehrdimensionale Varianzanayse 1. Einführung

  4. 1. Einführung • Wichtigstes Analyseverfahren zur Auswertung von Experimenten • Beispiele: - Einfluss unterschiedlicher Diäten auf das Körpergewicht - Einfluss unterschiedlicher Düngemittel auf Ernteertrag - Bei Experimenten: Vergleiche von Experimental- und Kontrollgruppen

  5. 2. Anwendungsvoraussetzungen und- empfehlungen • Daten mit bestimmten Skalenniveau • Normalverteilung • Varianzhomogenität, d.h. die Varianz der Beobachtungswerte ist annähernd gleich. • Theoretische Frage, die durch die Varianzanalyse beantwortet werden soll, darf sich nicht erst aus den Daten ergeben.

  6. 2. Anwendungsvoraussetzungen und- empfehlungen • Stichprobe sollte Grundgesamtheit repräsentieren. • Additivität, d.h. Einfluss der unabhängigen Variable auf die Ergebnisvariable ist unabhängig von dem Einfluss einer Störvariablen auf die Ergebnisvariable. • Die Faktoren müssen verschieden sein.

  7. 3. Einfaktorielle Varianzanalyse 3. Einfaktorielle Varianzanalyse • Beispiel: • Wie wirkt sich die Anzahl der Praktika auf das Einkommen der ersten Tätigkeit nach dem Studium aus? Studiengänge: WiWi, Masch, EW • (Verwendung des „Hochschulgesamtdatensatzes_2003-2004pur.sav“) 1 abhängige Variable Höhe des Einkommens der ersten Tätigkeit • 1 unabhängige Variable (=Faktor) • Anzahl der Praktika gruppiert • 3 Stufen: • - kein Praktikum • - 1 - 2 Praktika • - 3 – 5 Praktika

  8. 3. Einfaktorielle Varianzanalyse • Normalverteilung 0,363 > 0,05

  9. 3. Einfaktorielle Varianzanalyse 0,074 > 0,05

  10. 3. Einfaktorielle Varianzanalyse kein Praktikum: Mittelwerte 1-2 Praktika: 3-5 Praktika: Gesamtmittelwert:

  11. 3. Einfaktorielle Varianzanalyse

  12. 3. Einfaktorielle Varianzanalyse • Sind die Unterschiede der Einkommensmittelwerte auf die Anzahl der Praktika zurückzuführen? • Es gibt Unterschiede zwischen den Mittelwerten, d.h. es gibt einen Einfluss der Anzahl der Praktika auf das Einkommen • ABER: Die von den Absolventen angegebenen Werte (= Beobachtungswerte) streuen um die Mittelwerte der Faktoren -> Diese Streuung ist auf andere Einflüsse nicht auf die Anzahl der Praktika zurückzuführen.

  13. Einkommen in € nicht erklärte Abweichung 2.423,00 erklärte Abweichung 2.073,54 erklärte Abweichung 1.630,01 nicht erklärte Abweichung 1 - 2 3 - 5 3. Einfaktorielle Varianzanalyse Anzahl der Praktika …Mittelwert der Beobachtungswerte einer Faktorstufe (g); In der Grafik sind die Mittelwerte der Stufen 2 und 3 angegeben …Beobachtungswert; g= Faktorstufe, k= Nummer des Beobachtungswert innerhalb der Faktorstufe

  14. 3. Einfaktorielle Varianzanalyse • Grundlage des Verfahrens ist die Zerlegung der Gesamtvarianz in eine Varianz innerhalb der Gruppen und in eine Varianz zwischen den Gruppen Gesamtabweichung = Erklärte Abweichung + Nicht erklärte Abweichung Summe der quad-rierten Abweichungen zwischenden Faktor-stufen Summe der quadrierten Abweichungen innerhalbder Faktorstufen Summe der quad-rierten Gesamt-abweichungen

  15. 3. Einfaktorielle Varianzanalyse Abweichungsquadrate Zwischen den Gruppen: 44798886,31 = Innerhalb der Gruppen: 413414411,68 = Gesamt: 458213297,99 =

  16. 3. Einfaktorielle Varianzanalyse Freiheitsgrade: Zwischen: k – 1 hier: 3 – 1 = Innerhalb: n – k hier: 351 – 3 =

  17. 3. Einfaktorielle Varianzanalyse Bestimmung der Mittel der Quadrate:

  18. 3. Einfaktorielle Varianzanalyse Der empirische F-Wert

  19. 3. Einfaktorielle Varianzanalyse Prüfung der statistischen Unabhängigkeit • In Worten: • Nullhypothese: bezüglich des Einkommens bestehen keine Unter- schiede in der Wirkung durch die Anzahl der Praktika • Alternativhypothese: Unterschiede sind vorhanden • Die Prüfung erfolgt nun anhand des Vergleichs von empirischen mit dem theoretischen F-Wert. • Der theoretische F-Wert ist abzulesen in der F-Werte-Tabelle für das jeweilige Signifikanzniveau (Im Beispiel stets 5 %), mit Hilfe der Freiheitsgrade.

  20. 3. Einfaktorielle Varianzanalyse Prüfung der statistischen Unabhängigkeit -> Nullhypothese wird verworfen • Im Beispiel wird die Nullhypothese auch verworfen, d.h. die Anzahl der Praktika haben einen unterschiedlichen Einfluss auf das Einkommen. • Bei SPSS ist diese aufwendige Berechnung unnötig, da hier automatisch die Prüfung der statistischen Unabhängigkeit erfolgt. • 0,000 < 0,05 -> Nullhypothese wird verworfen

  21. 3. Einfaktorielle Varianzanalyse • Da die Nullhypothese verworfen wurde und sich das Einkommen signifikant hinsichtlich der Mittelwerte der Anzahl der Praktika unterscheidet, stellt sich nun die Frage: • Welche von den Mittelwerten sich paarweise voneinander unterscheiden? Bzw. • Welche Anzahl von Praktika ist für diese Signifikanz verantwortlich? • Dazu verwendet man Post-hoc-Tests.

  22. 3. Einfaktorielle Varianzanalyse • Post-hoc-Test • SPSS bietet verschiedene Tests an • Im Folgenden soll der Scheffé -Test angewendet werden:

  23. 3. Einfaktorielle Varianzanalyse • Post-hoc-Test • Nur die Gruppe „1 - 2 Praktika“ unterscheidet sich signifikant von den anderen Gruppen • Die Abweichung zwischen den Gruppen „Kein Praktikum“ und „3 - 5 Praktika“ ist nicht signifikant -> offenbar zufällige Abweichungen

  24. 4. Zweifaktorielle Varianzanalyse4.1. Problemformulierung • Überprüfung, wie eine abhängige Variable von 2 unabhängigen Variablen ( = Faktoren) beeinflusst wird • Varianzanalyse lässt sich auch mit 2 oder mehr Faktoren und einer metrischen abhängigen Variable durchführen  Untersuchungsanordnung heißt faktorielles Design • Faktor „A“ hat G Stufen und „B“ hat H Stufen  insgesamt ergeben sich G x H Faktorstufenkombinationen • zweifaktorielle Varianzanalyse erlaubt die Erfassung des gleichzeitigen Wirksamwerdens zweier Faktoren, indem das Vorliegen von Wechselwirkungen (Interaktionen) getestet wird

  25. 4.2. Analyse der Abweichungsquadrate Gesamtstreuung (SSt) Streuung zwischen Streuung innerhalb der den Gruppen (SSb) Gruppen (SSw) Streuung durch Streuung durch Streuung durch Faktor A (SSA) Faktor B (SSB) Wechselwirkung von A und B (SSAxB)

  26. 4.2. Analyse der Abweichungsquadrate daraus folgt: SSt = SSb + SSw SSb = SSA + SSB + SSAxB  SSt = SSA + SSB + SSAxB + SSw

  27. 4.2. Analyse der Abweichungsquadrate kombinierte Wirkung der Faktoren auf 1 Zelle setzt sich zusammen aus • Gesamtmittelwert μ • Wirkung αg • Wirkung βh • Interaktionswirkung (αβ)gh  yghk = μ + αg + βh + (αβ)gh + εghk yghk = Beobachtungswert μ = Mittelwert der Grundgesamtheit αg = tatsächlicher Einfluss des Faktors A βh = tatsächlicher Einfluss des Faktors B (αβ)gh = tatsächlicher Interaktionseffekt zwischen der g-ten Stufe von α und der h-ten Stufe von β εghk = Zufallseffekt durch nicht im Experiment kontrollierte Einflüsse

  28. 4.2. Analyse der Abweichungsquadrate Gesamtstreuung: • um Einfluss der verschiednen Objekte zu überprüfen, zerlegen wir die Gesamtstreuung in die durch die jeweiligen Effekte erklärte Streuung und die nicht erklärte Reststreuung G H K _  SSt = ∑ ∑ ∑ (yghk – y)² g=1 h=1 k=1

  29. 4.2. Analyse der Abweichungsquadrate Quadratsummen der Haupteffekte: • die isolierten Effekte von Faktor A und B, die man auch als Haupteffekte bezeichnet, errechnen sich aus den Abweichungen des Zeilen- bzw. Spaltenmittel vom Gesamtmittel G _ _ SSA = H * K * ∑ (yg – y)² g=1 H _ _ SSB = G * K * ∑ (yh – y)² h=1 G = Zahl der Ausprägungen des Faktors A H = Zahl der Ausprägungen des Faktors B K = Zahl der Elemente in Zelle (g, h) yg = Zeilenmittelwert yh = Spaltenmittelwert

  30. 4.2. Analyse der Abweichungsquadrate Interaktionseffekt: G H _ ^ SSAxB = K * ∑ ∑ (ygh – ygh)² g=1 h=1 K = Zahl der Elemente in Zelle (g, h) G = Zahl der Ausprägungen des Faktors A H = Zahl der Ausprägungen des Faktors B ygh = Mittelwert in Zelle (g, h) (Schätzwert mit Interaktion) ^ ygh = Schätzwert (ohne Interaktion) für Zelle (g,h) ^ • Schätzwert ygh ist der Wert, der für die Zelle (g,h) zu erwarten wäre, wenn keine Interaktion vorläge ^ _ _ _ ygh = yg + yh - y  Abweichung des tatsächlich beobachteten Mittelwertes von diesem ^ Schätzwert ygh ergibt ein Maß für den Interaktionseffekt

  31. 4.2. Analyse der Abweichungsquadrate Reststreuung: • „Streuung innerhalb der Zellen“ G H K _ SSw = ∑ ∑ ∑ (yghk – ygh)² g=1 h=1 k=1

  32. 4.2. Analyse der Abweichungsquadrate Freiheitsgrade: (= die um 1 verminderte Anzahl der Faktorstufen) dfA = G – 1 dfB = H – 1 dfAxB = (G – 1) (H – 1) dfw = G * H * (K – 1) dft = G * H * K – 1 dfb = G * H – 1 dft = dfA + dfB + dfAxB + dfw

  33. 4.2. Analyse der Abweichungsquadrate Varianzschätzungen: • Quadratsummen durch Freiheitsgrade dividieren σ A² = SSA dfA bei σ B², σ W² usw. analog

  34. 4.3. Prüfung der statistischen Unabhängigkeit Hypothesen • zweifaktorielle Varianzanalyse überprüft 3 verschiedene Nullhypothesen: - die unter den Stufen des Faktors A beobachteten Untersuchungseinheiten gehören Grundgesamtheiten mit den gleichen Mittelwerten an (Ho: μ1 = μ2 = … = μg) - die unter den Stufen des Faktors B beobachteten Untersuchungseinheiten gehören Grundgesamtheiten mit den gleichen Mittelwerten an (Ho: μ1 = μ2 = … = μh) - die Zellenmittelwerte der Faktorstufenkombinationen μgh setzen sich additiv aus den Haupteffekten zusammen (Ho: μgh = μg + μh - μ) oder kurz. zwischen den beiden Faktoren besteht keine Interaktion  Nullhypothese: Es gibt keinen Unterschied in den Mittelwerten der Faktor- bzw. Interaktionsstufen • Alternativhypothese H1: Mittelwerte nicht gleich

  35. 4.3. Prüfung der statistischen Unabhängigkeit Signifikanztests: • Nullhypothesen werden geprüft, indem die Varianzen durch die Fehlervarianz geteilt wird und so die F – Werte ermittelt werden  ist empirischer F – Wert größer als kritischer wird Nullhypothese auf dem 1 oder 5% - Niveau verworfen _ _ σ A² = ∑ (yg - y)² / (G – 1) FA = σ A² / σ w²  FB und FAxB analog • kritischer F – Wert: kann einer Tabelle entnommen werden

  36. 4.3. Prüfung der statistischen Unabhängigkeit Varianzaufklärung: • Ermittlung des prozentualen Anteils der Variation in der abhängigen Variablen der auf die beiden Haupteffekte und die Interaktion zurückgeführt werden kann Faktor A: η = SSA / SSt * 100%  analog für B und AxB

  37. 4.4. Post – hoc – Test • Welche Faktorstufen unterscheiden sich im Fall einer signifikanten Wirkung des Faktors (z.B. A) im Einzelnen voneinander?  z.B.: mit Scheffé – Test

  38. b1 b2 a2 a1 b1 b2 a1 a2 4.5. Grafische Analyse • Ordinale Interaktionen  beide Haupteffekte eindeutiginterpretierbar

  39. b1 b2 a1 a2 4.5. Grafische Analyse • Hybride Interaktionen  Haupteffekt B ist eindeutig interpretierbar; Faktor A sollte nicht interpretiert werden a1 a2 b1 b2

  40. b1 b2 a1 a2 b1 b2 4.5. Grafische Analyse • Disordinale Interaktionen beide Haupteffekte für sich inhaltlich bedeutungslos; Unterschiede zwischen a1 und a2 nur in Verbindung mit den Stufen des Faktors B und Unterschiede zwischen b1 und b2 nur in Verbindung mit den Stufen des Faktors A interpretierbar a1 a2

  41. 5. Ausgewählte Erweiterungen der Varianzanalyse 1.)Ungleich besetzte Zellen • am Prinzip der Streuungszerlegung ändert sich nichts • Gewichtung der einzelnen Beobachtungswerte! • bei ungleichen Zellenumfängen: Schätzung des harmonischen Mittels aller Zellenumfänge oder allgemeines lineares Modell verwenden

  42. 5. Ausgewählte Erweiterungen der Varianzanalyse 2.) Mehrere Faktoren • Einbeziehung von mehr als zwei Faktoren in die Analyse • dreifaktorielle Varianzanalyse: keine Unterschiede zur zweifaktoriellen Varianzanalyse • Aber: zwei Ebenen verschiedener Wechselwirkungen möglich  es gibt Wechselwirkungen zwischen jeweils 2 Faktoren und zusätzlich zwischen allen 3 Faktoren

  43. 5. Ausgewählte Erweiterungen der Varianzanalyse 3.) Multiple Tests • mit multiplen Tests man erhält Auskunft darüber, welche Faktorstufen voneinander abweichen, wenn man mittels F – Tests die Nullhypothese ablehnt • Vergleich einzelner Paare von Mittelwerten oder linearen Kombinationen von Mittelwerten möglich

More Related