1 / 15

Statistik

Statistik. Statistik I. Seminar + Blockveranstaltung. Statistik. Sitzung. Thema. Inhalt. (1) 21.10.04. Einführung.  Formalia / Bekanntgabe des Seminarplans  Begriffe: deskriptive bzw. inferente Statistik; Grundgesamtheit, Stichprobe

Télécharger la présentation

Statistik

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistik Statistik I Seminar + Blockveranstaltung

  2. Statistik Sitzung Thema Inhalt (1) 21.10.04 Einführung •  Formalia / Bekanntgabe des Seminarplans •  Begriffe: deskriptive bzw. inferente Statistik; Grundgesamtheit, Stichprobe •  Gütekriterien quantitativer empirischer Untersuchungen: Validität, Reliabilität, Repräsentativität • Ablaufschema empirischer Erhebungen • Variablen, Variablenwerte (Ausprägungen) • diskrete (= endliche) und stetige (= reelle Zahlen) Variablen (2) 28.10.04 Skalen, Häufigkeiten, Lageparameter • Skalen / Messniveaus; zulässige mathematische Operationen: • Umwandlung von Skalenniveaus: Dichotomien; Dichotomisierung von Variablen •  Verteilungen: Uni- bzw. bimodale Verteilungen, Symetrie / Schiefe •  Lageparameter: Modus, Median / Quantile, arithmetisches Mittel (3) 04.11.04 Methodische Grundlagen  Grundlagen standardisierter Befragungen  Range (Spannweite); Quartilsabstand  mittlere Abweichung; Varianz / Standardabweichung (-) 11.11.04 (4) 18.11.04 Einführung SPSS  Einführung in die Programmstruktur von SPSS  Codierung von Variablen und Items in SPSS  Darstellung in Diagrammen (6) 25.11.04 Zusammen-hangsmaße I  Zusammenhangsmaße metrischer Daten: Pearson’s r  Zusammenhangsmaße dichotomer Daten; Cramer’s v (7) 02.12.04 Zusammen-hangsmaße II  Zusammenhangsmaße ordinalskalierter Daten  Zusammenhangsmaße nominalskalierter Daten  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße (8) 09.12.04 Arbeiten mit SPSS  Klassifizierung mit SPSS  Diagrammdarstellung mit SPSS  Lage- und Streuungsmaße mit SPSS  Zusammenhangsmaße mit SPSS (9) 16.12.04 Arbeiten mit SPSS  Kennwert raum-zeitlicher Veränderung / Lokalisationskoeffizient  Datenimport in SPSS  Datenexport aus SPSS / Darstellungen mit Excel und ArcView

  3. Statistik Sitzung Thema Inhalt (5) 25.11.04 Standardisierung Korrelation  Standardisierung von Variablen (Z-Transformation) / Skaleneffekte  Berechnung von statistischen Zusammenhangen metrischer Variablen: Produkt- Moment-Korrelationskoeffizient (Pearson’s r) (6) 02.12.04 Arbeiten mit SPSS  Lage- und Streuungsmaße mit SPSS  Diagrammdarstellung mit SPSS  Zusammenhangsmaße mit SPSS (7) 09.12.04 Arbeiten mit SPSS  Arbeiten mit klassifizierten Daten; Gewichtung  Variablenberechnung  Interpretation von Zusammenhängen (8) 16.12.04 Zusammen-hangsmaße II  Wiederholung  Typen von Zusammenhängen  Erwartungswerte: ² Test / auf ² basierende Zusammenhangsmaße  Zusammenhangsmaße für nicht metrisch skalierte Variablen (Kontingenzkoeffizient)

  4. Korrelationen Korrelationsanalyse / Wiederholung • Messen der Stärke eines statistischen Zusammenhangs zwischen zwei Variablen • Korrelationskoeffizienten geben in einem Wertebereich zwischen 0 und 1 diese Stärke an: • < 0,2 sehr geringe Korrelation • 0,2 – 0,5 geringe Korrelation • 0,5 – 0.7 mittlere Korrelation • 0,7 – 0,9 hohe Korrelation • > 0,9 sehr hohe Korrelation • Korrelationskoeffizienten für rangskalierte und metrische Variablen geben zusätzlich Auskunft über die Richtung des statistischen Zusammenhangs (Vorzeichen): + –

  5. Typen Zusammenhänge Y X einfacher einseitiger Zusammenhang: einfache lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation  Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) X1 Y X2 mehrfacher einseitiger Zusammenhang: multiple lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab X3 X1 X4 Y X2 mehrfacher mehrschichtiger Zusammenhang: Pfadanalyse Verdunstung (Y) hängt von der Lufttemperatur (X1), Albedo (X2) und Luftfeuchte (X3) ab, Lufttemperatur (X1) und Albedo (X2) hängen zudem von der Sonneneinstrahlung (X4) ab X3 ? Z Y X vermeintlicher Zusammenhang (Scheinkorrelation): Partielle Korrelation  Beispiel: In einer polnischen Studie konnte nachgewiesen werden, dass die Geburtenraten (Y) statistisch abhängig von der Anzahl der vor Ort brütenden Störche (X) ist. Tatsächlich hängen beide Variablen aber von der Bevölkerungsdichte (Z) ab Typen statistischer Zusammenhänge

  6. Übersicht -> r Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1) ja Übersicht über die gängigen Korrelationskoeffizienten

  7. Pearson Pearson-Korrelationskoeffizient r – Streudiagramm Formel zur Berechnung von rauf der Basis standardisierter (z-transformierter) Werte: • Voraussetzungen für die Anwendung: der Zusammenhang zwischen den eingehenden Variablen muss i.w.S. linear sein und die Variablen müssen jeweils hinreichend normalverteilt sein • Darstellung: mit zunehmendem Anteil an Einpersonenhaushalten je Stadtteil nehmen tendenziell auch die Stimmenanteile für die Grünen zu (“+”-Richtung)

  8. Übersicht -> c Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1) ja Übersicht über die gängigen Korrelationskoeffizienten

  9. Beispiel c Kontingenzkoeffizient C – Kreuztabelle • Stadteile mit geringem Anteil an Einpersonenhaushalten weisen überwiegend geringe Stimmenanteile für die Grünen auf • Stadtteile mit mittlerem Anteil an Einpersonenhaushalten weisen überwiegend mittlere Stimmenanteile für die Grünen auf • Stadtteile mit hohem Anteil an Einpersonenhaushalten weisen überwiegend hohe Stimmenanteile für die Grünen auf •  Offenkundig ist ein statistischer Zusammenhang zwischen den Variablen vorhanden

  10. Erwartungswerte 24 24 / 98 Kontingenzkoeffizient C – Erwartungswerte berechnen • Erwartungswerte THik basieren auf der Hypothese, dass zwischen den Variablen kein statistischer Zusammenhang besteht  Erwartungswerte pro Tabellenfeld stellen für diesen Fall die theoretisch zu erwartende Besetzungshäufigkeit dar • Exemplarisches Berechungsbeispiel: • ( ) = 5,877 • Allgemeine Berechnung: Summe Zeile i• (Summe Spalte k / n) = THik

  11. Chi-Quadrat • Chi-Quadrat stellt eine Prüfgröße dar, die als Summe der quadratischen Abweichungen der Beobachtungswerte Hik von den Erwartungswerten THik je Tabellenfeld definiert wird: Kontingenzkoeffizient C – Chi-Quadrat (χ2) berechnen • Exemplarisches Berechnungsbeispiel: χ2 = ((10–5,9)2 / 5,9) + ((6 – 6,1)2 / 6,1) + ((5 – 6,1)2 / 6,1) + ((3 – 5,9)2 / 5,9) + … + ((19 – 5,9)2 / 5,9) = 64,52

  12. Kontingenzkoeffizient • Berechnung des Kontingenzkoeffizienten C mit Hilfe von χ2: Kontingenzkoeffizient C • Der Kontingenzkoeffizient erlaubt nur Aussagen über die Stärke eines statistischen Zusammenhangs, nicht aber über die Richtung dieses Zusammenhangs •  Durch den Einsatz der Korrelationskoeffizienten nach Spearman oder Kendall für rang- skalierte Variablen sind im vorliegenden Fall auch Aussagen über die Richtung möglich

  13. Redskins Montag 1. November 2004, 01:43 Uhr Football-Niederlage der Redskins als gutes Omen für Kerry Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr 1936 - drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen. Im Jahr 2000 gewannen die Redskins ihr letztes Heimspiel vor der Wahl - danach löste der Republikaner Bush den Demokraten Bill Clinton ab. «Oh ja, er wird gewinnen», sagte Kerry-Anhänger Darren Sharper von den Green Bay Packers. «Das ist garantiert. Ich muss jetzt nicht mehr wählen gehen. Das hat mir am Dienstag einen Weg gespart.» Während der Football somit eine klare Wahlaussage getroffen hat, sieht das beim Baseball ganz anders aus. Hier stehen die gerade gekürten Meister, die Red Sox aus Kerrys Heimatstaat Massachusetts im Blickpunkt. Klub-Eigentümer John Henry und Tom Werner sowie Manager Theo Epstein haben sich im Wahlkampf auf die Seite des Demokraten gestellt und traten sogar bei einer Kundgebung mit Kerry auf. Doch der wichtigste Mann der Verteidigung bei den Red Sox, der «Pitcher» (Werfer) Curt Schilling, wirbt für Bush. Teamsprecher Charles Steinberg bemüht sich um Schadensbegrenzung: «Wir sind große Unterstützer der Meinungsfreiheit.» Gerüchte, wonach die Klub-Leitung auf Schilling einwirken wollte, seien in keiner Weise zutreffend.

  14. Redskins / Werterwartung  Trotz Heimniederlage der Redskins hat John Kerry die Wahl verloren Statistische und sachliche Zusammenhänge Football-Niederlage der Redskins als gutes Omen für Kerry (01.11.2004) Landover/USA (AP) Wenn es nach den amerikanischen Football-Ergebnissen geht, hat George W. Bush die Präsidentschaftswahl schon so gut wie verloren. In dem mit Spannung erwarteten Spiel der Washington Redskins gegen die Green Bay Packers musste der Klub am Sonntag eine 14:28-Niederlage hinnehmen. Wenn die Redskins ihr letztes Heimspiel vor der Wahl verloren haben, hat seit 68 Jahren jedes Mal der Herausforderer gewonnen. Umgekehrt konnte die Partei des amtierenden Präsidenten die Wahl nur dann für sich entscheiden, wenn die Redskins erfolgreich waren. So war es schon bei der Wiederwahl von Franklin Roosevelt im Jahr 1936 - drei Jahre zuvor waren die Redskins aus den Boston Braves hervorgegangen.  Es besteht ein hoher statistischer, allerdings zweifelhafter sachlicher Zusammenhang, die Wahrscheinlichkeit eines statistischen Zufalls ist sehr hoch

  15. Statistik Korrelationskoeffizienten - Berechnung mit Hilfe von SPSS • Kontingenzkoeffizient c • Erzeugung einer Kreuztabelle mit Beobachtungs- und Erwartungswerten • Berechnung des Koeffizienten: “Analysieren – Deskriptive Statistiken – Kreuztabellen (Statistik …)” • Pearson-Korrelationskoeffizient r • Z-Transformation (Standardisierung) der eingehenden Variablen und Anwendung der Berechnungsformel • Berechnung des Koeffizienten: “Analysieren – Korrelation – Bivariat …” • Spearman-Korrelationskoeffizient r / Kendall-tau • Berechnung der Koeffizienten: “Analysieren – Korrelation – Bivariat …” •  Kendall-tau weist hohe Stabilität bei Ausreißerwerten auf!

More Related