380 likes | 561 Vues
Wahrscheinlich-keitsrechnung. Wahrscheinlichkeit und relative Häufigkeit. Wahrscheinlichkeit, relative Häufigkeit. Ergebnisse medizinischer Behandlungen sind als „zufällige“ Ergebnisse zu verstehen. Die Angaben von Wahrscheinlichkeiten zielt dabei auf die Quantifizierung des Zufalls.
E N D
Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeit, relative Häufigkeit • Ergebnisse medizinischer Behandlungen sind als „zufällige“ Ergebnisse zu verstehen. • Die Angaben von Wahrscheinlichkeiten zielt dabei auf die Quantifizierung des Zufalls. • Ein fehlendes oder falsches Verständnis des Wahrscheinlichkeitsbegriffes führt zu Fehlinterpretationen (Beispiel Lebenserwartung von Tumorpatienten). • In der Praxis sind Wahrscheinlichkeiten nicht unmittelbar zugänglich. • Stattdessen beobachten wir lediglich Häufungen von Ereignissen. • Diese beschreiben wir mit absoluten und relativen Häufigkeiten.
Häufigkeiten für männliche und weibliche Neugeborene in 7 Kliniken
Häufigkeiten für männliche und weibliche Neugeborene in 7 Kliniken
Häufigkeiten für männliche und weibliche Neugeborene in 7 Kliniken
Häufigkeiten für männliche und weibliche Neugeborene in 7 Kliniken
Relative Häufigkeiten und Summenhäufigkeiten der männlichen Neugeborenen in 7 Kliniken
Wahrscheinlichkeit, relative Häufigkeit • Das Beispiel verdeutlicht, dass die „Schätzung“ der Wahrscheinlichkeit eines Ereignisses durch die relative Häufigkeit bzw. die relative Summenhäufigkeit immer genauer wird, je größer die Versuchsreihe wird (long run). • Dieser Zusammenhang wird das Gesetz der großen Zahlen genannt. • Im Beispiel geht man davon aus, dass Jungen mit der gleichen Wahrscheinlichkeit geboren werden wie Mädchen. • In diesem Fall wäre die Wahrscheinlichkeit 0,5. • Der Wert von 0,5 sollte sich idealerweise als relative Häufigkeit in „sehr großen“ Beobachtungsreihen ergeben.
Wahrscheinlichkeit, relative Häufigkeit • Diese implizite Definition der „Wahrscheinlichkeit“ führt dazu, dass sich für Wahrscheinlichkeiten Eigenschaften anlog zu denen der relativen Häufigkeiten formulieren lassen. • Offensichtlich ordnen wir Wahrscheinlichkeiten Zahlen im Bereich von 0 bis 1 bzw. 0% bis 100% zu. • Unwahrscheinlichen Ereignissen wird dabei eine Wahrscheinlichkeit nahe bei Null zugeordnet; das „sichere“ Ergebnis erhält die Wahrscheinlichkeit 1.
Additionsansatz • Beispiel: Wahrscheinlichkeit für ein nicht normalgewichtiges Neugeborenes: • Die Wahrscheinlichkeit lässt sich durch die Summe der Wahrscheinlichkeit für ein Neugeborenes unter 2.500 g plus der Wahrscheinlichkeit für ein Neugeborenes über 4.500 g berechnen. • Das gelingt, weil ein Kind nicht gleichzeitig unter 2.500 g und über 4.500 g schwer sein kann. • Man spricht von „unvereinbaren“ (disjunkten) Ereignissen. • Die obige additive Eigenschaft der Wahrscheinlichkeit beschreibt der Additionssatz: Wenn zwei Ereignisse disjunkt sind, so ergibt sich die Wahrscheinlichkeit für das Gesamtereignis als Summe der Wahrscheinlichkeiten der Einzelereignisse.
Multiplikationsansatz • Eine andere Eigenschaft der Wahrscheinlichkeit bezieht sich auf unabhängige Ereignisse. • Man nennt zwei Ereignisse unabhängig, wenn die Wahrscheinlichkeit für das gemeinsame Auftreten der Ergebnisse gleich dem Produkt der Wahrscheinlichkeit für die Einzelergebnisse ist.
Multiplikationsansatz • Beispiel: Wahrscheinlichkeit dafür, dass das ältere Kind einer Familie mit zwei Kindern ein Mädchen und das jüngere Kind ein Junge ist: • Für die Berechnung wird von einer Wahrscheinlichkeit von 0,5 für die Geburt eines Mädchens ausgegangen. • Betrachtung von 400 Familien (ohne Zwillinge) • Man darf erwarten, dass bei 200 Familien das erste Kind ein Mädchen ist. • Da das Geschlecht des ersten Kindes von dem des zweiten unabhängig ist, wird bei den 200 Familien, bei denen das ältere Kind ein Mädchen ist, in 50% (100 Familien) das jüngere Kind ein Junge sein. • Das gesuchte Geschwisterpaar (älteres Kind ein Mädchen, jüngeres Kind ein Junge) hat somit einen Anteil von 100 zu 400 oder eine Wahrscheinlichkeit von ¼. • Das entspricht aber auch der Wahrscheinlichkeit für einen Jungen multipliziert mit der Wahrscheinlichkeit für ein Mädchen: ½ • ½. • Die Menge der möglichen Ereignisse besteht nicht mehr aus dem Geschlecht „Junge“ oder „Mädchen“, sondern aus der Menge aller Zweier-Kombinationen „Junge – Mädchen“, wobei aufgrund der Reihenfolge – älteres und jüngeres Kind - die Kombinationen (Junge, Mädchen) und (Mädchen, Junge) unterschiedliche Ergebnisse darstellen.
Laplace-Experimente • Von besonderer Bedeutung sind Laplace-Experimente. • Wenn man annimmt, dass nur endlich viele Elementarereignisse möglich und alle gleichberechtigt sind, d. h. mit der gleichen Wahrscheinlichkeit eintreten (wie zum Beispiel beim Werfen einer idealen Münze, wo {Kopf} und {Zahl} jeweils die Wahrscheinlichkeit 0,5 besitzen), so spricht man von einem Laplace-Experiment. • Die Wahrscheinlichkeit eines Ereignisses wird durch den Quotienten aus der Anzahl der „günstigen“ und der Anzahl der „möglichen“ Ergebnisse bestimmen. Das Ereignis H = Hohe Augenzahl (5 oder 6) hat die Wahrscheinlichkeit 1/3.
Laplace-Experimente • Laplace-Experimente haben eine besondere Bedeutung bei der Stichprobenauswahl im Rahmen der Studienplanung. • Sollen beispielsweise im Rahmen einer epidemiologischen Studie Beobachtungen zu einer bestimmten Fragestellung auf Basis einer „repräsentativen“ Stichprobe gewonnen werden, so wählt man eine „Zufallsstichprobe“, bei der jede Person aus der zu betrachtenden Gesamtheit die gleiche Wahrscheinlichkeit hat, in die Stichprobe aufgenommen zu werden.
Wahrscheinlichkeitsbaum • Graphisch lässt sich im Falle endlich vieler möglicher Ergebnisse (Merkmalsausprägungen) das Wahrscheinlichkeitsmodell, das dem Experiment zugrunde liegt, durch eine Baumstruktur veranschaulichen. • Die Äste der Baumstruktur repräsentieren dabei die Übergangswahrscheinlichkeiten von einem Knoten zum anderen. Die Knoten repräsentieren Ereignisse. • Beispiel: Wahrscheinlichkeiten für die möglichen Kombinationen von Blutgruppen bei zwei Personen (Blutspender – Blutempfänger)
Wahrscheinlichkeitsbaum • Die Blutgruppen des AB0-Systems kommen in Mitteleuropa mit folgenden Wahrscheinlichkeiten vor (näherungsweise): P(A) = 9/20; P(0) = 8/20; P(B) = 2/20; P(AB) = 1/20 P(A) = 45/100; P(0) = 40/100; P(B) = 10/100; P(AB) = 5/100 P(A) = 0,45; P(0) = 0,4; P(B) = 0,1; P(AB) = 0,05 • Übung: Wahrscheinlichkeitsbaum für die möglichen Kombinationen von Blutgruppen bei einem Blutspender und einem Blutempfänger zeichnen und die Wahrscheinlichkeiten berechnen
Wahrscheinlichkeitsbaum • Für eine Blutbank ist das Ereignis - Empfänger und Spender haben die gleiche Blutgruppe - von Interesse. • „0“ ist Universalspender und „AB“ ist Universalempfänger. • Das Ereignis „verträgliche Blutgruppen“ liegt vor, wenn ein Spender Blutgruppe „0“, ein Empfänger Blutgruppe „AB“ oder Empfänger und Spender identische Blutgruppen aufweisen. • Übung: • Wahrscheinlichkeitsbaum für die möglichen Kombinationen von Blutgruppen bei einem Blutspender und einem Blutempfänger zeichnen. • Wahrscheinlichkeiten berechnen, z. B. Spender Blutgruppe „0“ und Empfänger Blutgruppe „AB“ usw. • Berechnung der Wahrscheinlichkeit, dass Spender und Empfänger verträgliche Blutgruppen haben.
p=0.05 p=0.1 p=0.4 p=0.45 Wahrscheinlich-keitsbaum 4 Spendergruppen 2 Knoten 42 = 16 Enden Übereinstimmende Blutgruppen P() = 0,6425
21 22 23 24 25 26 27 28 29 210 Binominalverteilung • Spenden10 Personen Blut, so könnte die Frage interessieren, wie groß die Wahrscheinlichkeit für mindestens vier Universalspender ist. • Der Wahrscheinlichkeitsbaum hätte 2 Äste und (Universalspender mit der Wahrscheinlichkeit p = 8/20bzw. kein Universalspender mit der Wahrscheinlichkeit 1-p = 12/20) und 10 Knoten hat, d.h. 210 = 1024 Enden.
Binominalverteilung • Beispiel: Wahrscheinlichkeit für k = 4 Universalblutspender unter 5 Blutspendern • Annahme 1: Die ersten vier Spender der Stichprobe sind Universalspender und der letzte nicht (1,1,1,1,0) • Die Wahrscheinlichkeit für eine solche Konstellation ist (Unabhängigkeit zwischen den Individuen vorausgesetzt): p4 (1 – p)1 p4 (1 – p)1 = 0,44 (1 – 0,4)1 p4 (1 – p)1 = 0,44 (1 – 0,4)1 = 0,0154 • Beachte: Die Summe der Exponenten entspricht der Anzahl der Erfolge (Universalspender) bzw. Misserfolge (kein Universal-spender) in der Stichprobe.
Binominalverteilung • Beispiel: Wahrscheinlichkeit für k = 4 Universalblutspender unter 5 Blutspendern • Annahme 2: Es gibt ganz allgemein 4 Universalspender (Erfolge) unter 5 Spendern • (1,1,1,1,0); (1,1,1,0,1); (1,1,0,1,1); (1,0,1,1,1); (0,1,1,1,1) • Bildet man die Summe der „1“ in jeder Abfolge, so ergibt sich die Anzahl k = 4 • Da die 5 Abfolgen alle mit der gleichen Wahrscheinlichkeit von auftreten, gilt (Additionssatz für disjunkte Ereignisse): p4 (1 – p)1 p (genau 4 Universalspender) = 5• 0,44 (1 – 0,4)1 = 0,0768
Binominalverteilung • Allgemeine Berechnung der Wahrscheinlichkeit für den Eintritt von Erfolgen: • Es wird davon ausgegangen, dass als Ergebnis jedes einzelnen Versuches ein Erfolg (Eintrittswahrscheinlichkeit p) oder ein Misserfolg (Eintrittswahrscheinlichkeit 1 – p) beobachtet wird. • Die Wahrscheinlichkeit für eine bestimmte Abfolge von k Erfolgen unter n Experimenten beträgt:Vorausgesetzt, die Annahme der unabhängigen Versuchsgänge für die n Experimente ist gerechtfertigt, so treten in k der n Experimente Erfolge mit der Eintrittswahrscheinlichkeit p und in den restlichen n – k Experimenten Misserfolge mit den Eintrittswahrscheinlichkeiten 1- p auf. pk (1 – p)n-k
n n k k ( ) n! n• (n – 1) • …. • (n – k + 1) n = = k k! (n – k)! 1 • 2 • …. • k Binominalverteilung • Die Zahl der möglichen Abfolgen berechnet man mit Hilfe der Binominalkoeffizienten. • Sind von n Experimenten genau k erfolgreich verlaufen, so gibt es dafür ( ) (sprich „n über k“) verschiedene (disjunkte) Versuchsserien, die jeweils mit einer Wahrscheinlichkeit vonpk (1 – p)n-kauftreten. • Dabei ist ( ) definiert durch
( ) 5 • 4 • 3 • 2 = = 5 1 • 2 • 3 • 4 • Damit ist die Wahrscheinlichkeit für genauk Erfolge bei der Durchführung von n unabhängigen Experimenten:wenn die Wahrscheinlichkeit für einen Erfolg in einem Einzelexperiment p beträgt. , ( ) 5 n pk (1 – p)n-k 4 k Binominalverteilung • Beispiel: Berechnung des Binominalkoeffizienten für n = 5 und k = 4
( ( ) ) ( ( ) ) ( ( ( ) ) ) n + 1 n n n n n n k + 1 k + 1 n - k 0 n k k Binominalverteilung Es gelten = = 1 = = +
Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeiten für genau0, 1, 2, 3, 4 und 5 Universalspender (Erfolge) unter 5 Spendern
( ( ) ) n 5 pk (1 – p)n-k 0,40 (0,6)5 0 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 0 Universalspender unter 5 Spendern = 1 • 1 • 0,07776 = 0,07776
( ( ) ) n 5 pk (1 – p)n-k 0,41 (0,6)4 1 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 1 Universalspender unter 5 Spendern 5 = • 0,4 • 0,1296 = 0,2592 1
( ( ) ) n 5 pk (1 – p)n-k 0,42 (0,6)3 2 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 2 Universalspender unter 5 Spendern 5 • 4 = • 0,16 • 0,216 = 1 • 2 = 10 • 0,16 • 0,216 = 0,3456
( ( ) ) n 5 pk (1 – p)n-k 0,43 (0,6)2 3 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 3 Universalspender unter 5 Spendern 5 • 4 • 3 = • 0,064 • 0,36 = 1 • 2 • 3 = 10 • 0,064 • 0,36 =0,2304
( ( ) ) n 5 pk (1 – p)n-k 0,44 (0,6)1 4 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 4 Universalspender unter 5 Spendern 5 • 4 • 3 • 2 = • 0,0256 • 0,6 = 1 • 2 • 3 • 4 = 5 • 0,0256 • 0,6 =0,0768
( ( ) ) n 5 pk (1 – p)n-k 0,45 (0,6)0 5 k Binominalverteilung • Aufgabe: Berechnung der Wahrscheinlichkeit für genau 5 Universalspender unter 5 Spendern 5 • 4 • 3 • 2 • 1 = • 0,01024 • 1 = 1 • 2 • 3 • 4 • 5 = 1 • 0,01024 • 1 =0,01024
Binominalverteilung • Die Gesamtzahl der Erfolge variiert zwischen 0 und 1. • In der deskriptiven Statistik wurde das entsprechende Merkmal „Gesamtzahl der Erfolge“ als diskret bezeichnet. • Um zum Ausdruck zu bringen, dass den Ausprägungen des Merkmals Wahrscheinlichkeiten zuzuordnen sind, nennt man das diskrete Merkmal diskrete Zufallsvariable. • Die Wahrscheinlichkeiten der diskreten Zufallsvariablen können wie in der beschreibenden Statistik die relativen Häufigkeiten des diskreten Merkmals an Hand eines Stabdiagramms visualisiert werden. • Die entsprechende Darstellung heißt Wahrscheinlichkeitsfunktion. • Im vorangehenden Spezialfall nennt man die diskrete Zufallsvariable, die als Werte die Zahl der Erfolge k bei der n-fachen Wiederholung unabhängiger Experimente mit Erfolgswahrscheinlichkeit p aufweist, binomialverteilt nach (n, p).
Wahrscheinlichkeitsfunktion ( (5,0,4)) der Zahl der Universalspenderin einer Stichprobe vom Umfang n = 5
Binominalverteilung • Hausaufgabe: Erstellen der Wahrscheinlichkeitsfunktionen • (10, 0,2) • (10, 0,5) • (10, 0,8)