180 likes | 440 Vues
Elementy Rachunku Prawdopodobieństwa i Statystyki. Wykład 5 Splot ( konwolucja ) funkcji Prawdopodobieństwo geometryczne Statystyka opisowa – parametry R.G.P. Nierówność Czebyszewa. Tomasz Szumlak , WFiIS , 12/04/2013. Splot ( konwolucja ) funkcji.
E N D
Elementy Rachunku Prawdopodobieństwa i Statystyki • Wykład 5 • Splot (konwolucja) funkcji • Prawdopodobieństwo geometryczne • Statystyka opisowa – parametry R.G.P. • Nierówność Czebyszewa Tomasz Szumlak, WFiIS, 12/04/2013
Splot (konwolucja) funkcji Splotem dwóch funkcji f(t) i g(t) jest funkcja (f * g)(t): powyżej zdefiniowaliśmy tzw. konwolucjęjednostronną Niezbędne narzędzie dla zastosowań takich jak, obróbka obrazów, cyfrowe przetwarzanie sygnałów, analiza obwodów, …, statystyka Zacznijmy od przykładu, wybierzmy: f(t) = sin(t), g(t) = cos(t)
Splot (konwolucja) funkcji Dla treningu: f(t) = e-at, g(t) = e-bt ile wynosi (f * g)(t)? Własności splotu Przemienność Łączność Rozdzielność
Splot (konwolucja) funkcji Dlaczego jesteśmy zainteresowani splotem w statystyce? (przypominamy sobie co wiemy o zamianie zmiennych): Załóżmy, że dane są dwie ciągłe Z.L. (X, Y), R.G.P. dany jest jako f(X, Y) Definiujemy dwie nowe zmienne losowe, U oraz V, dane przez U=U(X, Y) i V=V(X, Y) – odwzorowanie to można również odwrócić, czyli można również wyrazić X i Y jako funkcje U oraz V: X=X(U, V) i Y=Y(U, V) Wiemy, że R.G.P. dla pary (U, V) można wyrazić jako: lub
Splot (konwolucja) funkcji Rozważmy następujący przykład, gdy poszukujemy Z.L. U = X + Y Możemy przyjąć: Wykonując rachunki explicite: R.G.P. dla zmiennej V dany jest więc jako: Lub, jeżeli Z.L. są niezależne: Splot!
Splot (konwolucja) funkcji Dalej możemy również wyznaczyć rozkład prob. Oraz, odpowiednio dla zmiennych niezależnych: Przykład powyższy, gdzie poszukiwaliśmy rozkładu zmiennej V = X + Y zajmuje doniosłe miejsce w statystyce (w szczególności ważne dla nas!), równie ciekawe są przypadki: V=X/Y oraz V=XY Jeżeli zmienna X opisuje wielkość poszukiwaną to zmienną Y możemy zinterpretować jako „zakłócenia” związane z pomiarem (efekty aparaturowe). Tak więc, dokonując obserwacji w wyniku otrzymujemy zmienną losową będącą splotem wielkości poszukiwanej (X) oraz zaburzeń związanych z techniką pomiaru (ukryte w zmiennej Y)
Prawdopodobieństwo geometryczne Definiując prob. często używamy diagramów Venna – pomysł – prob. można nadać, w wielu przypadkach, elegancką interpretację geometryczną. Np. strzelamy do tarczy, prob. trafienia w region o powierzchni K1jest do niego proporcjonalne – jedyny problem to normalizacja, możemy np. założyć, że trafienie gdziekolwiek w cel (pow. K) wynosi 1 A – trafienie w obszar K1, P(A) = K1/K
Prawdopodobieństwo geometryczne Jako przykład rozpatrzmy grę w strzałki („darts”) Interesuje nas prob. trafienia w obszar tarczy pomiędzy r i r+dr R.G.P. (dlaczego?) można przyjąć jako: Gdzie a, jest promieniem tarczy, zakładamy, że nie ma przypadków, kiedy strzałka nie trafia w tarczę! Normalizacja, daje nam c=3/2a
Parametry rozkładów Definiując pojęcia Z.L. oraz R.G.P. zakładaliśmy, że znamy postać funkcyjną rozkładu tej zmiennej W ogólności nie jest to prawda – w praktyce, bardzo często nie jesteśmy w stanie określić dokładnej postaci funkcji R.G.P. – możemy jedynie wyznaczyć ograniczoną liczbę parametrów takiego rozkładu. Parametry te, są zawsze wyznaczane na drodze eksperymentalnej Jednym z najważniejszych parametrów opisowych, znanym w statystyce jest wartość oczekiwana, zwana również wartością średnią. Załóżmy, że badamy dyskretną Z.L. przyjmującą wartości: dla której, funkcja R.G.P. zdefiniowana jest jak poniżej:
Wartość średnia (oczekiwana) Wówczas, wartość oczekiwaną E[X] (), wyznacza się z zależności: Jeżeli, zmienna losowa X posiada rozkład płaski, wówczas prob. Pojawienia się jakiejkolwiek wartości Z.L. jest jednakowa, mamy wówczas: W tym przypadku E[X] nazywana jest średnią arytmetyczną. Poprzez analogię, dla ciągłej Z.L. wartość średnią wyznaczamy z zależności: Wartość średnia dla ciągłej Z.L. istnieje, gdy powyższa całka jest zbieżna!
Wartość średnia (oczekiwana) Przykład Gra polega na rzucie symetryczną kostką do gry. Gracz wygrywa 20 PLN gdy wypada dwa oczka, 40 PLN gdy wypada 4 oczka, płaci 30 PLN gdy wypada 6 oczek. Pozostałe możliwości nie przynoszą zysku bądź straty. Ile wynosi przewidywana wygrana? Załóżmy, że naszą zmienną losową będzie ilość pieniędzy jakie możemy wygrać: Oczewkiwana wygrana wynosi więc: Wniosek: stawka wejściowa powinna wynosić 5 PLN Uwaga: zwykle, wartość średnia jest liczbą mianowaną! Jeżeli mierzymy średnicę pręta to wynik podajemy w mm, itp., itd..
Wartość średnia (oczekiwana) Przykład Dla poniżej zdefiniowanej funkcji R.G.P. zmiennej losowej X wyznacz E[X] Wartość oczekiwana nazywana jest często miarą tendencji centralnej funkcji R.G.P. dla zmiennej losowej X Formułę definiującą E[X] możemy uogólnić w następujący sposób: Analogiczne równanie może zostać zapisana również dla dyskretnej Z.L.
Wartość średnia (oczekiwana) Własności (wybrane) wartości średniej E[X] E[cX] = cE[X], gdzie c jest dowolną stałą E[X ± Y] = E[X] ± E[Y] E[XY] = E[X]E[Y], dla niezależnych Z.L. X i Y Np. dla równości 2) mamy:
Wariancja i odchylenie standardowe Następną wielkością stosowaną do opisu R.G.P. jest wariancja, V[X], którą dla Z.L. X definiujemy jak poniżej: Wariancja jest nieujemną wielkością, której dodatni pierwiastek nazywamy odchyleniem standardowym, Mamy, odpowiednio dla dyskretnych i ciągłych Z.L. Jeżeli Z.L. X pochodzi z rozkładu płaskiego (analogia do E[X]), to: Istnieje, jeżeli całka jest skończona
Wariancja i odchylenie standardowe Przykład Dla funkcji zdefiniowanej na stronie 13 wyznaczymy V[X] Wariancję możemy interpretować jako miarę rozrzutu (rozmycia) Z.L. Xwokół jej wartości średniej „Małe” V[X] „Duże” V[X]
Wariancja i odchylenie standardowe Własności (wybrane) wariancji 1) 2) 3) Np. własność 1): Ważna transformacja związana z wartością średnią oraz odchyleniem standardowym - Z.L. standaryzowana: X X* Dla tak zdefiniowanej zmiennej mamy: „Jednostka standardowa”
Nierówność Czebyszewa Jedno z najważniejszych twierdzeń statystyki, dotyczące ogólnych własności Z.L. ciągłych bądź dyskretnych, posiadających skończone wartości średniej, , oraz odchylenia standardowego, Twierdzenie (nierówność Czebyszewa) Załóżmy, że Z.L. (ciągła bądź dyskretna) posiada skończone wartości dla oraz , jeżeli jest dowolną liczbą większą od zera, to prawdziwe jest poniższa formuła: Przykład Załóżmy, że wybraliśmy k = 2: Powiemy: prob. tego, że wartość zmiennej losowej różni się od jej wartości średniej o więcej niż dwa odchylenia standardowe jest mniejsza bądź równa 0.25 Tw. Czebyszewa kluczowe dla zastosowań statystyki w opracowaniu pomiarów