1 / 43

Testy nieparametryczne

Testy nieparametryczne. dr hab. Dariusz Piwczyński. Ograniczenia testów parametrycznych. Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany. Zastosowanie testów nieparametrycznych.

Télécharger la présentation

Testy nieparametryczne

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Testy nieparametryczne dr hab. Dariusz Piwczyński

  2. Ograniczenia testów parametrycznych • Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.

  3. Zastosowanie testów nieparametrycznych • Testy nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak:zmienne mierzalne, posiadające rozkład zgodny normalnym. • Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.

  4. Testy nieparametryczne a rozkład zmiennej • Testy nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji. • Na ogół obliczenia są proste i nie zajmują wiele czasu.

  5. Analiza rang • Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat). • Dane w porównywanych grupach porządkujemy rosnąco lub malejąco. • Rachunki matematyczne wykonujemy na rangach.

  6. Moc testów • Niestety, siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych –testy nieparametryczne stosujemy tylko wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne. • W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.

  7. Statystyczna analiza

  8. Statystyczna analiza

  9. Statystyka opisowa • Średnia geometryczna • Mediana • Dominanta • Rozstęp • Odstęp międzykwartylowy

  10. Porównania grup – dobór testu

  11. Doświadczenie niezależne – 2 grupy • Test U Mann-Whitney • Test ten jest najmocniejszą nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.

  12. Test U Mann-Whitney • Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny. • Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam: • H0: F(x) = G(x); H1: F(x) ≠ G(x) F(x), G(x) – dystrybuanta ChZT zimą i wiosną

  13. Test U – porównujemy pory roku • Porządkujemy rosnąco dane obydwu grup. • Poczynając od wartości najmniejszej przypisujemy im rangi.

  14. Rangi wiązane • Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.

  15. Rangi wiązane • W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości. • (8 + 9)/2 = 8,5

  16. Kolejność obliczeń • Obliczamy sumę rang dla obydwu grup: R1 i R2. Ustalamy liczebności porówny-wanychgrup

  17. Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie; n1, n2 – liczebność grupy 1 i 2.

  18. Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie; n1, n2 – liczebność grupy 1 i 2.

  19. Wartości krytyczne • Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.

  20. Wyniki • U = 92 • z = -2,897 • |-2,897| porównujemy z wartością u/2=1,96 (=0,05) • Ze względu na fakt, iż obliczona wartość z jest większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną. • Otrzymany wynik jest również większy niż u/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest wysoko istotna.

  21. Test U n1 i n2 > 20

  22. SAS EG, Test U Mann Whitney

  23. SAS EG, Test U Mann Whitney

  24. SAS EG, U Mann Whitney, WYNIKI

  25. Doświadczenie niezależne, k > 2 • Test Kruskal-Wallis • Test mediany

  26. Kruskal-Wallis Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach jest taki sam: H0: F1(x) = F2(x) =... = Fk(x) H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x) F1(x), F2(x), Fk(x) – dystrybuanty rozpatrywanych populacji. Program SAS: Kruskal-Wallis Test Chi-kwadrat 8.4354 Stopień swobody 2 Pr > Chi-kwadrat 0.0147 Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p < 0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie na poziom badanego wskaźnika.

  27. Kruskal-Wallis n = n1 + n2 + … + nk – liczebność poszczególnych grup; Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie

  28. Test mediany • Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2. H0 : mediany są takie same w obu próbach, czyli około połowy wszystkich przypadkach w każdej z grup przypada powyżej, a druga poniżej wspólnej mediany.H1 : mediany nie są takie same.

  29. SAS EG, test K-W i mediany

  30. SAS EG, test K-W

  31. SAS EG, test mediany

  32. Statistica, test K-W i mediany

  33. Doświadczenie zależne, k =2 • Test kolejności par Wilcoxona • Test znaków

  34. Test znaków • Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.

  35. Test kolejności par Wilcoxona

  36. Doświadczenia dwugrupowe zależne w SAS • W SAS konieczne jest wcześniejsze przygotowanie kolumny będącej różnicą jednej i drugiej serii danych!

  37. SAS EG, Test znaków i kolejności par Wilcoxona

  38. SAS EG, Test znaków i kolejności par Wilcoxona

  39. SAS EG, Test znaków i kolejności par Wilcoxona • test znaków • test kolejności par Wilcoxona

  40. Doświadczenia zależne, k > 2 • Test Friedmana

  41. Test Friedmana

  42. Test Friedmana

  43. Test Friedmana

More Related