420 likes | 584 Vues
Analýza rozptylu. Porovnání průměrů více než dvou normálních rozdělení. Analýza rozptylu (ANOVA) se v technické praxi používá buď jako samostatná technika nebo jako postup umožňující analýzu zdrojů variability v lineárních statistických modelech.
E N D
Analýza rozptylu Porovnání průměrů více než dvou normálních rozdělení
Analýza rozptylu (ANOVA) se v technické praxi používá buď jako samostatná technika nebo jako postup umožňující analýzu zdrojů variability v lineárních statistických modelech. Ze statistického hlediska lze analýzu rozptylu chápat jako speciální případ regresní analýzy, kdy vysvětlující proměnné mohou mít kvantitativní i kvalitativní charakter. Podstatou analýzy rozptylu je rozklad celkového rozptylu dat na složky objasněné (známé zdroje variability) a složku neobjasněnou, o níž se předpokládá, že je náhodná. Následně se testují hypotézy o významnosti jednotlivých zdrojů variability.
Základní myšlenka analýzy rozptylu spočívá v tom, že celkový rozptyl rozložíme na rozptyly dílčí náležející příslušným jednotlivým vlivům, podle nichž jsou empirické údaje roztříděny. Kromě těchto dílčích rozptylů je jednou složkou celkového rozptylu tzv. reziduální rozptyl, který je způsoben dalšími vlivy, které v rámci analýzy nepostihujeme. Porovnáním složek rozptylu zkoumaného kvantitativního znaku pak určíme ty vlivy, které významně ovlivňují úroveň tohoto znaku.
Analýzu rozptylu používáme tehdy, sledujeme-li vliv jednoho nebo několika faktorů na zkoumaný statistický znak. Předpokládejme, že sledovaný znak je ovlivňován pouze jediným faktorem, který budeme sledovat na několika jeho úrovních. Úrovní faktoru se zde rozumí určitá hodnota kvantitativního znaku nebo určitá varianta kvalitativního znaku. Získané hodnoty uspořádáme podle jednoho třídícího kritéria (hlediska), tzn. podle úrovní sledovaného faktoru do tolika tříd, na kolika úrovních tento faktor sledujeme. Tento model, kdy sledujeme úroveň jednoho faktoru, se potom nazývá analýza rozptylu při jednoduchém třídění.
Úrovně sledovaných faktorů mohou mít různý charakter. V některých případech úrovně faktoru představují pevné typy určitého kvalitativního faktoru nebo pevná množství určitého kvantitativního faktoru. Účelem experimentu je vyšetřit a porovnat efekty těchto pevných úrovní faktoru. Jsou-li úrovně faktoru přesně fixovány, nazýváme odpovídající model analýzy rozptylu model s pevnými efekty (model I). Model s náhodnými efekty (model II) – úrovně faktoru mohou být náhodně vybrány z velkého počtu možných úrovní. Při náhodně vybraných úrovních (tzn. má-li výběr úrovní náhodný charakter) je efekt úrovně náhodnou veličinou.
Představme si, že sledujeme vliv tří způsobů mletí vzorku v zařízeních Z1, Z2 a Z3 na výsledek chemické analýzy. Na každém mlecím zařízení byly připraveny tři vzorky, pro které byly určeny výsledky chemické analýzy xij, (i = 1, 2, 3 a j = 1, 2, 3), kde xij označuje výsledek pro i-tý způsob mletí a j-tý vzorek. Způsob mletí je označován jako kvalitativní faktor. Vyskytují se však také faktory kvantitativní, jako je například průměrná velikost částic mletého vzorku či další fyzikální a chemické veličiny. Pokud nás zajímají pouze rozdíly mezi danými úrovněmi (způsoby mletí), jde o modely s pevnými efekty. Pokud jsou jednotlivé úrovně pouze výběrem z konečného či nekonečného souboru, jde o modely s náhodnými efekty.
Výběr mezi pevnými a náhodnými efekty závisí na vlastním záměru analýzy rozptylu a může se podle něho měnit. V rámci uvedeného příkladu uvažujme, že místo tří mlecích zařízení vybereme faktor „průměrná jemnost mletí“. • O model s pevnými efekty půjde tehdy, budeme-li uvažovat, že třem mlecím zařízením odpovídají tři úrovně jemnosti mletí. Naším záměrem je vyšetřit, zda mletí na jednotlivých mlecích zařízeních výrazně ovlivní výsledek chemické analýzy. • O model s náhodnými efekty jde tehdy, když zjišťujeme, zda má průměrná velikost částic vzorku vliv na výsledek analýzy. Ze všech možných velikostí částic náhodně vybereme tři, které lze shodou okolností realizovat na třech mlecích zařízeních. Zajímá nás tedy původní soubor, tj. všechny velikosti částic, a nikoliv vlastní výběr, tj. konkrétní tři velikosti částic.
Předpokládejme, že sledovaný faktor má m úrovní a že počet pozorování v jednotlivých třídách (tzn. na každé úrovni sledovaného faktoru) je roven n. Pro přehlednost uspořádání údajů je možné využít následujícího schématu:
Pro vlastní zpracování modelů analýzy rozptylu je důležité, zda je při všech kombinacích faktorů realizován stejný počet měření (opakování) či nikoliv. • Pro stejný počet opakování se modely označují jako vyvážené (ortogonální), kdy n1 = n2 = … = nm. • Nevyvážený (neortogonální) model rozsahy ni(i = 1, 2, …, m) jednotlivých tříd jsou různé. • Podmínky použitelnosti analýzy rozptylu: • normalita rozdělení, • statistická nezávislost náhodných chyb eij, • shodné rozptyly náhodných chyb eij.
Analýza rozptylu při jednoduchém třídění hodnotí diference průměrů sledované závisle proměnné mezi skupinami, které jsou určeny jednou nezávisle proměnnou (jedním faktorem). Zkoumá se, zda skupiny vytvořené tímto faktorem jsou podobné, nebo zda jednotlivé průměry tvoří nějaké identifikovatelné shluky. Máme k dispozici m 2 nezávislých výběrů z rozdělení kde 1, 2, …, m a 2 jsou neznámé parametry ZS.
Předpokládáme, že jednotlivé rozptyly ZS jsou shodné, tzn. (není však nutno, aby jejich hodnota byla známa). Nulová hypotéza má tvar: H0: 1 = 2 = … = m , m 2 Alternativní hypotéza pak tvrdí, že existuje alespoň jedna dvojice průměrů, která se sobě nerovná. Předpokládáme, že jednotlivá měření vyhovují modelu xij = + ai + eij, i = 1, 2, …, m, j = 1, 2, …, n, kde xij označuje i-té měření v j-tém výběru, je společná část průměru a eij jsou nezávislé náhodné veličiny s rozdělením N(0; 2).
Hodnotu je možno interpretovat jako průměrný teoretický výsledek na uvažovaných úrovních faktoru A (obecná střední hodnota), ai (i = 1, 2, …, m) představuje efekt (účinek) i-té úrovně faktoru A (efekt ai zvyšuje nebo snižuje teoretickou střední hodnotu o účinek i-té úrovně faktoru A). Efekt skupiny ai způsobuje, že průměry i sledované proměnné si nemusí být rovny. Náhodné veličiny eij lze chápat jako náhodné chyby, jimiž je každé měření zatíženo.
Pro posouzení, zda daný faktor A skutečně ovlivňuje zkoumaný statistický znak X, je třeba testovat nulovou hypotézu H0: 1 = 2 = … = m, kterou je možno ekvivalentně zapsat též takto: H0: a1 = a2 = … = am = 0. Slovně vyjádřeno: efekty jednotlivých úrovní sledovaného faktoru A jsou zanedbatelné (faktor neovlivňuje závisle proměnnou X). Alternativní hypotézou je hypotéza
Pro přehlednější vyjádření vzorců užívaných v analýze rozptylu se používá tzv. tečkový způsob zápisu součtů a průměrů pozorovaných hodnot. Součet, resp. průměr hodnot, zjištěných v i-tém výběrovém souboru (tzn. součet, resp. průměr hodnot v i-tém řádku schématu) lze označit následujícím způsobem: Součet Průměr
Celkový součet označíme X•• , tzn. a celkový průměr pak lze vyjádřit jako:
Ve složitějších modelech analýzy rozptylu budeme pracovat i se sloupcovými součty, resp. sloupcovými průměry: Tečka vždy nahrazuje indexy, přes které sčítáme.
Test H0 je založen na skutečnosti, že za platnosti H0 lze ze zjištěných výběrových hodnot xij provést odhad neznámého rozptylu 2 dvěma na sobě zcela nezávislými způsoby. 1. způsob odhadu 2 Každý z výběrových rozptylů ( je rozptyl hodnot zjištěných v i-tém výběrovém souboru) poskytuje odhad rozptylu 2. Jestliže z těchto výběrových rozptylů utvoříme aritmetický průměr, získáme opět odhad rozptylu 2, který je však lepší než kterýkoliv z odhadů .
Tento odhad se nazývá rozptyl uvnitř tříd (reziduální rozptyl). 2. způsob odhadu 2 V teorii odhadu se dokazuje, že pro rozptyl výběrového průměru platí vztah Odtud pro rozptyl 2 dostáváme vyjádření
Rozptyl sice neznáme, můžeme ho ale odhadnout pomocí výběrových průměrů, vypočtených z pozorovaných hodnot xij: Následně tedy dostáváme vztah pro odhad 2: Tento odhad se nazývá rozptyl mezi třídami.
Test hypotézy H0: a1 = a2 = … = am = 0 je tedy ekvivalentní testu hypotézy kde představuje rozptyl mezi třídami a rozptyl uvnitř tříd (reziduální). Významnost rozdílu mezi uvedenými rozptyly pak posoudíme F-testem, kdy testové kritérium bude mít tvar:
Statistika F má za platnosti H0 F-rozdělení o (m-1) a m(n-1) stupních volnosti. Pokud F > F, pak zamítáme hypotézu o statisticky nevýznamném rozdílu obou rozptylů, což bude znamenat i zamítnutí hypotézy o shodě průměrů ZS. Pro provedení testu je třeba určit hodnoty srovnávaných rozptylů, které získáme pomocí tzv. součtů čtverců. Celkový součet čtverců, tzn. součet čtverců odchylek pozorovaných hodnot xij od celkového průměru lze upravit takto:
Označme: Výše uvedené lze stručně přepsat takto: S = S1 + Sr.
Celkovou variabilitu, reprezentovanou celkovým součtem čtverců S, lze rozložit na dvě aditivní složky: S1 – součet čtverců mezi třídami, Sr – součet čtverců uvnitř tříd (reziduální) Složka S1 charakterizuje vliv faktoru A na sledovaný statistický znak S, Složka Sr charakterizuje působení pouze náhodných příčin. Při praktických úlohách určujeme Sr jako rozdíl součtů S a S1, tzn. Sr = S – S1.
Tvary součtů čtverců je možné upravit do výpočetně jednodušších výrazů, kdy dostáváme následující tzv. výpočetní tvary veličin S, S1 a Sr: kde
Výpočty pro analýzu rozptylu obvykle uspořádáváme do tzv. tabulky analýzy rozptylu. Jestliže F F [(m-1); m(n-1)] , zamítáme H0.
Analýza rozptylu při jednoduchém třídění s nestejným počtem opakování Pokud jednotlivé třídy ve schématu nemají stejný počet pozorování, hovoříme o tzv. nevyváženém modelu analýzy rozptylu. Předpokládejme, že jednotlivé třídy mají rozsahy ni , i = 1, 2, …, m. Vzorce pro součty čtverců se odvodí zcela analogicky jako u vyváženého modelu a budou mít tento tvar (pravé strany výrazů pak představují výpočetní tvary součtů čtverců):
Pokud se týká stupňů volnosti, jsou u nevyváženého modelu stanoveny takto: f1 = m – 1, f2 = ni – m. Další postup je již stejný jako v případě třídění se stejným počtem pozorování (tzn. jako u vyváženého modelu). Jestliže F F [(m-1); ( ni – m)] , zamítáme H0.
Podrobnější hodnocení výsledků analýzy rozptylu (metody mnohonásobného srovnávání) Jestliže se F-testem zamítne H0, je závěr, že ne všechny průměry ZS jsou shodné, příliš neurčitý. Porovnáváme-li m výběrových průměrů, lze mezi nimi vytvořit m(m-1)/2 diferencí. F-test v analýze rozptylu však sám o sobě nepodává informaci, kolik a které z těchto diferencí jsou statisticky významné. Z tohoto důvodu je v případě zamítnutí H0 nezbytné, aby se výsledky analýzy rozptylu doplnily podrobnějším hodnocením, jímž bychom zjistili, které z dvojic výběrových průměrů se liší statisticky významně, a které pouze náhodně.
Metody mnohonásobného srovnávání umožňují detailní rozlišení jednotlivých průměrů. • Je možné použít postupy: • Duncanova metoda • Kramerova metoda • Scheffého metoda (S – metoda) • Tukeyova metoda (T – metoda) • Newmann – Kelsův test • Dunnettův test • Fisherův LSD test apod.
Scheffého metoda (S-metoda) • univerzálně použitelná, tzn. jak pro model vyvážený, tak nevyvážený. Hypotéza i =j (i, j = 1, 2, …, m; i j) se zamítá tehdy, jestliže – reziduální rozptyl, ni a nj – rozsahy srovnávaných souborů, F– tabulková hodnota F–rozdělení.
Tukeyova metoda (T-metoda) • použitelná pouze pro vyvážený model • je citlivější na rozdíly mezi středními hodnotami Jestliže kde liší se výběrové průměry statisticky významně (ve smyslu T – metody). q (m; n-m) – tabelované hodnoty studentizovaného rozpětí q
U T – metody se lze setkat s označením dmin , kdy • q, fr,m– tabulková hodnota studentizovaného rozpětí q pro: • – hladinu významnosti, • fr – stupňů volnosti reziduálního rozptylu, • m – počet srovnávaných průměrů, • n – počet opakování ve třídách (rozsah srovnávaných souborů).
Duncanova metoda • použitelná pouze pro vyvážený model • pro tuto metodu je potřeba vypočtené výběrové průměry seřadit vzestupně podle velikosti Rozptyl výběrových průměrů je možné odhadnout pomocí reziduálního rozptylu Pro další výpočty budeme potřebovat směrodatnou odchylku tohoto rozptylu, tzn.
Rp; (f); – pomocné hodnoty pro Duncanův test, kdy – hladina významnosti, f – stupně volnosti reziduálního rozptylu . Kramerova metoda Používá se v případě, kdy jednotlivé výběry mají nestejné rozsahy. Výběrové průměry vypočtené z výběrů o rozsazích nia nj , kde ni nj , se liší statisticky významně, jestliže
Příklad Tří různých vyučovacích metod bylo použito na malých skupinách žáků. Na základě závěrečného zkoušení (v bodech), které jsou uvedeny v tabulce, posuďte, zda existuje statisticky významný rozdíl mezi uvedenými metodami.
Použitím výpočtových tvarů dostaneme následující hodnoty součtů čtverců:
Následuje podrobnější vyhodnocení analýzy rozptylu. T-metoda Statisticky významný rozdíl byl zjištěn mezi metodou A a B a metodou A a C.
S-metoda Podle S – metody byl statisticky významný rozdíl zjištěn mezi metodou A a metodou C.
Duncanova metoda R3; 42; 0,05 = 3,01 R2; 42; 0,05 = 2,86 Statisticky významný rozdíl byl zjištěn mezi metodou A a B a metodou A a C.