490 likes | 674 Vues
ANALIZA VARIANCE. Analiza variance je metoda s katero proučujemo učinke več faktorjev na statistične enote. Analiza variance odgovarja na vprašanje, če so učinki faktorjev statistično pomembni in kako veliki so.
E N D
ANALIZA VARIANCE Analiza variance je metoda s katero proučujemo učinke več faktorjev na statistične enote. Analiza variance odgovarja na vprašanje, če so učinki faktorjev statistično pomembni in kako veliki so Varianco podatkov, s katerimi izražamo učinke faktorjev na statistične enote, razčlenimo na več delov
En del variance je rezultat učinkovanja slučajnih vplivov, preostali deli, eden ali več, pa imajo izvor v učinkih proučevanih faktorjev na statistične enote Kadar so posamezni deli tako razčlenjene skupne variance, bistveno večji od dela, ki pripada slučajnim vplivom, sklepamo, da so učinki teh faktorjev statistično pomembni. Če smo skupno varianco podatkov razčlenili na dva dela, od katerih eden pripada slučajnim dejavnikom, drugi pa proučevanemu faktorju, govorimo o enojni analizi variance.
Če smo skupno varianco razčlenili na tri ali več členov, tako da eden pripada slučajnim dejavnikom, ostali pa proučevanim faktorjem, govorimo o dvojni oziroma večkratni analizi variance. S stališča regresijske analize so faktorji neodvisne spremenljivke, statistični znak pa je odvisna spremenljivka. Vrednost faktorja, katerega učinek na statistične enote opazujemo, imenujemo nivo faktorja. Kombinacije tistih nivojev različnih faktorjev, pri katerih opazujemo njihove učinke na statistične enote, imenujemo postopki
Proučevanja izvajamo na vzorčnih podatkih, ki morajo biti primerno izbrani, da lahko izvedemo ustrezno analizo variance. Postopek, s katerim izbiramo vzorčne podatke, da bi lahko razčlenili skupno varianco podatkov na dele, ki pripadajo proučevanim faktorjem, imenujemo načrt poizkusa. Moteče vplive ponavadi izločimo tako, da statistične enote, na katerih proučujemo postopke, razdelimo na čimbolj homogene skupine, pravimo jim bloki
Enojna analiza variance Z enojno analizo variance primerjamo aritmetične sredine neodvisnih slučajnih vzorcev meritev ali opazovanj, izbranih iz različnih populacij Populacije so v tem primerupostopki. Vzemimo, da imamo neodvisne slučajne vzorce velikosti n iz kpopulacij. Vzorce iz populacij lahko potem zapišemo
vzorec iz populacije : 1 vzorec iz populacije : 2 ............................................................ vzorec iz populacije : k
Realizacije slučajnih spremenljivk so vrednosti ki jih lahko zapišemo v obliki modela za i = 1,2,…, k in j = 1,2,…,n. je skupno matematično upanje za i = 1,2,…, k, pa imenujemo učinki postopkov in zanje velja
Z enojno analizo variance proučujemo en sam faktor s k nivoji Preveriti želimo ničelno hipotezo za i = 1,2,…,k pri nasprotni hipotezi za vsaj en i.
Test je zgrajen na celokupni variabilnosti podatkov kjer je Celokupno variabilnost podatkov lahko razcepimo na dva dela, to je na del, ki izhaja iz slučajnihvplivov, in del, ki izhaja iz razlik medpopulacijami. je povprečje podatkov vzorca iz i-te populacije
Izrazu na levi strani pravimo skupna vsota kvadratov (SST), prvi člen na desni strani enakosti se imenuje vsota kvadratov postopkov (SSTr), drugi člen na desni strani pa se imenuje vsota kvadratov slučajnih vplivov (SSE) SST = SSTr + SSE
imenujemo povprečje kvadrata napakein je slučajna spremenljivka s k(n-1) prostostnimi stopnjami imenujemo jo povprečje kvadratov postopkovs k-1 prostostnimi stopnjami in je tudi slučajna spremenljivka
Ničelno hipotezo bomo zavrnili, kadar bo MSTr znatno večji od MSE Kvocient dveh slučajnih spremenljivk F slučajna spremenljivka je njena vrednost s k-1 in k(n-1) prostostnimi stopnjami
Ničelno hipotezo zavrnili, če bo vrednost x presegla vrednost Vir variabilnosti Stopnje prostosti Vsota kvadratov Povprečje vsote kvadratov x Postopki k-1 SSTr MSTr Napaka k(n-1) SSE MSE Skupaj kn - 1 SST F slučajne spremenljivke pri stopnji pomembnosti Enojno analizo variance in ga pogosto zapišemo v obliki naslednje tabele.
Računanje pa poenostavimo, če uporabimo naslednje obrazce je vsota vrednosti i-tega postopka vsota vseh nk vrednosti Vrednost SSE dobimo, če od SST odštejemo SSTr
Dvojna analiza variance brez interakcij Včasih želimo analizirati vpliv dveh faktorjev. Drugi faktor pogosto predstavlja moteče dejavnike Statistične enote razdelimo v čim bolj homogeneskupine – bloke, postopke pa dodelimo statističnim enotam v vsakem bloku slučajno. Takšen načrt poizkusa imenujemo načrt v slučajnih blokih Celotno varianco podatkov razčlenimo v tri dele.
Poizkus z dvema spremenljivima veličinama lahko izvajamo na dva različna načina, glede na to, ali sta spremenljivki neodvisni ali pa je med njima interakcija. Postopke in bloke imenujemo tudi faktor A in faktor B ali pa tudi vrstica in stolpec Označimo z za i = 1,2,…,k in j = 1,2,…,n realizacije neodvisnih normalnih slučajnih spremenljivk Podatke lahko zapišemo v obliki tabele
Model dvojne analize variance brez interakcij zapišemo v obliki i = 1,2,…,k in j = 1,2,…,n. skupna aritmetična sredina učinki postopkov učinki blokov vrednosti normalnih slučajnih spremenljivk, ki so slučajni vplivi, z matematičnim upanjem 0 in enako varianco
Testirati želimo dve ničelni hipotezi, da so vsi učinki postopkov enaki nič in da so vsi učinki blokov enaki nič i = 1,2,…,k j = 1,2,…,n. Nasprotni hipotezista, da niso vsi učinki postopkov in blokov nič za vsaj en i za vsaj en j.
Dvojna analiza variance sloni na izreku povprečje podatkov za i-ti postopek povprečje podatkov v j-tem bloku povprečje vseh n.k podatkov
Leva stran je skupna vsota kvadratovSSTin meri celotno variabilnost podatkov Prvi člen na desni strani je vsota kvadratov postopkovSSTr in meri variabilnost postopkov Drugi člen na desni strani je vsota kvadratov blokovSSBin meri variabilnost blokov Tretji člen je vsota kvadratov napakeSSE in meri variabilnost slučajnih vplivov S temi oznakami lahko zapišemo zvezo
Kvocienti so povprečja ustreznih vsot kvadratov in so slučajne spremenljivke z ustreznim številom stopenj prostosti Njihovi kvocienti pa so F slučajne spremenljivke s pripadajočim številom stopenj prostosti števca in imenovalca
Ničelno hipotezo zavrnemo pri stopnji pomembnosti če velja vrednost F slučajne spremenljivke s številom prostostnih stopenj k -1 ter (n - 1)(k - 1)
Ničelno hipotezo zavrnemo pri stopnji pomembnosti če velja vrednost F slučajne spremenljivke z n -1 ter (n - 1)(k - 1) prostostnimi stopnjami
Bistvene podrobnosti lahko strnemo v naslednji tabeli: Vir variabilnosti Stopnje prostosti Vsota kvadratov Povprečje vsote kvadratov x Postopki k - 1 SSTr MSTr Bloki n - 1 SSB MSB Napaka (n - 1)(k - 1) SSE MSE Skupaj n.k - 1 SST
Zaradi enostavnejših računskih postopkov vpeljemo oznake Vrednost SSE pa dobimo z odštevanjem SSTr in SSBod SST. je vsota podatkov v i-tega postopka je vsota podatkov j-tega bloka je vsota vseh n.k podatkov
Dvojna analiza vaariance z interakcijami Model analize variance zapišemo pripada i –temu postopku, j-temu bloku in r-ti ponovitvi (i = 1,2,…,k, j = 1,2,…,n, r = 1,2,…m). je učinek r-te ponovitve je učinek interakcije i-tega postopka in j-tega bloka je učinek i-tega postopka je učinek j-tega bloka
Za vse učinke predpostavljamo Ničelne hipoteze so Nasprotne hipoteze so i = 1,2,…,k za vsaj en i za vsaj en j j = 1,2,…,n za vsaj en r r =1,2,…,m i = 1,2,…,k ;j = 1,2,…,n. za vsaj en par indeksoviin j
povprečje podatkov za i-ti postopek povprečje podatkov za j-ti blok povprečje podatkov za r-to ponovitev je povprečna vrednost i-tega postopka v j-tem bloku (povprečna vrednost ponovitev) povprečje vseh mnk podatkov.
Izraz na levi strani enakosti jeskupna vsota kvadratovSST prvi člen na desni strani jevsota kvadratov postopkov:SSA drugi člen jevsota kvadratov blokov:SSB tretji člen jevsota kvadratov ponovitev:SSR četrti člen je vsotakvadratov interakcij:SSI zadnji člen je vsota kvadratov slučajnih vplivov:SSE
Količine so povprečja vsot kvadratov in so slučajne spremenljivke s ustreznim številom stopenj prostosti
Količine so realizacije F slučajnih spremenljivk s pripadajočim številom stopenj prostosti v števcih in pripadajočim številom stopenj prostosti v vseh imenovalcih. Vsako od postavljenih ničelnih hipotez bomo zavrnili pri stopnji pomembnosti če bo pripadajoča vrednost statistike presegla kritično vrednost
Rezultate zapišemo v obliki tabele: Vir variabilnosti Stopnje prostosti Vsota kvadratov Povprečje vsote kvadratov x Postopek (A) k - 1 SSA MSA Postopek (B) n - 1 SSB MSB Ponovitve m -1 SSR MSR Interakcija (n –1)(k –1) SSI MSI Napaka (m - 1)(n.k - 1) SSE MSE Skupaj m.n.k - 1 SST
Vsote kvadratov izračunamo vsota podatkov za postopek A vsota podatkov za blok B vsota podatkov za ponovitve vsotapodatkov za kombinacijo i-tega nivoja postopka A in j-tega nivoja bloka B vsota vseh podatkov
Načrt latinskega kvadrata Načrt latinskega kvadrata uporabljamo za proučevanje učinkov enega faktorja in nadzor dveh dodatnih virov variabilnosti, ki jih izvajamo po vrsticah in stolpcih. Ime izhaja od tod, ker postopke označujemo s črkami latinske abecede. Latinski kvadrat za npostopkov bi bil latinski kvadrat in bi imel n – vrstic in n – stolpcev Na presečišču vrstice in stolpca nastopa ena črka, ki pripada postopku tako, da vsaka črka nastopi le enkrat v vsaki vrstici in vsakem stolpcu
Oba vira variabilnosti ki ju nadziramo po vrsticah in stolpcih lahko nastopata na toliko nivojih , kot je število postopkov, to je, kot je razsežnost latinskega kvadrata. med proučevanim faktorjem in dejavnikoma ki povzročata dodatno variabilnost podatkov, ni interakcij. Latinski kvadrat imenujemo standardni latinski kvadrat, če so črke v prvi vrstici in prvem stolpcu zapisane v abecednem redu.
Standardni latinski kvadrat lahko zgradimo tako, da v prvi vrstici zapišemo črke v abecednem redu, v vsako naslednjo vrstico pa zapišemo prejšnjo, ki jo pomaknemo za eno mesto v levo, črko, ki je izpadla na levi strani vrstice, pa postavimo na zadnje mesto te vrstice. Model za latinski kvadrat i = 1,2,…,n, j = 1,2,…,n, k = 1,2,…,n.
V modelu pomenijo : skupna aritmetična sredina učinki vrstic učinki stolpcev učinki postopkov vrednosti slučajnih vplivov Za vse neslučajne učinke predpostavljamo
Ničelne hipoteze so Analizo variance za načrt poizkusa latinskega kvadrata zgradimo na naslednji razčlenitvi celotne variabilnosti podatkov:
aritmetična sredina vseh podatkov za postopek k ( k = 1,2,…,n) aritmetična sredina podatkov v i – ti vrstici(i = 1,2,…,n) aritmetična sredina podatkov vj – tem stolpcu (j = 1,2,…,n) aritmetična sredina vseh podatkov v latinskem kvadratu.
Levo stran označimo s SST,in predstavlja skupno vsoto kvadratov Prvi člen na desni, označimo ga s SSR, predstavlja vsoto kvadratov vrstic Drugi člen na desni strani predstavlja vsoto kvadratov stolpcev, označimo ga s SSC Tretji člen na desni strani predstavlja vsoto kvadratov postopkov, označimo ga s SSTr Zadnji člen pa predstavlja vsoto kvadratov slučajnih vplivov in ga označimo s SSE.
Povprečja vsot kvadratov so realizacije slučajnih spremenljivk z n – 1 stopnjami prostosti je realizacija slučajne spremenljivke zstopnjami prostosti
Kvocienti so realizacije F slučajnih spremenljivk z ustreznim številom prostostnih stopenj. Analizo variance za načrt latinskega kvadrata zapišemo v naslednji tabeli:
Vir variabilnosti Stopnje prostosti Vsota kvadratov Povprečje vsote kvadratov x Postopki Vrstice Stolpci Slučajni vplivi Skupaj
Računanje vsot kvadratov izvedemo z obrazci Vsoto kvadratov slučajnih vplivov dobimo pri tem je
Pomen oznak vsota vseh podatkov v latinskem kvadratu vsota podatkov postopka k (k = 1,2,…,n) vsota podatkov v i-ti vrstici (i = 1,2,…,n) vsota podatkov v j-tem stolpcu (j = 1,2,…,n) je