120 likes | 269 Vues
Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 4. predavanje: multipla regresija in korelacija Nelinarni odnosi in kategorični podatki. Statistično sklepanje pri multipli regresiji (1). Toleranca = % var. napovednika j , ki ga ne pojasnijo drugi napovedniki.
E N D
Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 4. predavanje: multipla regresija in korelacija Nelinarni odnosi in kategorični podatki
Statistično sklepanje pri multipli regresiji (1) Toleranca = % var. napovednika j, ki ga ne pojasnijo drugi napovedniki. • Stabilnost modela odvisna od: • multiple korelacije (), • velikosti vzorca (), • števila napovednikov (), • korelacij mednapovedniki oz. Tol(), • vplivnih točk (). b/SE (b) ~ t (N-P-1) Navzkrižna validacija: preizkus stabilnosti modela.
Statistično sklepanje pri multipli regresiji (2) • Vzorčni R je pristranska cenilka populacijskega. • Razlogi: • omejeno število prostostnih stopenj (zlasti pri majhnem N/P), • izkoriščanje slučajnih odstopanj vzorčnih korelacij od populacijskih. Wherryjev popravek (nepristranska ocena Rpop.): SPSS: “adjusted R” Zelo približno priporočilo: vsaj 15-30 oseb na napovednik (odvisno tudi od R, P, Tol in zaželene moči!)
Statistično sklepanje pri multipli regresiji (3) Statistična značilnost R (H0: Rpop. = 0) df1 = P df2 = N - P - 1 Razlika med dvema R (H0: Rpop.(Y.1…P) = Rpop.(Y.1…P+D)) (samo za gnezdene skupine prediktorjev!): df1 = D df2 = N-P-D-1 P: prvotno št. prediktorjev; D: št. dodanih prediktorjev
Napovedni intervali • = interval, v katerem z določeno verjetnostjo pričakujemo vrednost Y za osebo z določeno kombinacijo vrednosti X1-Xp • Širina odvisna od: • višine R, • velikosti vzorca , • oddaljenosti osebe od povprečja napovednikov . • Pri enem napovedniku:
Nelinearni odnosi • Krivuljčen odnos skušamo opisati z vključitvijo nelinearnega člena: • Npr.: Yi = a + b1Xi + b2Xi2 + ei • V model najprej vključimo linearni člen. • Vključitev X2 vedno zviša R ! višina in stat. značilnost zvišanja? • Napovedovanje XY in YX ni enako natančno. • Pozor pri interpretaciji b1 in b2! • Kolinearnost: X centriramo. • Ne ekstrapoliraj! • Interakcija/moderacija: Na odnos med X in Y vpliva Z (več o tem prihodnje leto).
Kategorični napovedniki • Dihotomni napovedniki: • Pripadnikom skupine 1 napovemo za b višji dosežek kot pripadnikom skupine 2. • Regresija z 1 dihotomnim napovednikom t test za neodvisna vzorca. Npr.: spol in pravičnost nagrajevanja Plača = a + b1×spol + b2×kakovost +b3×zahtevnost + e b1= 0 pravično nagrajevanje Napačen pristop: razlika med povprečno plačo M in Ž
Ordinalne in nominalne spremenljivke s k vrednostmi: • Izdelamo k-1 dihotomnih indikatorskih spremenljivk (dummy variables). • “Referenčna kategorija”: vse indikatorske spremenljivke = 0. • Npr: od česa je odvisen • dohodek? • Zahtevnost dela • Kakovost dela • Panoga • Plača = • a + b1×zahtevnost + b2×kakovost + b3×I1 + b4×I2 + e
Plača = • a + b1×zahtevnost + b2×kakovost + b3×I1 + b4×I2 + e • V model vključimo (ali izključimo) vse indikatorske spremenljivke hkrati. • b = povprečna razlika med kategorijo i in referenčno kategorijo (pri kontroliranih preostalih prediktorjih) • a = povprečje referenčne kategorije (ko preostali prediktorji enaki 0) • Npr: • b3 = povprečna razlika med storitvami in javnim sektorjem za enako zahtevno in enako kakovostno opravljeno delo • če centrirani zahtevnost in kakovost: a =povprečna plača v javnem sektorju pri povprečni zahtevnosti in kakovosti
Kaj navajamo pri poročanju? Regresijske koeficiente (Beta koeficiente) Standardne napake Intervale zaupanja (Popravljeni) koeficient multiple korelacije in determinacije oz. indeks učinkovitosti napovedi F test za multiplo korelacijo (standardno napako napovedi) Pri postopnem vključevanju še spremembo pojasnjene variance.
Opomnik – na kaj moramo posebej paziti? • Pred analizo: • Linearni model teoretično utemeljen? • Aditivni model teoretično utemeljen? • Vključeni ključni prediktorji? • Velikost vzorca, moč testov? • Merska raven vključenih spremenljivk? • Zanesljivost napovednikov (majhna napaka merjenja)? • Kriterij intervalen, pribl. normalno porazdeljen? • Vzorčenje? • Med analizo in po njej: • Predpostavke – normalnost, linearnost, homoscedastičnost? • Vplivne točke? • Korelacije med napovedniki - multikolinearnost? • Stabilnost modela (SEb, Radj., navzkrižna validacija…)