Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza Psihologija - magistrski študijMetodologija psihološkega raziskovanja2003/04Gregor SočanKatedra za psihološko metodologijo gregor.socan@ff.uni-lj.si

O čem bomo govorili? • Opredelitev EFA in PCA: podobnosti in razlike. • Nekateri specifični problemi pri uporabi EFA. • Posebni primeri PCA in EFA. • Konfirmatorna FA. • Primerjava in evalvacija treh metod.

Analiza glavnih komponent (Principal Component Analysis, PCA; Pearson, 1901): “informacijo, vsebovano v n spremenljivkah, optimalno povzamemo s k nekoreliranimi obteženimi vsotami (komponentami)” Komponente so natanko določene z izmerjenimi spremenljivkami: Komponentai = bi1  X1 + bi2  X2 + … + bin  Xn in obratno: Xiai1  K1 + ai2  K2 + … + aik  Kk (=, če k=n) Prvih p komponent pojasni največji možni delež variance n spremenljivk.

Grafična ponazoritev: Komponente kot glavne dimenzije prostora spremenljivk.

(Eksploratorna) faktorska analiza (EFA): Iščemo “neopazljive”, “latentne” spremenljivke, s katerimi lahko pojasnimo korelacije med opazovanimi spremenljivkami. Korelacije med 3 testi sposobnosti: g 0,8 0,6 0,9 B P R Varianca h2(B) = 0,64 skupnih faktorjev h2(P) = 0,81 (komunaliteta) h2(R) = 0,36 0,36 0,19 0,64

Podobnost: Kot komponente so tudi faktorji spremenljivke oz. dimenzije. Razliki: EFA analizira le skupno varianco (komunaliteto). Faktorji so latentni: niso enaki obteženim vsotam spremenljivk.

Ali je PCA vrsta EFA? • Za: • z EFA in PCA pogosto dobimo zelo podobne rezultate; • vsak algoritem EFA vsebuje tudi PCA. • Proti: • rezultati lahko precej različni; • različni cilji; • različen empirični status komponent/faktorjev; • nerealna predpostavka o popolni komunaliteti.

Algoritmi EFA: • 1. FA največjega verjetja • (Maximum Likelihood FA, MLFA) • “maksimizira funkcijo verjetja za korelacije med spremenljivkami” • Matematično elegantna: • analitične standardne napake parametrov; • inferenčni testi; • asimptotično učinkovite ocene.

2. Metoda najmanjših kvadratov (Minres, Iterated principal factors, Principal-axis, ULS... ) “minimizira vsoto kvadriranih razlik med dejanskimi in ocenjenimi korelacijami med spremenljivkami” Empirično uspešnejša od MLFA, zlasti v neugodnih pogojih (Briggs & MacCallum, 2003; Sočan, 2003).

3. Metoda najmanjšega ranga • (Minimum Rank FA, MRFA) • minimizira varianco “ignoriranih” faktorjev; • ne producira kakršnihkoli negativnih varianc; • “pravilna” reducirana korelacijska matrika; • omogoča izračun % nepojasnjene komunalitete! • Po glavnih empiričnih lastnostih primerljiva z metodo najmanjših kvadratov.

Izbira algoritma odvisna tudi od preferenc uporabnika: • uporaba inferenčnih testov (MLFA) • stabilnost v neugodnih pogojih (Minres) • ocena nepojasnjene skupne variance (MRFA) • ...

Primer: Pearsonovi korelacijski koeficienti med rezultati 9 lestvic impulzivnosti (Zadravec, 2003) krepko: |r|>0,3 Imp1: Eysenckova lestvica imp., Pustol: Eysenckova lestvica pustolovskosti; Funkc.: funkcionalna imp.; Disfunk.: disfunkcionala i.; Imp2: Barrattova lestvica i.; Thrill: Zuckermanova lestvica pustolovskosti; Exper.: Zuckermanova lestvica iskanja izkušenj; Disinh.: Zuckermanova lestvica disinhibicije

Koliko faktorjev / komponent izločiti? V praksi nikoli ne izločimo “pravilnega” števila faktorjev! Interpretabilnost oz. uporabnost. Morda najpogosteje upo/zlorabljen: Kaiserjev kriterij: obržimo faktorje z lastno vrednostjo > 1; smiseln le pri PCA, vendar tudi tam vprašljiv.

2 preizkus pri metodi največjega verjetja: H0: vzorčni k = populacijski k (k: število izločenih faktorjev) k 2df p 1 337,0 27 .000 2 46,7 19 .000 3 10,5 12 .576

Cattellov scree-test

Težavi scree-testa: • neobjektivnost • v SPSS le za PCA (neprimerljiv z EFA!)

% pojasnjene skupne variance (komunalitete) pri metodi najmanjšega ranga

Vzporedna analiza

Rotacija: izboljšanje interpretabilnosti Pravokotne rotacije ohranjajo nekorelirane faktorje / komponente (“standard”: Varimax) Poševnokotne rotacije dopuščajo korelacije med faktorji. Nekoreliranost faktorjev vs. natančnost opisa.

ULS rešitve z dvema faktorjema brez rotacije ter s pravokotno in poševno rotacijo (krepko: a>0,40)

Dvofaktorska ULS rešitev pred in po rotaciji (Varimax)

Dvofaktorska vs. trifaktorska rešitev: s tremi faktorji bolje zajamemo lestvice iskanja dražljajev. (Oblimin, krepko>0,5)

Kvantifikacija faktorjev / komponent • (faktorske točke/dosežki; factor scores): • natančne vrednosti le pri PCA • EFA: “nedoločenost” faktorjev - faktorske vrednosti lahko le ocenimo

Podatki za EFA / PCA: • dvosmerna matrika osebe  spremenljivke • intervalni podatki (ekvivalentne razlike med vrednostmi) • linearne povezave so smiselne

Koliko oseb potrebujemo? Najpomembnejši dejavnik natančnosti rešitve: kombinacija števila oseb in povprečne komunalitete

Dihotomne (binarne) spremenljivke: Linearni model ne velja več! Včasih smiselno predpostaviti, da vrednosti temeljijo na zvezni latentni spremenljivki: analiza tetrahoričnih koeficientov. NOHARM ipd. modeli latentnih potez: povezava s teorijo odgovora na postavko (item-response theory) Za stabilne rezultate verjetno potreben velik vzorec!

Kvalitativne (nominalne) spremenljivke z več kot 2 vrednostima: Analiza homogenosti (alternativa PCA) 1. pretvorba v indikatorske spremenljivke 2. kvantifikacijska matrika: obtežitev indikatorskih spremenljivk, tako da maksimiziramo korelacijo s “komponento”

Trismerni podatki npr. osebe  spremenljivke  časovne točke Trismerna komponentna analiza: imamo: Namesto A, B, C: komponente oseb, spremenljivk in časovnih točk G: 3-D jedrna matrika: skrčena matrika podatkov

Kritike faktorske analize  realnost obstoja faktorjev  latentne spremenljivke tudi v “eksaktnih” vedah  nedoločljivost faktorjev  faktorji so razlagalne spremenljivke  arbitrarnost rotacij  faktorji so referenčni okvir, ne nujno realno obstoječe entitete  domnevna neuspešnost pri odkrivanju znane strukture  napačna uporaba metode privede do napačnih rezultatov

Kako se izogniti zmotnim rezultatom? • ustreznost podatkov (merski nivo, linearnost odnosov); • dovolj veliko število spremenljivk; • smiselna izbira spremenljivk; • velikost vzorca (odvisna od komunalitete); • izbira PCA / EFA / CFA kaj drugega; • odločitev o številu faktorjev; • izbira rotacije; • previdnost pri interpretaciji: faktorji lahko ustrezajo specifičnim strukturam, vendar to ni nujno!

KONFIRMATORNAFAKTORSKA ANALIZA: • Izhajamo iz vnaprejšnjih hipotez o faktorski strukturi: • število faktorjev in • faktorske uteži. V praksi določimo, katere uteži so enake 0 in katere so “proste”.

Izhodišče: osnovni model faktorske analize:  =  +   = kovariančna matrika  = matrika faktorskih uteži  = simet. matrika korelacij med faktorji  = diag. matrika unikvitet EFA: vsi elementi  in diag. elementi  so prosti (pri poševni rotaciji tudi izvendiag. elementi  KFA: nekatere elemente fiksiramo

Ocenjevanje parametrov:reševanje sistema strukturnih enačb, dobljenih s primerjavo empirične in inplicirane kovariančne matrike.Metode:največje verjetje (ML)najmanjši kvadrati (ULS),obteženi najmanjši kvadrati (WLS)...

Implicirana (ocenjena) kovariančna matrika: Npr. 1 latentna spremenljivka, 2 opazovani spremenljivki: Strukturne enačbe: 12 = 12 + 11 12 = 12 22 = 22 + 22

Identifikacija: Parametre modela je možno enoznačno določiti le, če število prostih parametrov ni preveliko. t - pravilo: št. prostih parametrov < p(p+1)/2 (p = št. spremenljivk)

Ocenjevanje ustreznosti modela: • 2test, • glede na pojasnjeno varianco: GFI, AGFI… • glede na razliko med ocenjevanim in ničelnim modelom: NFI, NNFI… • glede na razlike med dejanskimi in reproduciranimi kovariancami: RMSEA, RMR...

Diagram poti (path diagram)

Primerjava rešitev: EFA: iskanje strukture v novih, neraziskanih problemih KFA: preverjanje strukturnih hipotez v situacijah z dobro teoretično osnovo

Literatura: • Bollen, K.A. (1989).Structural equations with latent variables. New York: Wiley. /KFA • Gorsuch, R.L. (1983).Factor analysis. Hillsdale: Lawrence Erlbaum. /EFA • Kaplan, D. (2000).Structural equation modeling: Foundations and extensions. Thousand Oaks: Sage. /KFA • Nunnally, J.C. in Bernstein, I.H. (1994).Psychometric theory. New York: McGraw-Hill. /PCA, EFA, KFA • Stevens, J. (1996, 2001).Applied multivariate statistics for the social sciences. Mahwah, NJ: Laurence Erlbaum. /PCA, KFA

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza

Presentation Transcript

FINANSIJSKA ANALIZA

FAKTORSKA ANALIZA

Analiza trendu

Analiza varijance

Analiza skupień

ANALIZA

KONFIRMATORNA FAKTORSKA ANALIZA

Analiza

Poslovna analiza

KVANTITATIVNA ANALIZA

Analiza czynnikowa

Analiza neodvisnih komponent (ICA)

ANALIZA ANKETE

ANALIZA POSLOVANJA

ANALIZA

FAKTORSKA ANALIZA

Faktorska analiza ( Factor Analysis)

ANALIZA GLAVNIH KOMPONENATA

Analiza finansowa analiza zasobów majątkowych

FAKTORSKA ANALIZA Lazar Velimirović, Miodrag Đorđević, Miomir Stanković, Zoran Ognjanović

EKSPLORATORNA FAKTORSKA ANALIZA - IZLOČANJE FAKTORJEV

Tema FAKTORSKA ANALIZA*