1 / 22

SB029

SB029. Dodatek k přednáškám Základy analýzy dat a SPSS -zadání a výstupy z SPSS. SOC 434. Faktorová analýza (FA) –zadání a výstupy z SPSS. Faktorová analýza -zadání. Do políčka Variables nutno Dát proměnné ze kterých se provede analýza. Descriptives+ Factor scores.

jonny
Télécharger la présentation

SB029

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SB029 Dodatek k přednáškám Základy analýzy dat a SPSS -zadání a výstupy z SPSS SOC 434

  2. Faktorová analýza (FA)–zadání a výstupy z SPSS

  3. Faktorová analýza -zadání Do políčka Variables nutno Dát proměnné ze kterých se provede analýza.

  4. Descriptives+Factor scores Před vlastním výsledkem zobrazí korelační matici všech proměnných navzájem, včetně signifikancí KMO a Bartlett test-zda má smysl na daných datech provádět FA (viz dále u výstupů). Uloží do dat hodnoty faktorových skórů- bude jich tolik , kolik vyjde faktorů. Tyto lze užít jako proměnné nahrazující původní.

  5. Rotation+Options • Varimax – nejčateji používaná • rotace-viz přednáška. • Rotované řešení je “snadno” • čitelné • Faktorové zátěže < 0.3~0.4 • nemají velký praktický význam • (jde vlastně o korelační koef. • Mezi proměnnými a faktory)

  6. Určení počtu faktorů - Extraction B A C A. Kaiserovo pravidlo - charakteristické číslo větší nebo rovno 1 B. Scree plot charakteristických čísel – tam kde se láme, je optimální počet faktorů-viz výstup. C-možnost vlastní volby počtu faktorů.

  7. Výstupy z faktorové analýzy SOC 434

  8. Počet vlastních čísel >=1 je 8 = počet faktorů (Kaiserovo pravidlo) Procento vysvětleného rozptylu pokud použiji 8 faktorů.

  9. Grafické zobrazení počtu faktorů Zlom v scree plotu signalizuje optimální počet faktorů -zpravidla méně než u Kaiserova pravidla.

  10. Testy určující zda má FA smysl • Ukazují nakolik jsou proměnné korelované-platí čím více • jsou proměnné korelovány tím je použití FA lepší (ceteris paribus) • -Pozor neukazují zda používáme správné proměné, vyjdou někdy • dobře i pro dichotomické proměnné, které jsou pro FA naprosto • nevhodné • KMO – není stricto sensu test, vychází ze srovnnání hodnot párových • A parciálních korelačních koeficientů, pokud jsou parciální koef. • blízké 0 proměnné měří 1 faktor a vice versa • -hodnot od 0 do 1 (nejde o test ale doporučuje se že hodnota by měla být větší • než 0,5, optimálně větší 0,7). • Bartlett test-nulová hypotéza-proměnné an sobě v základním • souboru nezávisí • -tuto hypotézu zamítáme pokud je sig <0.05 SOC 434

  11. Matice faktorových zátěží • Před rotací • Po rotaci (VARIMAX) • Faktorové zátěže- korel. koef. mezi proměnnými a faktory (potlačeny menší • než 0,3 – viz popis Options). Proměnnou přiřazujeme k faktoru, • u kterého má největší faktorovou zátěž (tedy 2. a 4. proměnná k prvnímu • faktoru atd.). Rotace pomůže tomu aby se faktorové zátěže přiblížili • hodnotám 0 a 1 a umožnili jednodušší přiřazení faktorů a proměnných • (ale ne vždy zcela pomůže). Nesmíme zapomenout, že pokud potlačíme • některé hodnoty faktorových zátěží stále zpravidla faktor na ostatních proměnných • alespoň slabě závisí. SOC 434

  12. Shluková analýza+K-means –zadání a výstupy z SPSS

  13. SPSS: Shluková analýza

  14. V metodách nutno vybrat metodu pro shlukování a určit zda mám intervalové či binární proměnné. U nich pak určit metodu měření vzdáleností. Shluková analýza - zadání Do políčka Variables nutno dát proměnné ze kterých se provede analýza.

  15. Shluková analýza - zadání Standardizaci je nutno Použít pokud proměnné vstupující do analýzy jsou na různých škálách.

  16. Můžeme zadat zda si přejeme A)Neurčovat skupinovou příslušnost B)určit skupinovou příslušnost do předem daného počtu shluků C)určit skupinovou příslušnost-pro různé počty shluků Pokud zvolíme B, nebo C a ve volbě Save zaškrtneme odpovídající volbu dostaneme v datech novou proměnnou /pro C nové proměnné ve kterých pro každý případ určeno do jakého shluku patří V záložce Plots nutno zaškrtnout Dendrogram-nejdůležitější výstup. A B C SOC 434

  17. Výstupy ze shlukové analýzy SOC 434

  18. DENDOGRAM Min = 0 Max = 25 Centroid method Nearest neighbor Vzdálenost mezi případy Between-groups linkage Pozor - různé způsoby shlukování dávají různé výsledky

  19. DENDOGRAM – čtení výsledků Min = 0 Max = 25 Nejdříve došlo ke spojení případů 6,7,11 ( a také 5,13 či 12,15 atd.) Tyto případy mají k sobě nejblíže. Vzdálenost mezi případy Pokud chceme stanovit například 2 shluky musíme vést řez dendrogramem a rozdělit případy do dvou shluků. (1. shluk tvoří případy od 6 do 15 a 2. zbývající). 2 výsledné shluky Pozor - různé způsoby shlukování dávají různé výsledky

  20. Raději nepoužívat, mění centroidy v průběhu přiřazování, záleží na pořadí K-means cluster - nehierarchická metoda Maximální počet iterací mohu zvýšit, ale není třeba. Do políčka Variables nutno dát proměnné ze kterých se provede analýza. Volba Save umožňuje uložit skupinovou příslušnost a vzdálenost od „středu“ shluku.

  21. POČÁTEČNÍ ŘEŠENÍ ROVNOU ZJISTÍM, ZDA MAJÍ PROMĚNNÉ VSTUPUJÍCÍ DO SESKUPOVACÍ ANALÝZY SMYSL ZABÍRÁ HODNĚ PAMĚTI KDYŽ ZADÁVÁM POČÁTEČNÍ ŘEŠENÍ ULOŽENÍ CENTROIDŮ

  22. Výstupem z K-means procedury je pouze skupinová příslušnost Tedy každý případ je zařazen do jednoho ze shluků. Počet shluků musíme předem zadat, pokud tedy chceme například získat rozdělení do 2,3,4 shluků musíme proceduru Spustiz třikrát a poté řešení porovnat. Pokud zaškrtneme možnost volby ANOVA v Options zobrazí se nám navíc tabulka pro analýzu rozptylu, která nám řekne zda jsou mezi shluky opravdu rozdíly.

More Related