290 likes | 403 Vues
1 Úvod. Cíle : Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace . Vymezíme specifické techniky mnohorozměrné analýzy . Určíme pro jaké úkoly jsou vhodné jednotlivé techniky . Dis kutujeme podstatu měření, typy proměnných a vztah k mnohorozměrným technikám .
E N D
1Úvod Cíle: • Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. • Vymezíme specifické techniky mnohorozměrné analýzy. • Určíme pro jaké úkoly jsou vhodné jednotlivé techniky. • Diskutujeme podstatu měření, typy proměnných a vztah k mnohorozměrným technikám. • Popisujeme koncepční a statistické aspekty mnohorozměrné analýzy.
Analýza kvantitativních dat Základní informace: • Povinnosti – úkoly, prezentace, zkouška • Sylabus • Literatura – viz dále • Související kurzy JSM031 a JSM152 • Organizace kurzu
Literatura • Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál, 2009. • Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium, 2004. • Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav AV ČR a Nakladatelství Pavel Křepela, Brno. • Tarling, R. 2009: Statistical modeling for social researchers. Routledge. • Norusis. 2005. SPSS 13. Statistical procedures companion. Prentice Hall. • StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft. http://www.statsoft.com/textbook/stathome.html Další nepřeberné množství knih a článků a WWW stránek (články budou průběžně doporučovány)
Co je mnohorozměrná analýza? • Co to je? Mnohorozměrná analýza dat (Multivariate Data Analysis ) = jsou všechny statistické metody, které simultánně analyzují více proměnných měřených na jedincích nebo objektech sledování. • Proč je používat? • Měření • Explanace & predikce • Testování hypotéz
Základní koncepty mnohorozměrné analýzy • Proměnná • Škály měření • Nemetrické • Metrické • Mnohorozměrná měření • Chyba měření • Druhy technik
Typy dat a škál měření Data Nemetrická nebo Kvalitativní Metrická nebo Kvantitativní Interval. škála Poměr.škála Nominální škála Ordinální škála
Škála měření • Nemetrické škály • Nominální – označení číslem nemá vztah k žádné velikosti. • Ordinální – existuje řazení. • Metrické škály • Intervalové– má vlastnosti ordinální škály a jsou zde stejné diference mezi jednotlivými body škály. • Poměrové – má vlastnosti intervalové škála+přirozená nula. Poznámka: Typ škály je mnohdy kritický při určování správné statistické techniky
Chyba měření • Všechny proměnné jsou zatížen nějakou chybou. Jaké jsou zdroje chyb? • Chyba měření = zkresluje pozorovaný vztah a znehodnocuje výsledky analýzy. • Výzkumníci používají součtové škály a vytvářejí kompositní reprezentace konceptů.
Chyba měření Při posuzováníchyb měření si všímáme dvou charakteristik měření: • Validita = stupeň, jak dobře měří proměnná to, co má měřit. • Reliabilita = stupeň, jak postup měří spolehlivě (bez náhodné chyby).
Statistická významnost a síla testu • Chyba I.druhu. Hodnota je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona platí. • Chyba II. druhu. Hodnotaje pravděpodobnost nezamítnutí nulové hypotézy za předpokladu, že ona neplatí. • Síla testu nebo-li1- je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona neplatí.
Síla je určena třemi faktory: • Velikostí účinku (ES):aktuální hodnota efektu (např.rozdíl mezi průměry nebo velikost korelace mezi proměnnými). • Alfa ():nasadíme malou hodnotu, čím menší tak zmenšujeme sílu. Typicky = 0.05. • Velikost výběru:jak rozsah výběru se zvětšuje, tak se zvětšuje síla.Při velkých výběrech i malou odchylku hodnotíme jako statisticky významnou.
Síla testu, statistická významnost, nesprávné užívání • Literatura : částečně viz Hendl • Článek: Soukup 2010 (http://archiv.soc.cas.cz/articles/cz/73/Data-a-vyzkum.html#artID413) a pomůcky nahttp://samba.fsv.cuni.cz/~soukup/stat_vyznamnost_clanek/
Typy mnohorozměrných technik • Techniky analýzy závislostí:proměnná nebo více proměnných se považují za závisle proměnné. Vysvětlují se pomocí množiny nezávislých proměnných. • Mnohonásobná regrese • Mnohonásobná diskriminační analýza • Logitová/logistická regrese • Mnohonásobná analýza rozptylu a kovariance • Kanonická korelační analýza • Strukturální modelování (SEM)
Typy mnohorozměrných technik • Techniky pro hledání podobností (interrelací)bez rozlišení na závislé a nezávislé proměnné, více proměnných. • Metoda hlavních komponent a faktorová analýza • Shluková analýza • Mnohorozměrné škálování • Korespondenční analýza
Výběr technik mnohorozměrné analýzy • Jaký typ vztahu se zkoumá– závislosti nebo interrelace? • Vztah závislosti: Kolik proměnných se predikuje? • Jaká je škála proměnných závisle proměnných? • Jaká je škála nezávisle proměnných? • Interdependence: Zkoumáme vztahy (podobnosti) mezi proměnnými, respondenty nebo objekty?
Mnohonásobná regrese Jednoduchá metrická závisle proměnná predikovaná několika nezávisle proměnnými (metrickými). Bude v kurzu JSM 034
Diskriminační analýza Nemetrická (nominální) závisle proměnná je predikována několika metrickými nezávisle proměnnými. Bude v kurzu JSM 034 • Příklady • Pohlaví – Muž resp. žena • Těžký případ nemoci, lehký případ nemoci • Kreditní důvěra, kreditní nedůvěra • Člen nebo nečlen
Logistická regrese Jednoduchá závisle nemetrická proměnná je predikovaná několika metrickými nezávisle proměnnými. Tato technika je podobná diskriminační analýze, ale výpočty jsou trochu jiné, podobné regresi. Bude v kurzu JSM 034
MANOVA Několik metrických proměnných je predikováno několika kategoriálními nezávisle proměnnými (nemetrickými).
Kanonická korelační analýza Několik metrických závisle proměnných je predikováno několika metrickými nezávisle proměnnými.
Strukturální modelování (SEM) • Hodnotí se několik provázaných závislostí, vychází se ze dvou modelů: • Strukturální model • Model měření • Bude v kurzu JSM 034
Faktorová analýza . . . .Analyzují se struktury vztahů mezi velkou množinou proměnných, aby bylo možno určit společné faktory. De facto hledáme podobné proměnné. (viz JSB 029 a JSM031)
Shluková analýza . . . .Skupina objektů (respondenti, produkty, firmy atd.) se analyzuje pomocí měr vzdáleností a určují se kategorie objektů (shluky). De facto hledáme podobné případy. (viz JSM 031)
Mnohorozměrné škálování • . . .Identifikují se nerozpoznané dimenze, které diferencují objekty zájmu pomocí: • podobnostínebo • preferencí • Opět hledáme podobné případy (viz JSM 031)
Korespondenční analýza . . .Používá nemetrická data a vyhodnocuje lineární nebo nelineární vztahy, aby bylo možné nalézt asociace mezi objekty a určit popisné charakteristiky objektů. Hledáme vazby mezi řádky a sloupci kontingenční tabulky (viz JSM 152).
Pokyny pro provedení mnohorozměrné analýzy • Určujeme věcné a statistické významnosti • Velikost souboru určuje výsledek (nadto potřebujeme zpravidla dostatečně velká data) • Poznáváme data • Hledáme úsporný popis • Posouzení chyb a opomenutí • Validizace výsledků
Strukturovaný přístup k MA při tvoření modelu Fáze 1:Určíme výzkumný problém, cíle a mnohorozměrnou techniku Fáze 2:Navrhneme plán analýzy Fáze 3:Vyhodnotíme předpoklady techniky Fáze 4:Odhadujeme parametry modelu a vyhodnocujeme kvalitu proložení Fáze 5:Interpretujeme získané výsledky Fáze 6:Validizujeme získaný model Poznámka: Často zpracováváme sekundárně data, pak odpadá bod 2.
Kontrolní otázky Co je mnohorozměrná analýza? Proč používáme mnohorozměrnou analýzu? Proč je znalost škály důležitá v mnohorozměrné analýze? Jaké základní aspekty musíme posuzovat v mnohorozměrné analýze? Popište proces aplikace mnohorozměrné analýzy ?