1 / 38

ANALIZA NOMINALNIH VARIJABLI

Mia_John
Télécharger la présentation

ANALIZA NOMINALNIH VARIJABLI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. ANALIZA NOMINALNIH VARIJABLI

    3. Stanislav Fajgelj April 2006. 3 LITERATURA Petz, B. (2004), Osnovne statisticke metode za nematematicare, Jastrebarsko: Naklada Slap. StatSoft, Inc. (2005). Electronic Statistics Textbook. Tulsa, OK: StatSoft Fajgelj, S. (2005). Psihometrija Metod i teorija psiholokog merenja, II dopunjeno izdanje, Centar za primenjenu psihologiju, Beograd. Momirovic, K. (1988). Uvod u analizu nominalnih varijabli, Metodoloke sveske, Jugoslovensko udruenje za sociologiju, Ljubljana. Tenjovic, L. (2002). Statistika u psihologiji, Beograd: Centar za primenjenu psihologiju.

    4. Stanislav Fajgelj April 2006. 4 Literatura Anderberg, M.R. (1973). Cluster Analysis for Applications, Academic Press, London. Garson, G. D. (2000). Quantitative Research in Public Administration PA 765 Statnotes: An Online Textbook, North Carolina State University, Raleigh, http:// www2.chass.ncsu. edu/ garson/pa765/statnote.htm. De Leeuw, J. (1993). Some Generalizations of Correspondence Analysis, Tehnicki izvetaj, Preprint 117, UCLA Statistics Series, www.stat.ucla.edu/papers/preprints. Grimm, L.G., Yarnold, P.R. (1995). Reading and understanding multivariate statistics, Washington, DC: American Psychological Association.

    5. Stanislav Fajgelj April 2006. 5 Izvod iz teorije merenja Po teoriji merenja: Merenje je dodeljivanje numerala objektima shodno naucnim zakonima Pravo merenje je onda kada dodeljeni numerali predstavljaju brojeve i kada su aritmeticke operacije na njima jednake operacijama na objektima Na primer: sabiranje duine dva tapa 0,5m + 0,5m = 1m, daje isti rezultat kao spajanje dva tapa

    6. Stanislav Fajgelj April 2006. 6 Izvod iz teorije merenja Ovakva i sve slicne definicije merenja se nazivaju reprezentacijskim, jer dodeljivanje numerala ima za cilj to bolje reprezentovanje stvarnosti Nasuprot tome stoji teorija merenja Stanley Smith Stevensa, cija se definicija merenja naziva operacionalistickom

    7. Stanislav Fajgelj April 2006. 7 NIVOI MERENJA Stevens je definisao cetiri nivoa merenja Nivoe merenja je definisao operacijama merenja, operacijama dodeljivanja numerala objektima i dopustivim transformacijama na dodeljenim numeralima Nakon toga je za svaki nivo merenja odredio osnovne statisticke tehnike koje su mu primerene

    8. Stanislav Fajgelj April 2006. 8 NIVOI MERENJA Nominalni identifikacija i klasifikacija objekata Ordinalni razvrstavanje objekata u poredak Intervalni objektima se dodeljuju brojevi tako da razmaci izmedu brojeva budu srazmerni razlikama u svojstvu Racio dodeljeni brojevi imaju ne samo jedinicu merenja, nego i nulu

    9. Stanislav Fajgelj April 2006. 9 Nominalni nivo merenja Po formalnoj teoriji merenja ovaj Stevensov nivo ne predstavlja merenje Sa istraivackog stanovita, medutim, identifikacija i klasifikacija jesu polazne operacije svakog merenja Dakle, ako ga prihvatimo kao merenje, on je najnii nivo merenja

    10. Stanislav Fajgelj April 2006. 10 NOMINALNE VARIJABLE Poto je varijabla rezultat merenja... varijable na nominalnom nivou sadre samo identifikaciju i klasifikaciju objekata, a ne sadre nikakvu kvantifikaciju nekog svojstva. Zato se nominalne varijable cesto nazivaju kvalitativnim varijablama: npr. bracno stanje, nacionalnost, vrsta sporta Nominalne varijable su, takode, diskontinuirane, kategorijalne varijable

    11. Stanislav Fajgelj April 2006. 11 Nominalne varijable Na nominalnim varijablama doputene su prakticno sve transformacije Osim transformacije sve-u-jedan kada se objekti vie ne mogu razlikovati Ako je transformacija mnogo-u-jedan, onda se informacije o nekim objektima gube Nominalni nivo merenja doputa najvecu slobodu transformisanja, ali to je zato to sadri najmanje znacenja

    12. Stanislav Fajgelj April 2006. 12 BINARNE VARIJABLE Binarne varijable imaju specijalna svojstva One su bez skale, mogu biti nominalne, ordinalne ili intervalne Veliki broj naprednih statistickih tehnika za analizu nominalnih varijabli se zasniva na eksplicitnoj ili implicitnoj transformaciji nominalnih varijabli u binarne

    13. Stanislav Fajgelj April 2006. 13 Binarne varijable Poto su binarne varijable bezskalne, to istraivaci tumace kao mogucnost da ih tretiraju kao intervalne Medutim, binarne varijable sadre najmanje informacija o merenom svojstvu Njihova varijansa je znatno nia od politomnih varijabli (max 0,25) Zato su one znatno manje sposobne da koreliraju sa drugim varijablama

    14. Stanislav Fajgelj April 2006. 14 TRANSFORMACIJE U ORDINALNE, INTERVALNE ILI BINARNE VARIJABLE Vecina nominalnih varijabli su parcijalno nominalne i parcijalno ordinalne (npr. ne znam) Transformacija u ordinalnu i intervalnu varijablu je moguca na osnovu dodatnih informacija Obicno se vri na osnovu korelacije ili regresije sa jednom ili vie ordinalnih ili intervalnih varijabli Razbijanje u dve ili vie dihotomnih binarnih varijabli i gradnja indikatorskih ili selektorskih matrica

    15. Stanislav Fajgelj April 2006. 15 BINOMNA RASPODELA p=f/n M=np d2=npq

    16. Stanislav Fajgelj April 2006. 16 MULTINOMNA RASPODELA pj=fj/n j=1,...,g (broj kategorija) Mj=npj dj2=npjqj djk= npjqk

    17. Stanislav Fajgelj April 2006. 17 Analiza nominalnih varijabli Izbor statisticke tehnike zavisi od nacrta istraivanja Neka istraivanja raspolau jedino nominalnim varijablama (recimo ankete) Mnoga istraivanja raspolau varijablama svih nivoa Mnoge snane statisticke tehnike su bazirane na barem jednoj nominalnoj varijabli (npr. ANOVA)

    18. Stanislav Fajgelj April 2006. 18 Analiza nominalnih varijabli Dva osnovna pristupa: Transformacija nominalnih u intervalne Binarizacija razbijanje u indikatorske matrice Generalno analiza nominalnih varijabli trpi od cinjenice da nominalne varijable sadre minimalno znacenje o merenoj pojavi

    19. Stanislav Fajgelj April 2006. 19 Analiza nominalnih varijabli Deskriptivna statistika Statistika zakljucivanja Multivarijatna statistika

    20. Stanislav Fajgelj April 2006. 20 Deskriptivna statistika nominalnih varijabli Doputeni statistici za nominalne varijable Frekvencije, proporcije i procenti Mod Entropija (analogna varijansi)

    21. Stanislav Fajgelj April 2006. 21 STATISTIKA ZAKLJUCIVANJA Standardna greka proporcija Intervali poverenja za proporcije Testiranje znacajnosti razlika proporcija ?2 test za testiranje distribucije frekvencija nominalne varijable

    22. Stanislav Fajgelj April 2006. 22 STATISTIKA ZAKLJUCIVANJA test znacajnosti nulte hipoteze = velicina efekta x velicina uzorka

    23. Stanislav Fajgelj April 2006. 23 Izbor tehnike testa Da li ispitujemo razlike izmedu grupa ili povezanost izmedu varijabli Koliko imamo nezavisnih i zavisnih varijabli ili Koliko grupa imamo Kakva je priroda nivo merenja NV i ZV

    24. Stanislav Fajgelj April 2006. 24 Testiranje razlika izmedu grupa Ono se koristi kada je nezavisna varijabla (NV) kategorijalna NV moe biti prirodno kategorijalna (pol), ordinalna, ili dobijena klasifikacijom kontinualne varijable Vano je pitanje koliko nivoa-kategorija ima NV Ispituju se razlike izmedu grupa s obzirom na vrednosti zavisne varijable (ZV).

    25. Stanislav Fajgelj April 2006. 25 Testiranje razlika izmedu grupa dihotomna NV Sledece vano pitanje je priroda ZV ZV je kontinualna i normalna t-test, jednosmerna ANOVA ZV je ordinalna ili nije normalna Mann-Whitneyev test, Wilcoxonov test ZV je nominalna ili dihotomna podaci su obicno frekvencije ?2 test ili McNemarov test

    26. Stanislav Fajgelj April 2006. 26 Testiranje razlika izmedu grupa dihotomna NV Sledece vano pitanje je da li su uzorci zavisni ili nezavisni Ako su uzorci nezavisni: t-test za nezavisne uzorke ili jednosmerna ANOVA Mann-Whitneyev test ?2 test Ako su uzorci zavisni: t-test za zavisne uzorke Wilcoxonov test McNemarov test

    27. Stanislav Fajgelj April 2006. 27 ZAVISNI I NEZAVISNI UZORCI Nezavisni uzorci nastaju slucajnim biranjem Zavisni uzorci nastaju kada su svojstva objekta u jednom uzorku povezana sa svojstvima odgovarajuceg objekta u drugom uzorku Ponovljena merenja Jednacenje grupa po parovima Uvek kada se moe utvrditi znacajna korelacija (izmedu AS, svojstava...) npr. biranje lancem preporuka

    28. Stanislav Fajgelj April 2006. 28 Testiranje razlika izmedu grupa politomna NV Kad su uzorci nezavisni ZV je kontinualna i normalna Jednosmerna ANOVA ZV je ordinalna ili nije normalna Kruskal-Wallisov test ZV je nominalna ili dihotomna ?2 test

    29. Stanislav Fajgelj April 2006. 29 Testiranje razlika izmedu grupa politomna NV Kada su uzorci zavisni ZV je kontinualna i normalna Nacrt ponovljenih merenja, generalni linearni modeli (GLM) ZV je ordinalna ili nije normalna Friedmanov test ZV je nominalna ili dihotomna Cochranov Q test

    30. Stanislav Fajgelj April 2006. 30 Testiranje razlika izmedu grupa vie NV Vrlo vano pitanje je pitanje broja NV. Kada ima vie NV: ZV je kontinualna i normalna Faktorska ANOVA, ANCOVA ili GLM, bez ili sa ponovljenih merenja u zavisnosti od tipa uzorka ZV je nominalna ili dihotomna Log-linearni modeli

    31. Stanislav Fajgelj April 2006. 31 TOK ODLUCIVANJA ZA RAZLIKE podaci su frekvencije Koliko nivoa 2 >2 NV Zavisni ili nezavisni uzorci Vrsta testa

    32. Stanislav Fajgelj April 2006. 32 TOK ODLUCIVANJA ZA RAZLIKE podaci su kvantitativni i normalno distrubirani Koliko nivoa 2 >2 NV Zavisni ili nezavisni uzorci Vrsta testa

    33. Stanislav Fajgelj April 2006. 33 Testiranje povezanosti varijabli jedna NV i jedna ZV Osnovno pitanje je o prirodi ZV i NV Ako su obe varijable kontinualne i normalne Pearsonov r ili bivarijatna regresija Obe varijable su ordinalne ili nisu normalne Kendallov tau ili Spearmanov rho Jedna varijabla je kontinualna a druga nominalna Korelacioni odnos eta Obe varijable su nominalne ili dihotomne fi-koeficijent ili Cramerov V

    34. Stanislav Fajgelj April 2006. 34 Testiranje povezanosti varijabli vie NV Sledece vano pitanje je pitanje broja NV Vie kontinualnih i normalnih NV ZV je kontinualna: viestruka regresija ZV je nominalna: diskriminaciona analiza Neke NV su normalne, neke dihotomne ZV je kontinualna: viestruka regresija ZV je dihotomna: logisticka regresija Sve NV su dihotomne ZV je kontinualna: viestruka regresija ZV je dihotomna: logisticka regresija

    35. Stanislav Fajgelj April 2006. 35 TOK ODLUCIVANJA ZA POVEZANOSTI podaci su frekvencije Koliko 2 >2* varijabli Vrsta koeficijenta * U parovima, ili log-linearni modeli

    36. Stanislav Fajgelj April 2006. 36 Indikatorske matrice

    37. Stanislav Fajgelj April 2006. 37 INDIKATORSKE MATRICE

    38. Stanislav Fajgelj April 2006. 38 ANALIZA KONTINGENCIONIH TABELA Dve kategorijalne varijable, V1 i V2 V1 ima r kategorija, a V2 c B1 i B2 su njihove indikatorske matrice fij su frekvencije

    39. Stanislav Fajgelj April 2006. 39 ANALIZA KONTINGENCIONIH TABELA

    40. Stanislav Fajgelj April 2006. 40 ANALIZA KONTINGENCIONIH TABELA

    41. Stanislav Fajgelj April 2006. 41 ANALIZA KONTINGENCIONIH TABELA

    42. Stanislav Fajgelj April 2006. 42 ANALIZA KONTINGENCIONIH TABELA ?2 = 4,12 Za bss=(r1) (c1)=2, p>0,05

    43. Stanislav Fajgelj April 2006. 43 Cramerov Pearsonov koeficijent kontingencije POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2

    44. Stanislav Fajgelj April 2006. 44 POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2 f; 0 = f = (k 1), k=min(r,c). f2 je zbir kvadrata svih netrivijalnih kanonickih korelacija. V2 = f2 / (k 1) Oni nisu pokazatelji maksimalne povezanosti varijabli V1 i V2, nego prosecne. Zato tee da je podcenjuju. Cramerov 0 = V = 1 i po njemu se mogu porediti tabele razlicite velicine.

    45. Stanislav Fajgelj April 2006. 45 POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE IZ ?2 C koeficijent nije cvrsto teorijski utemeljen. Krece se u rasponu 0 = C < 1, dakle, nikada ne dostie 1. Maksimalna vrednost zavisi od velicine tabele, pa, dakle, nije pogodan za poredenje na tabelama razlicite velicine.

    46. Stanislav Fajgelj April 2006. 46 OSTALI POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE Pored mera asocijacije zasnovanih na ?2 metrici, razvijeni su pokazatelji koji se zasnivaju na: redukciji greke prognoze jedne varijable ako je poznata druga, ili na Entropiji ili uslovnoj entropiji nominalnih varijabli Ove mere imaju obicno asimetricnu i simetricnu verziju

    47. Stanislav Fajgelj April 2006. 47 OSTALI POKAZATELJI ASOCIJACIJE DVE KATEGORIJALNE VARIJABLE Razvijeni su pokazatelji asocijacije dve nominalne varijable pod nekim posebnim pretpostavkama Za saglasnost dva procenjivaca: Cohenova kappa Za razliku pre posle: Mc Nemmar Za nezavisnost ocena u vie ponovljenih merenja: MantelHaenszel

    48. Multivarijatna analiza nominalnih varijabli

    49. Stanislav Fajgelj April 2006. 49 LOGLINEARNI MODELI Analogni faktorskim nacrtima analize varijanse. Dve ili vie nominalnih varijabli su prediktori (nezavisne varijable), a frekvencije u tabeli su kriterijum (zavisna varijabla). Svaka nominalna varijabla je glavni efekt, a njihove kombinacije su efekti interakcije.

    50. Stanislav Fajgelj April 2006. 50 LOGLINEARNI MODELI Posebno su pogodni za tabele kontingencije sa vie ulaza Ocenjuje se doprinos svakog glavnog efekta zasebno Ocenjuje se i doprinos interakcije glavnih efekata Interakcije vieg reda se obicno iskljucuju iz modela (nezasiceni modeli).

    51. Stanislav Fajgelj April 2006. 51 LOGLINEARNI MODELI Loglinearni model za kontingencionu matricu sa dve varijable (puni zasiceni): ln(eij) = ? + ?i + ?j + ?ij ? i ? su parametri modela. Obicna analiza kontaba podrazumeva model: ln(eij) = ? + ?i + ?j, dakle bez interakcije varijable su nezavisne.

    52. Stanislav Fajgelj April 2006. 52 GLAVNE KOMPONENTE Analiza glavnih komponenti nominalnih varijabli bazira se na: indikatorskim matricama B Trai se svojstvena struktura matrice: P = BtBn-1 Tacnije vri se dekompozicija singularnih vrednosti matrice B: B = U?1/2Vt Matrica P je singularna: ima m 1 nultih svojstvenih vrednosti. Takode, prva svojstvena vrednost je trivijalna jer je uvek 1.

    53. Stanislav Fajgelj April 2006. 53 OSTALE TEHNIKE MVA Na indikatorskim matricama baziraju se i sve druge tehnike MVA koje u osnovi imaju glavne komponente ili dekompoziciju singularnih vrednosti (SVD): Kanonicka korelaciona analiza Faktorska analiza Kanonicka diskriminativna analiza Viestruka regresiona analiza Naravno, ako su varijable izvorno dihotomne, tehnike MVA se primenjuju direktno

    54. Stanislav Fajgelj April 2006. 54 KORESPONDENTNA ANALIZA Postoji bivarijatna i multivarijanta korespondentna analiza U oba slucaja se slikovito moe opisati kao faktorska analiza kontingencione tabele Vani termini su: profili, mase, inercije i kosinusi uglova. Oni se odnose na poloaj tacaka u prostoru Tacke su kategorije nominalnih varijabli Najkorisniji je graficki prikaz rasprenja tacaka

    55. Stanislav Fajgelj April 2006. 55 OPTIMALNO SKALIRANJE Ono je veoma blisko korespondentnoj analizi. Radi se o vrlo slicnoj grupi metoda koje u raznim zemljama imaju razlicite nazive Optimalno skaliranje prihvata varijable svih nivoa merenja Cilj analize je da se sve ukljucene varijable kvantifikuju tako da zadovoljavaju kriterijum homogenosti

    56. Stanislav Fajgelj April 2006. 56 OPTIMALNO SKALIRANJE Kategorije nominalnih varijabli se takode kvantifikuju, pa je optimalno skaliranje jedan od najboljih nacina da se nominalne varijable transformiu u intervalne kvantifikuju Drugi osnovni cilj optimalnog skaliranja je slican korespondentnoj analizi: faktorska analiza skupa varijabli Graficki prikaz kategorija i objekata

    57. Stanislav Fajgelj April 2006. 57 KLASTER ANALIZA Najceci nacin je da se izracunaju distance na nominalnim varijablama Racunanje ovih distanci je olakano ako su varijable dihotomne Na matrici distanci objekata se onda moe primeniti bilo koja hijerarhijska ili nehijerahijska metoda

    58. Stanislav Fajgelj April 2006. 58 KLASTER ANALIZA Alternativno, nominalne varijable se mogu transformisati u intervalne i zatim podvrci klasterisanju Takav pristup je usvojen u optimalnom skaliranju nominalne varijable se prvo kvantifikuju

    59. Stanislav Fajgelj April 2006. 59 KLASTER ANALIZA Takode, moguce je primeniti konverziju nominalnih varijabli u indikatorske matrice, na osnovu toga izvriti kvantifikaciju putem GK i nastaviti sa uobicajenim postupkom klaster analize Na indikatorskim matricama moguce je primeniti i neuronske mree

More Related