220 likes | 576 Vues
Siste forelesning er i morgen!. Oppsummeringsforelesning den 5.mai flyttes til fredag 29.april kl. 15.15-17.00 Holdes i dette auditoriet. Slutningsstatistikk. PSY 1010. Utvalg og populasjon. Populasjon: alle enhetene i universet vi definerer, f eks: - Alle over 18 år i Norge (3,5 mill)
E N D
Siste forelesning er i morgen! • Oppsummeringsforelesning den 5.mai flyttes til fredag 29.april kl. 15.15-17.00 • Holdes i dette auditoriet
Slutningsstatistikk PSY 1010
Utvalg og populasjon • Populasjon: alle enhetene i universet vi definerer, f eks: • - Alle over 18 år i Norge (3,5 mill) • Utvalg: avgrenset del av populasjonen • - 200 personer over 18 år Populajson Utvalg
Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg • I populasjonen er og s = 15 • Du trekker tre utvalg á 25 tilfeldige personer fra denne populasjonen og beregner : Utvalg 1: 103 Utvalg 2 101 Utvalg 3 98 Utvalgsfeil (tilfeldigheter) 103-100 = 3 101-100 = 1 98-100 = -2
Utvalgsfeil (sampling error) • Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne” verdien i populasjonen • Vi må derfor regne med at en viss usikkerhet i de verdiene vi har regnet oss fram til basert på utvalget • Vi må ta hensyn til denne feilmarginen hvis vi vil slutte noe om populasjonen ut i fra utvalget
Utvalgsfordeling og standardfeil • Utvalgsfordeling (Sampling distribution): • fordeling over gjennomsnittsnittsverdier til et uendelig antall utvalg trukket fra en populasjon • Standardavviket i en utvalgsfordeling kalles standardfeil (standard error) • Gir et mål på størrelsen på statistisk usikkerhet • Standardfeilen (SX) er en funksjon av to ting: • S : Hvor stort standardavviket i populasjonen er • N: Størrelsen på utvalget
13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 50 % ligger over -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX
Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra en populasjon med et standardavvik (s) på 15 • N = 9 • N = 25 • N = 100 Altså: Størrelsen på utvalget påvirker hvor størrelsen på standardfeilen
N = 100 N = 9 Utvalgsfordeling med ulike utvalgsstørrelserAlle utvalg er trukket fra samme populasjon N = 25 Uendelig antall utvalg med: 85 90 95 100 105 110 115
IQ og morsmelk • Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket er 15 • En forsker har en hypotese om at morsmelk bidrar til høyere IQ • Et 25 utvalg på 12-åringer som er blitt ammet fram til 2 års alder har i snitt en IQ skåre på 103 • Hvor sannsynlig er det at disse har fått = 103 ved en ren tilfeldighet?
Hypotesetesting Nullhypotese (H0): Det er ingen forskjell i IQ i populasjonen mellom barns om er ammet fram til 2 års alder og de som ikke er det Dvs: forskjell skyldes utvalgsfeil / tilfeldigheter Forskningshypotese (H1): Det er en forskjell i IQ i populasjonen mellom barns som er ammet fram til 2 års-alder og andre barn Hvor sannsynlig er det at en forskjell på 3 poeng eller mer skyldes en tilfeldighet? Denne benevnes som p-verdi
13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Normalfordelig og utvalgsfeil Utvalgets = 103 -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX 91 94 97 100 103 106 109
Signifikanstesting • Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)? • I vårt eksempel: en på 103 eller høyere forekommer i 15,9 % av tilfellene vi trekker utvalg med N=25 fra populasjonen (p= 0.159) • Grense for å forkaste nullhypotesen kalles signifikansnivå () : • Vanlig grense: mindre enn 5 % sannsynlighet for at resultatet skyldes en tilfeldighet ( = 0.05) • Kan også være strengere f eks mindre enn 1 % ( = 0.01) • Hvis sjansen for at resultatet skyldes en tilfeldighet er større en signifikansnivået, beholdes nullhypotesen (H0)
Type I og type II feil Aldri 100% sikre på at vi gjør riktig beslutning om å beholde eller forkaste nullhypotesen:
Enhalet og tohalet hypotesetest • En enhalet hypotesetest er retningsbestemt H1 : Barn som ammes fram til 2 år har høyere IQ enn andre • En tohalet hypotesetest er ikke retningsbestemt H1 : Barn som ammes fram til 2 år har forskjellig IQ enn andre (dette betyr at de kan har lavere IQ eller høyere IQ enn populasjonen)
En-halet og to-halet test 1.65 1.96 -1.96
Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg kvinner (n = 36) på en test for sosial intelligens. Vi får følgende Nullhypotese (H0): Det er ingen forskjell mellom menn og kvinner I populasjonen (forskjellen skyldes utvalgsfeil) Forskningshypotese (H1): Det er en forskjell i sosial IQ mellom menn og kvinner i populasjonen Hvor sannsynlig er det at forskjellen på 5 poeng skyldes en tilfeldighet? Denne benevnes som p-verdi
Parametriske hypotesetester • Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter at: • Utvalget er tilfeldig trukket fra populasjonen • Utvalgsfordelingen er normalfordelt rundt populasjonsgjennomsnittet Et tilleggskriterium (kan dog korrigeres for): • Hvis to eller flere utvalg sammenlignes, skal spredingen innen utvalgene være like
Eksempler på parametriske tester • Z-test • er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet? • t-test • Er det forskjell i gjennomsnittsverdi mellom to utvalg? • ANOVA (analysis og varians) • Forskjell i gj.snittsverdi mellom tre eller flere utvalg? • To-veis ANOVA
Ikke-parametriske tester • Benyttes ofte når vi har variabler som er målt på nominal eller ordinalnivå • Eller når forutsetningene for en parametrisk test ikke er oppfylt • Benytter ellers samme logikk som tidligere, dvs. tar hensyn til utvalgsfeil/tilfeldighetenes spill og vurderer resultatene opp i mot dette
Eksempel på ikke-parametrisk test • Er det lettere for en person med lys hudfarge å bli frikjent enn en med mørk hudfarge for en voldsforbrytelse? • Begge variablene (hudfarge og frikjent/dømt) er variabler som vi ikke kan regne gjennomsnitt på • I dette tilfellet benyttes en kji-kvadrat test (2) for å avgjøre om forskjellen er tilfeldig eller ikke
Signifikansnivå og praktisk betydning • Et signifikant resultat er ikke nødvendigvis av stor praktisk betydning • Dette er først og fremst fordi signifikanstesting er sterkt påvirket av utvalgets/utvalgenes størrelse • Store utvalg = lettere å få signifikant resultat (forkaste H0) • Et alternativ er å inkludere mål på effekt isteden, • f eks hvor stor andel kvinner har høyere sosial IQ enn menn • Eller hvor mange standardavvik skårer kvinner over menn