Hvad er punkt- og intervalestimering?

Statistikog kvantitativ metodePolitik & Administration og Samfundsfag3. semester 2006Lektion 5, tirsdag den 24. oktoberPunkt- og intervalestimering

Hvad er punkt- og intervalestimering? • Estimering betyder blot vurdering, skøn, anslag. Og helt overordnet drejer punkt- og intervalestimering sig om at sige noget om populationen på baggrund af en stikprøve. • Det, som man prøver at anslå i populationen, er forskellige statistikker opgjort eller beregnet ud fra stikprøven. Typisk vil det være et gennemsnit, en andel eller et effektmål (f.eks. en regressionskoefficient). • I dagens lektion vil det hovedsageligt dreje sig om gennemsnit og andele. Et punktestimat af et gennemsnit er blot det bedste, kvalificerede gæt på, hvad gennemsnittet er i populationen. Ved et intervalestimat af gennemsnittet påstår man, at med en bestemt statistisk sandsynlighed vil gennemsnittet i populationen ligge mellem to bestemte punkter (tal).

Notationer vedr. gennemsnit Deskriptivstatistik(stikprøve) Punkt-estimat(stikprøve) Parameter(population) Gennemsnit Standardafvigelse Ovenstående punktestimater er efficiente og uden bias (unbiased and efficient).

Sikkerhedsinterval for gennemsnit(store stikprøver, n ≥ 30) I 95 pct. af tilfældene (eller f.eks. 19 ud af 20) vil stikprøve-gennemsnittet falde inden for intervallet: hvor standardfejlen Dette betyder endvidere, at populationens gennemsnit med 95 pct. sikkerhed vil falde inden for intervallet:

Problemet er, at man ikke kender standardfejlen • Man kan ikke beregne den eksakte standardfejl, fordi man ikke kender standardafvigelsen i populationen. • Man har imidlertid et punktestimat af standardafvigelsen i populationen, nemlig stikprøvens standardafvigelse s • Når stikprøvestørrelsen er 30 eller derover, kan følgende approksimation af standardfejlen benyttes:

Sikkerhedsinterval med den approk-simerede standardfejl Efter erstatning af den korrekte standardfejl med den approksimerede bliver 95 pct. sikkerhedsintervallet som følger: Eller:

Eksempel på intervalestimering Selvplacering på envenstre-/højre skala fra 0 til 10 Hvad kan man sige om gennem-snittet i den danske befolkning pba. stikprøven her? Gennemsnittet ligger med 95 pct. sikkerhed indenfor intervallet: Eller:

Den generelle formel for sikkerheds-interval I det foregående er vist, hvordan man kan bestemme et interval, hvor indenfor populationens gennemsnit med 95 pct. sikkerhed befinder sig. Hertil benyttedes 1,96 som z-værdi. Man bestemmer selvfølgelig selv, hvilken sikkerhed man vil udtale sig med. Men jo større sikkerhed, jo flere standardfejl skal man gå ud til hver side fra det estimerede gennemsnit – med andre ord jo større z-værdi. Den generelle formel for sikkerhedsintervallet bliver:

Sikkerhedsinterval for andele/proportioner Beregning af sikkerhedsintervaller for andele foregår på samme overordnede måde, som når der er tale om sikkerhedsintervaller for gennemsnit. Årsagen er, at en andel er en form for gennemsnit. Eksempel: Data: 0 1 1 0 1 0 0 1 1 1 Andel 1’ere: 6/10 = 0,6 Gennemsnit:

Standardfejlen kan beregnes lettere ved proportioner! Sikkerhedsinterval for andele: Hvor standardfejlen er lig med: Det, der gør beregningen nemmere, er, at standardafvigelsen kan beregnes direkte, uden at skulle se på hver eneste case.

Eurobarometer N = 1.000

Eksempel på beregning af sikkerhedsinterval for andele • Eurobarometeret fra oktober 2003 viser altså, at 57 pct. i en stikprøve på 1.000 personer, tilfældigt udvalgt blandt den danske befolkning på 15 år og derover, er tilhængere af, at vetoretten i EU skal bevares. • Undersøgelsesspørgsmål: Hvilket interval kan vi med 95 pct. sikkerhed sige, at andel tilhængere af vetoretten i populationen lå inden for, selv under den konservative forudsætning, at alle ved ikke-svarerne vil ende med at gå imod vetoretten? • 95 pct. sikkerhedsinterval hvor indenfor populationens andel ligger:

Valgbarometer (endnu et eksempel) • Her ses resultatet fra folketingsvalget i 2005 samt et nyere valgbarometer fra Catinét baseret på tilkendegivelser fra et repræsentativt udsnit på 1.033 vælgere. • Socialdemokratiets tilslutning er tilsyneladende steget. Men hvad kan man egentlig sige om Socialdemokratiets tilslutning på baggrund af stikprøvens resultat? • 95 pct. sikkerhedsinterval for tilslutning til Socialdemokratiet: Hvilket også kan skrives således: • På baggrund af barometret kan man altså ikke med 95 pct. sikkerhed sige, at tilslutningen til Socialdemokratiet er øget ift. valget.

Bestemmelse af stikprøvestørrelse (1) • De fleste surveys har en analyseramme på mellem 1.000 og 2.000 respondenter, og dette sikrer, at andele i populationen med 95 pct. sikkerhed kan bestemmes med en sikkerhedsmargin på plus minus tre procentpoint omkring den andel, man finder i stikprøven. • Men hvordan regner man stikprøvestørrelsen ud på forhånd? Sikkerhedsmargenen afhænger jo af standardafvigelsens størrelse, og denne kender man ikke på forhånd! • Man kan tage ’worst case’ for standardafvigelsen, dvs. den andel hvor variansen er størst: • Den maksimale værdi af denne størrelse opnås ved en andel på 0,5.Altså

Bestemmelse af stikprøvestørrelse (2) Det minimale antal enheder i analyserammen kan nu bestemmes som: hvor B = fejlmargin (error bound) f.eks. 0,01 eller 0,03 - svarende til henholdsvis 1 og 3 pct. Hvis man derforuden på forhånd siger, at man altid vil bruge 95 pct. sikkerhedsniveau, kan man i ligningen erstatte z med 1,96.

Bestemmelse af stikprøvestørrelse (3) På lignende vis kan der bestemmes et minimum antal respondenter ved kvantitative variable. Det minimale antal bestemmes som: Det kan dog her være et problem at bestemme ’worst case’ for variansen. Men hvis man f.eks. anslår, at variablen, som man er interesseret i, er nogenlunde normalfordelt, ved man, at stort set alle observationer ligger i intervallet plus/minus tre standard-afvigelser fra gennemsnittet, og ofte kender man også nogenlunde yderværdierne i fordelingen. Standardafvigelsen antages derfor at være nogenlunde lig med variationsbredden divideret med seks. Og variansen vil være denne værdi opløftet i anden potens.

Hvad er punkt- og intervalestimering?

Hvad er punkt- og intervalestimering?

Presentation Transcript

Samarbejde og koordinering af indsatsen

3F-Punkt; Strategisk og systematisk opplæring og kompetanseheving for medarbeidere

Hvad er op og hvad er ned?

Titel des Projekts ( Schrift : Punkt 90,Fett)

Hvad ska ´ jeg med kommunen?

Hvad gør man i primær/ praksissektoren og hvad bør man gøre?

Musiksociologi

Integrated vs. Federated Search Hvad er hvad?

Hvad er en god tapning?

Uddannelsesmuligheder

Faglig læsning

Uberite eto

Fokus i observation – hvad afgør hvad vi fokuserer på? Og er det, det vigtige vi ser?

Grundlæggende Systemudvikling

PARTNERVOLD

Nyeste viden om hvad der virker for ”udsatte borgere”

Punkt Konsultacyjny

TAJEMNICZY PUNKT G

„ Zielony Punkt” 90-403 Łódź, ul. Zachodnia 70, tel/fax: (42) 630-67-64,

Begreber – forklaring af Statistik

LEISTUNGSBEURTEILUNG IN DER GRUNDSCHULE

GWDG – Kurs Parallelrechner-Programmierung mit MPI MPI Punkt-zu-Punkt-Kommunikation