1 / 20

Ugrupperede observationer Middelværdi, varians og spredning

Ugrupperede observationer Middelværdi, varians og spredning. Varians. Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59) 2 +15%*(9-10,59) 2 +21%*(10-10.59) 2 +20%*(11-10,59) 2 +18%*(12-10,59) 2 +14%*(13-10,59) 2 =2,46

Télécharger la présentation

Ugrupperede observationer Middelværdi, varians og spredning

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ugrupperede observationer Middelværdi, varians og spredning

  2. Varians Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59)2+15%*(9-10,59)2+21%*(10-10.59)2+20%*(11-10,59)2+18%*(12-10,59)2+14%*(13-10,59)2=2,46 Dette tal kaldes observationssættets varians: Var(X)=2,46 Hvad fortæller Var(X) ? Hvorfor tager vi kvadratet på forskellen mellem middelværdi og observation?

  3. Spredning Vi tager nu kvadratroden af variansen: Og får spredningen, betegnet med det græske bogstav sigma Spredningen kaldes også standardafvigelsen

  4. Forskellige observationssæt Her har jeg lavet et mere spredt sæt, lad os se på forskelle i middelværdi, varians og spredning

  5. Først stolpediagrammer Middelværdi: 10,59 Middelværdi:10,52 Beregn varians og spredning for andet observationssæt!

  6. Varians og spredning Var(X)=1,5%*(5-10,52)2+…….. (resultat 3,6396) Sammenlignet med første observationssæt får vi altså en større varians og en større spredning som forventet!

  7. Udregning af varians Summen af frekvenserne er 100%=1 Middelværdien E(X)=μ=9*25%+10*50%+11*25% Var(X)= 25% * (9-μ)2 + 50% *(10-μ)2 + 25% * (11-μ)2 Hvis vi ganger parenteserne ud fås: 25%*(92+μ2-2*9*μ) + 50%*(102+μ2-2*10*μ) + 25%*(112+μ2-2*11*μ) = μ2 *(25%+50%+25%) -2μ*(9*25% + 10*50% + 11*25%)+25%*92+50%*102+25%*112 Altså er Var(X)=μ2-2μ* μ +25%*92+50%*102+25%*112 Sidste 3 led (grønne) er middelværdien af X2 derved får vi: Var(X)= - μ2 + E(X2) = E(X2) – E(X)2 og spredningen σ(X)=

  8. Varians og spredning Var(X)= E(X2)-E(X)2 σ(X)=

  9. I regneark:

  10. Grupperede observationer Hvis talmaterialet er grupperet:

  11. Lorentz-diagrammer Lorentz-diagrammer bruges til at illustrere hvor skæv en fordeling er. Bemærk vi forventer en jævn fordeling! Vi ser på indkomstfordelingen for ægtepar og enlige: Lorentz-Indeks er forholdet mellem arealet mellem de to kurver og arealet under diagonal.

  12. Arealet under diagonalen er en retvinklet trekant, som derfor har arealet: ½*100*100= 5000, For at finde arealet mellem kurverne skal man tælle tern eller finde en regneforskrift og integrere. Lorentz-indekset er altså afhængigt af hvor stort arealet mellem kurverne er - jo større areal des større indeks, og dermed des skævere fordeling! Det ses at enliges indkomstfordeling er mere skæv end ægtepars, da arealet mellem kurverne er større.

  13. Model v.hj.a. regression Hvis vi vil finde arealet mellem kurverne må vi finde en regneforskrift for fordelingen, jeg prøver med potensfordelingen:

  14. Regression

  15. Polynomiel model Her får vi den største værdi for R2

  16. Derive Jeg vil afprøve modellen i Derive, så jeg indtaster formlerne og tegner grafen

  17. Derive

  18. Opgave Udfør samme procedure, dvs bestem arealet mellem kurverne, for ægtepar! • Bestem bedste model i regneark • Indsæt formlen i Derive • Beregn integralet mellem formlen og linjen G(x)=x.

  19. Projekt

  20. Projekt Dette er en statistik over aldersfordelingen i befolkningen fra 1787 til 1870. Kan man lave Lorentz-diagrammer over materialet?

More Related