1 / 32

Két kvantitatív változó kapcsolatának vizsgálata

Két kvantitatív változó kapcsolatának vizsgálata. Egy KSH-vizsgálat adatai. 55. 50. 45. Születési testhossz (cm). 40. 35. 1. 2. 3. 4. 5. Születési súly (kg). Ha az anya 50 kg súlyú, kb. hány kiló 10 éves gyermeke?. Az előrejelzés problémája. Előrejelzés egy egyenes segítségével.

ludwig
Télécharger la présentation

Két kvantitatív változó kapcsolatának vizsgálata

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Két kvantitatív változó kapcsolatának vizsgálata

  2. Egy KSH-vizsgálat adatai 55 50 45 Születési testhossz (cm) 40 35 1 2 3 4 5 Születési súly (kg)

  3. Ha az anya 50 kg súlyú, kb. hány kiló 10 éves gyermeke? Az előrejelzés problémája

  4. Előrejelzés egy egyenes segítségével 45 40 35 Gyerek tests. 10 év (kg) 30 25 20 40 50 60 70 80 Anya testsúlya (kg)

  5. Melyik a legjobb előrejelző egyenes? 45 40 35 Gyerek tests. 10 év (kg) 30 25 20 40 50 60 70 80 Anya testsúlya (kg)

  6. Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx Az előrejelzés hibája egy személynél: (y - ŷ)2 A legjobb előrejelzésnél E[(Y - Ŷ)2] minimális Az előrejelzés alapfogalmai

  7. Legjobb előrejelző egyenes:regressziós egyenes Regressziós egyenes képlete,y = a + bx, a lineáris regressziós függvény Regressziós egyenlet meghatározása: regressziós feladat Regresszió hibája=hibavariancia: Res = E((Y - Ŷ)2) aés bparaméter:regressziós együtthatók Szokásos szóhasználat

  8. Változó Átlag Variancia Regressziós egyenlet X: SúlySzül 3,21 0,25 Y = 26,05 + 2,24X Y: Súly10 33,2 46,4 Res = 45,20 X: ThosszSzül 50,2 6,4 Y = 96,88 + 0,83X Y: Thossz10 138,7 41,5 Res = 37,09 X: Anyatesth 161,1 38,3 Y = 77,66 + 0,38X Y: Thossz10 138,7 41,5 Res = 36,02 Példák lineáris regresszióra

  9. Y legjobb előrejelzése abban az esetben, ha nem tudunk semmit X-ről vagy más változókról:mY Ezen előrejelzés hibája:E[(Y - mY)2] = Var(Y) X-et is felhasználva a legkisebb hibájú előrejelzés: Ŷ = a + bX, az X változó Y-ra von. lineáris regressziós függvénye. Ezen előrejelzés hibája, az ún. hibavariancia: E[(Y - Ŷ)2] = Res Az Y kvantitatív változó előrejelzéseX ismerete nélkül, illetve X ismeretében

  10. Minél informatívabb X az Y változóra nézve, annál kisebb lesz Res a Var(Y)-hoz viszonyítva, vagyis annál kisebb lesz a Res/Var(Y) hányados. Viszont annál nagyobb lesz a Milyen szoros az együttjárása Y-nakaz X kvantitatív változóval? mutató, az X változónak az Y változóra vonatkozólineáris determinációs együtthatója.

  11. 0 £ Det(X,Y) £ 1 Det(X,Y) = 0 csakkor, ha Res = Var(Y).Ekkor X nem tartalmaz lineáris jellegű információt Y-ra nézve. Det(X,Y) = 1 csakkor, ha Res = 0. Ekkor Y hibamentesen előrejelezhető X által. X determinisztikusan meghatározza Y-t, éspedig lineáris függvény formájában. Alapösszefüggéseka determinációs együtthatóra

  12. Jól mutatja, hogy Y milyen mértékben függ lineárisan X-től, hogy X milyen mértékben határozza meg,“determinálja” Y-t. FONTOS: Det(X,Y) = Det(Y,X). Jelzi, hogy az X és az Y változó milyen mértékben határozza meg egymást, vagy másképpen: X és Y milyen szoros lineáris típusú kapcsolatban van egymással. A determinációs együttható

  13. DEFINÍCIÓ: Y független X-től, ha Y eloszlása ugyanaz bármely X = x mellett KÉRDÉS: Függ-e a személy magassága a nemétől? Két véletlen változó függetlensége

  14. Függ-e a születési testhossz a születési súlytól? És fordítva? 55 50 Születési testhossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

  15. Függ-e az Y változó X-től? 1 80 Y Y 50 0,5 20 0 X X 20 50 80 0 0,5 1

  16. Függ-e az Y változó X-től? Y 2 X -3 0 3

  17. FONTOS: Ha Y független X-től, akkor X is független Y-tól A függetlenség kölcsönös

  18. Bármely X és Y kvantitatív változóra: E(X+Y) = E(X) + E(Y) Ha X és Y független egymástól, akkor E(X·Y) = E(X)·E(Y), vagyis ekkor E(X·Y) - E(X)·E(Y) = 0, de a megfordítás nem mindig igaz. Függetlenség és elméleti átlag

  19. DEFINÍCIÓ: Cov(X,Y) = E(X·Y) - E(X)·E(Y) Ha X és Y független változók, akkor Cov(X,Y) = 0 A megfordítás nem mindig igaz, vagyis nulla kovariancia esetén X és Y nem biztos, hogy független egymástól. Két változó kovarianciája

  20. Ha X vagy Y szórását megkétszerezzük, kétszeresére nő kovarianciájuk is. Szórásokkal leosztott, ún. “standardizált” kovariancia =korrelációs együttható: Két kvantitatív változó korrelációs együtthatója

  21. A korrelációs együttható négyzete mindig megegyezik a determinációs együtthatóval: [r(X,Y)]2 = Det(X,Y) r(X,Y) tehát az X és Y közti összefüggés mértékét jelzi, vagyis a lineáris típusú kapcsolat szorosságának mérőszáma. Összefüggés a korrelációs együttható és a determinációs együttható között

  22. -1 £r(X,Y) £ 1 Ha X és Y független, akkorr(X,Y) = 0. Ha r(X,Y) = 0,vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens. A korrelációs együttható jellemzői

  23. Regresszió és korreláció kapcsolata • Az elméleti korrelációs együttható szokásos jelölései:r(X,Y), rXY vagyr • A lineáris regresszió képlete: • Ŷ = a + bX vagy Ŷ = aYX + bYXX • Ekkor • sXbYX = sYr és zY= rzX

  24. Ha X értékét 1 egységgel növeljük, akkor Y értéke várhatóanbYX egységgel nő. Ha viszontsXegységgel növeljük, akkor Y értéke várhatóan rsYegységgel nő. relőjele összhangban van a regressziós egyenes irányával. Ha a regressziós egyenes emelkedő, akkor X és Y között pozitív a korreláció. Ha ereszkedő, akkorrnegatív. Két következmény

  25. r = 0,5

  26. r = -0,5

  27. r = -0,9

  28. r = -0,83

  29. r = 0

  30. Jelölése:rXY vagy r Egyik képlete: A mintabeli korrelációs együttható • Ez az elméleti kovariancia mintabeli becslése osztva a két mintaszórás szorzatával. • rXY az elméleti korr. eh. egyik pontbecslése.

  31. 0,95 0,025 0,025 t -t 0,05 0,05 Feltétel: X és Y együttes eloszlása legyen normális Korrel. eh. vizsgálata X-minta H0: rXY = 0 t (f = n-2) 0 t £ -t0,05 |t| < t0,05 t ³ t0,05 H1: rXY < 0 H2: rXY > 0 H0

  32. Feltétel: X és Y együttes eloszlása legyen normális Korrel. eh. vizsgálata X-minta H0: rXY = 0 A t-táblázat helyett használható az rXYeh. kritikus értékeinek táblázata is. rxy kiszámítása (f = n - 2) r £-r0,05 |r| < r0,05 r ³ r0,05 H1: rXY < 0 H2: rXY > 0 H0

More Related