1 / 20

R egressioonanalüüs

R egressioonanalüüs. Lineaarse regressiooni korral uuritakse sõltuvust kujul. (1). Tegelikult vaadeldud Y i on valemiga (1) arvutatud väärtusest mõnevõrra ( e i võrra) erinev:. Lineaarne regressioon.

Télécharger la présentation

R egressioonanalüüs

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Regressioonanalüüs

  2. Lineaarse regressiooni korral uuritakse sõltuvust kujul (1) Tegelikult vaadeldud Yi on valemiga (1) arvutatud väärtusest mõnevõrra (eivõrra) erinev: Lineaarne regressioon Kui tunnuste X ja Y vahel on tugev lineaarne korrelatsioon, siis on võimalik koostada lineaarne mudel, mis väljendab ühe tunnuse keskväärtuse sõltuvust teisest tunnusest. Ühe tunnuse (juhusliku suuruse) modelleerimisega teise tunnuse abil tegeleb regressioonanalüüs. kus aja b on vähimruutude meetodi abil määratavad parameeetrid e. regressioonikordajad.

  3. 1) 2) (juhuslikud suurused ei on sama dispersiooniga) 3) (juhuslikud suurused ei on sõltumatud) y E(Yi|X=xi ) xi x Lineaarne regressioon Lineaarse mudeli puhul eeldatakse, et

  4. y ^ y = a + bx yi ei xi x ^ yi Vähimruutude meetod (I) Hälbed: ei= (a + bxi) - yi Hälvete ruutude summa: Vähimruutude meetodi idee kohaselt leitakse kahe muutuja funktsiooni G(a, b) miinimum.

  5. liitfunktsiooni diferentseerimise reegel summa diferentseerimise reegel Lineaarne võrrand a ja b suhtes. Valimi põhjal leitavad konstandid Vähimruutude meetod (II) Esmalt leiame kriitilise punktid, võrdsustades osatuletised nulliga:

  6. Lineaarne võrrand a ja b suhtes. Vähimruutude meetod (III) Samuti peab kriitilises punktis nulliga võrduma osatuletis b järgi: Saime kahest tundmatust ja kahest võrrandist koosneva lineaarse võrrandisüsteemi: Sellest süsteemist avaldame a ja b:

  7. Regressioonisirge võrrand on avaldatav ka kujul millest on näha, et regressioonisirge läbib punkti , mida nimetatakse korrelatsiooni keskpunktiks. Vähimruutude meetod (IV) Kui süsteem on lahenduv, siis, leides teist järku osatuletised kriitilise punkti kohal, saab näidata, et selles punktis on funktsioonil G(a, b) miinimum.

  8. mõõdetud väärtuste yi aritmeetiline keskmine ; 2) mõõdetud väärtuste yi koguvariatsioon ; 3) lineaarse regressioonimudeliga selgitatav variatsioon kus on lineaarse regressioonimudeli kohaselt arvutatud väärtus („silutud väärtus“) ; 4) variatsioon, mis ei ole selgitatav lineaarse regressiooniga: Determinatsioonikordaja Determinatsioonikordaja mõõdab, kui hästi regressioonisirge lähendab vaatlusandmeid. Selleks, et determinatsioonikordajat leida, arvutatakse:

  9. Suurused on seotud valemiga 5) Determinatsioonikordaja on lineaarse regressioonimudeliga selgitatava variatsiooni ja koguvariatsiooni suhe Determinatsioonikordaja väärtus rahuldab võrratusi . ning ta väljendab, kui suur osa sõltuva muutuja Y kogumuudust on selgitatav sõltumatu muutuja X muuduga. Determinatsioonikordaja (II)

  10. Mõõdeti aparaatide testimiseks kulutatud aega: y (x, y) x Aritmeetilised keskmised: Näide (I) Lineaarse regressiooni parameetrid:

  11. Näide (II) Determinatsioonikordaja: Järeldus. Lineaarne regressioonimudel kirjeldab mõõdetud suurusi väga hästi: 99,6% sõltuva muutuja kogumuudust on kirjeldatud regressioonivõrrandiga.

  12. Regressioonisirge parameetrite usalduspiirkonnad Regressioonisirge parameetrite a ja b usalduspiirkondade leidmiseks: 1) Leiame prognoosijäägi ei standardhälbe hinnangu: 2) Leiame parameetrite a ja b standardhälvete hinnangud: 3) Etteantud usaldusnivoo b puhul on a ja b usalduspiirkonnad: kus k = n – 2 ja a = (1 + b) / 2 ja t(k; a) on Studenti jaotuse kvantiil.

  13. Viimativaadeldud näites leidsime: n = 12 1) 2) Näide Leiame parameetrite a ja b 95%-lised usalduspiirid.

  14. 3) Näide (II) 4) vabaliikme a 95%-lised usalduspiirid: 5) lineaarliikme kordaja b 95%-lised usalduspiirid:

  15. kus a = (1 + b) / 2 ja k = n – 2 ja on Studenti jaotuse kvantiil. Statistilised prognoosid ja nende usaldatavus Prognoosi punkthinnang: Prognoosi punkthinnangu standardhälve: Prognoosi usalduspiirid usaldunivooga b:

  16. Prognoosime eelneva näite põhjal muutuja Y väärtust, kui xp = 6,2. y (x, y) x Näide Prognoosi punkthinnang: = Prognoosi punkthinnangu standardhälve: Prognoosi 90%-lised usalduspiirid:

  17. Multiregressioon (I) Kui sõltumatuid muutujaid on rohkem kui üks (näiteks X ja Z) ning nad on lineaarses korrelatiivses seoses sõltuva muutujaga Y, siis võib otsida üldkogumi regressioonimudelit kujul kus e on viga, mille keskväärtus Ee = 0. Üldkogumi regressiooni hindamiseks kasutatakse regressioonitasapinna võrrandit kus kordajad a, b ja c leitakse vähimruutude meetodi abil, minimiseerides hälvete ruutude summa

  18. Multiregressioon (II) Parameetrite a, b ja c määramiseks saame lineaarvõrrandite süsteemi Mitmene determinatsioonikordaja arvutatakse analoogselt lihtregressiooni juhuga ning samad valemid kehtivad ka prognoosi täpsuse ning parameetrite usalduspiiride leidmiseks

  19. Mõõdetud suurused: X – ettevõtte reklaamikulud meedias; Z - ettevõtte reklaamikulud müügipunktis; Y – müügitulud. Koostame lineaarse mudeli S Näide

  20. Näide (II) Võrrandisüsteem a, b ja c määramiseks: Lahend: a = 2,160; b = 3,027; c = 0,699 Mudel: Mitmene determinatsioonikordaja:

More Related