1 / 29

POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY

POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY.

Télécharger la présentation

POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY

  2. Triedenie síce poskytuje celkový prehľad o základnej štruktúre skúmaného štatistického súboru, ale hlavne pri porovnávaní viacerých súborov len pomocou radov rozdelenia početností by bolo veľmi nepružné a nepresné. Preto sa snažíme skoncentrovať informácie obsiahnuté v získaných údajoch o štatistickom znaku formou zodpovedajúcich charakteristík, ktoré by dostatočne spoľahlivo popisovali rozhodujúce vlastnosti skúmaného súboru. Medzi rozhodujúce vlastnosti štatistických znakov zaraďujeme polohu (úroveň), kolísanie (variabilitu), šikmosť (asymetriu) a špicatosť (exces). • Číselné charakteristiky koncentrovanou formou – jedným číslom – vyjadrujú určitú vlastnosť skúmaného štatistického znaku (väčšinou sú použiteľné pre kvantitatívne štatistické znaky, len niektoré pre kvalitatívne štatistické znaky) • Popisné charakteristiky delíme na: • charakteristiky polohy (úrovne) • charakteristiky variability (premenlivosti) • charakteristiky šikmosti (asymetrie) • charakteristiky špicatosti (excesu) Základné Doplnkové doc.Ing. Peter Obtulovič,CSc

  3. Číselné charakteristiky polohy • Za rozhodujúcu vlastnosť štatistického znaku považujeme jeho polohu (úroveň alebo koncentráciu). Meria sa pomocou stredných hodnôt, ktoré charakterizujú polohu znaku jedným číslom, nachádzajúcim sa medzi minimálnou a maximálnou hodnotou znaku v súbore. Charakteristiky polohy sú čísla spĺňajúce tieto požiadavky: • musia byť jednoznačne, presne definované • pri ich výpočte sa berú do úvahy všetky jednotky štatistického súboru • v štatistickom súbore musia byť ľahko zistiteľné • ich vlastnosti umožňujú porovnanie stredných hodnôt za niekoľko súborov • Stredné hodnoty sa najčastejšie delia na dve skupiny: • priemery • ostatné stredné hodnoty • Priemery sú stredné hodnoty počítané zo všetkých údajov štatistického súboru, pričom poskytujú v koncentrovanej forme informácie o polohe hodnôt štatistického znaku. Najdôležitejšie sú priemer aritmetický, harmonický, geometrický a kvadratický. doc.Ing. Peter Obtulovič,CSc

  4. Najrozšírenejším z priemerov je aritmetický priemer , ktorý zo zistených hodnôt x1, x2 ... xn, vypočítame: Aritmetický priemer počítaný podľa vzťahu (2.1) sa nazýva jednoduchý aritmetický priemer. Ak sú hodnoty štatistického znaku usporiadané do radu rozdelenia početností, resp. do intervalového rozdelenia početností aritmetický priemer vypočítame: Početnosti ni , fi udávajú váhu jednotlivých variantov znaku x1, x2 ... xn, čo vedie k názvu aritmetického priemeru počítaného podľa vzťahu (2.2) vážený aritmetický priemer. Pri výpočte číselných charakteristík z intervalového rozdelenia početností sa prepočíta stred intervalu : kde i =1,2 ... m doc.Ing. Peter Obtulovič,CSc

  5. Aritmetický priemer v oboch uvedených výpočtových tvaroch predstavuje hodnotu znaku, ktorú vypočítame ako súčet všetkých hodnôt znaku delenú ich počtom. Z definície aritmetického priemeru bezprostredne vyplývajú jeho dôležité vlastnosti: stálosť súčtu hodnôt tz.: ak každú hodnotu znaku nahradíme aritmetickým priemerom súčet sa nezmení. 2. súčet odchýlok hodnôt znaku od aritmetického priemeru sa rovná nule. 3. súčet štvorcov odchýlok hodnôt znaku od aritmetického priemeru je minimálny (tj. menší ako súčet odchýlok hodnôt znaku od ľubovoľné zvoleného čísla a) doc.Ing. Peter Obtulovič,CSc

  6. 4. Aritmetický priemer konštánt je rovný tejto konštante. • 5. Ak násobíme alebo delíme jednotlivé triedne početnosti v štatistickom súbore ľubovoľnou konštantou, aritmetický priemer sa nezmení. • 6. Ak pripočítame (odpočítame) k jednotlivým hodnotám znaku konštantu, zvýši (zníži) sa o túto konštantu i aritmetický priemer. V prípade násobenia (delenia) jednotlivých hodnôt znaku konštantou je touto konštantou násobený (delený) aj aritmetický priemer. • Aritmetický priemer sa ako charakteristika polohy hodnôt znaku v štatistickom súbore používa najčastejšie pre jeho jednoduchý výpočet a výhodné matematické vlastnosti. Na druhej strane si však treba uvedomiť, že aritmetický priemer je citlivý na extrémne hodnoty znaku, čím môže podstatne skresliť jeho samotnú interpretáciu. doc.Ing. Peter Obtulovič,CSc

  7. Harmonický priemer sa používa vtedy ak je medzi hodnotami znaku a výsledným javom nepriamy vzťah, tj. váhy hodnôt znaku v štatistickom súbore sú dané nepriamo. • jednoduchý harmonický priemer vypočítame: • vážený harmonický priemer vypočítame: • Geometrický priemer sa používa na spriemerovanie hodnôt štatistického znaku, medzi ktorými je multiplikatívny vzťah. • jednoduchý geometrický priemer vypočítame doc.Ing. Peter Obtulovič,CSc

  8. vážený geometrický priemer vypočítame: S geometrickým priemerom sa v praxi stretneme pri výpočte priemerného koeficienta rastu a v teórii indexov. Nakoniec sa ešte zmienime o kvadratickom priemere, ktorý má síce malé praktické použitie, ale môžeme sa s ním stretnúť pri mierach variability, kedy je jedna z nich (smerodajná odchýlka) vlastne kvadratickým priemerom odchýlok jednotlivých hodnôt štatistického znaku od ich aritmetického priemeru. Jednoduchý kvadratický priemer vypočítame: resp. vážený kvadratický priemer doc.Ing. Peter Obtulovič,CSc

  9. Medzi uvedenými štyrmi typmi priemerov platí relácia nerovnosti: Rovnosť vo vzťahu (2.12) platí len v prípade, kedy sú všetky hodnoty znaku v súbore rovnaké, ak sa odlišuje aspoň jedna hodnota platí už relácia ostrej nerovnosti. Ostatné strednéhodnoty sú také stredné hodnoty, ktoré v skúmaných štatistických súboroch zaujímajú charakteristickú polohu a ich veľkosť nezáleží od veľkosti všetkých hodnôt štatistického súboru, ale len od ich rozloženia v tomto súbore. Preto ich používame hlavne pri výskyte extrémnych hodnôt v skúmanom súbore. Medzi ostatné stredné hodnoty zaraďujeme modus, medián a kvantily.  Modus definujeme ako hodnotu skúmaného štatistického znaku, ktorá sa v súbore najčastejšie vyskytuje. Hlavne pri výskyte extrémnych hodnôt, alebo pri výraznej koncentrácii znaku na začiatku resp. na konci oboru hodnôt sa môže modus značne odchýliť od priemeru, pričom však vernejšie charakterizuje polohu. Modus tak predstavuje najtypickejšiu hodnotu daného znaku v súbore, charakterizovanú vrcholom rozdelenia početností. Podľa počtu vrcholov rozlišujeme jednovrcholové rozdelenie početností a viacvrcholové rozdelenie početností. Väčší počet vrcholov rozdelenia početností než jeden má príčinu v nerovnorodosti skúmaného štatistického súboru. doc.Ing. Peter Obtulovič,CSc

  10. Modus vypočítame z radu rozdelenia početností ako hodnotu znaku s maximálnou absolútnou početnosťou, tj.: resp. z intervalového rozdelenia početností: kde a – dolná hranica modálneho, tj. najpočetnejšieho intervalu h – šírka modálneho intervalu d0 – diferencia absolútnych početností modálneho intervalu a predchádzajúceho d1– diferencia absolútnych početností modálneho intervalu a nasledujúceho doc.Ing. Peter Obtulovič,CSc

  11. Medián definujeme ako prostrednú hodnotu usporiadaného štatistického súboru, ktorá ho rozdeľuje na dva početne rovnako veľké čiastkové súbory, pričom rovnaký počet štatistických jednotiek je menší ako medián a rovnaký počet štatistických jednotiek je väčší ako medián. Pri výpočte mediánu je potrebné rozlišovať či má súbor párny alebo nepárny počet štatistických jednotiek. Poradie mediánového členar v štatistickom súbore s nepárnym počtom štatistických jednotiek vypočítame: Pri výpočte mediánu z intervalového rozdelenia početností musíme určiť mediánový interval, tj. interval v ktorom leží (v prípade že n je nepárne) resp. ležia (v prípade, že n je párne) prostredné hodnoty. Ich poradie vypočítame analogicky ako v predchádzajúcom prípade tj. pre nepárny počet podľa vzťahu (2.15), resp. pre párny počet podľa vzťahu (2.17) a medián vypočítame podľa vzťahu ( 2.19): doc.Ing. Peter Obtulovič,CSc

  12. Kvantil je hodnota, ktorá rozdeľuje usporiadaný súbor hodnôt určitého štatistického znaku na dve časti, jedna obsahuje hodnoty, ktoré sú menšie (alebo rovnaké) ako kvantil, druhá časť obsahuje hodnoty, ktoré sú väčšie (alebo rovnaké) ako kvantil. Polohu kvantilu v štatistickom súbore vyjadrujeme v percentách. Tak napríklad 50 % kvantil je medián. Medzi často používané kvantily patria kvartily, decily a percentily. Kvartily sú hodnoty, ktoré delia usporiadaný štatistický súbor na štyri časti, pričom každá z týchto častí obsahuje práve 25 % jednotiek. Kvartily sú tri. Dolný kvartil oddeľuje štvrtinu najnižších hodnôt znaku. Prostredný kvartil je pochopiteľne medián a horný kvartil , ktorý oddeľuje 75 % hodnôt znaku od zostávajúcich 25 % najvyšších hodnôt znaku. Podobne sú definované decily , ktoré delia usporiadaný súbor na desať rovnako početných častí. Percentily , delia usporiadaný súbor na 100 rovnako početných častí. doc.Ing. Peter Obtulovič,CSc

  13. ~  _ X < X = X < ~ X = X _  ~ _ X < X < X X Vzájomná poloha modusu, mediánu a aritmetického priemeru v štat. súbore - symetrické rozdelenie - asymetrické rozdelenie pravostranné ľavostranné doc.Ing. Peter Obtulovič,CSc

  14. doc.Ing. Peter Obtulovič,CSc

  15. doc.Ing. Peter Obtulovič,CSc

  16. Číselné charakteristiky variability. Variabilita je popri polohe štatistického znaku druhou dôležitou vlastnosťou vyjadrujúcou kolísanie (premenlivosť) hodnôt štatistického súboru. Často sa stretávame so situáciou, že rozdelenia početností môžu mať zhodnú polohu, ale pritom sa významne odlišujú. Odlišnosť je najčastejšie spôsobená  rozdielom v maximálnych a minimálnych hodnotách, rozdielmi medzi jednotlivými hodnotami znaku navzájom, rozdielom medzi jednotlivými hodnotami znaku a strednou hodnotou, v rôznom rozložení početnosti hodnôt znaku v súbore, čo sa prejavuje v určitých špecifických vlastnostiach každého štatistického súboru. Variabilita hodnôt znaku v štatistickom súbore môže mať príčiny subjektívneho aj objektívneho charakteru. Pri skúmaní štatistických znakov sa snažíme o čo najväčšie obmedzenie variability subjektívneho charakteru, no aj napriek tomu sa nedá v praxi úplne vylúčiť, musíme teda pri jej analýze uvažovať aj s jej prítomnosťou v štatistickom súbore. Na meranie variability sa najčastejšie používajú tieto miery: ● miery variability, ktorých veľkosť ovplyvňujú len niektoré hodnoty v súbore variačné rozpätie kvantilové rozpätie kvartilové rozpätie doc.Ing. Peter Obtulovič,CSc

  17. ● miery variability, ktorých veľkosť je závislá od každej hodnoty znaku vyjadrené v absolútnych jednotkách rozptyl štandardná (smerodajná) odchýlka ● miery variability, ktorých veľkosť je závislá od každej hodnoty znaku vyjadrené v relatívnej forme variačný koeficient. doc.Ing. Peter Obtulovič,CSc

  18. doc.Ing. Peter Obtulovič,CSc

  19. Rozptyl má výhodné vlastnosti, pre ktoré je vhodný nielen ako miera variability štatistického súboru, ale používa sa aj pri konštrukcii zložitejších štatistických charakteristík. Aby sme mohli vyjadriť variabilitu štatistického znaku v pôvodných merných jednotkách často sa popisuje pomocou kladne vzatej odmocniny z rozptylu, ktorá sa nazýva štandardná (smerodajná) odchýlka : Štandardná odchýlka vyjadruje variabilitu štatistického znaku v pôvodných merných jednotkách, pričom je definovaná ako kvadratický priemer odchýlok jednotlivých hodnôt znaku od jeho aritmetického priemeru. doc.Ing. Peter Obtulovič,CSc

  20. doc.Ing. Peter Obtulovič,CSc

  21. Doteraz uvedené miery variability poskytujú v koncentrovanej podobe informácie o veľkosti variability určitého štatistického znaku v pôvodných merných jednotkách, no nepostačujú pri porovnávaní variability niekoľkých súborov, vyjadrených v rôznych merných jednotkách, poprípade aj v rovnakých merných jednotkách , ale s rôznou úrovňou hodnôt znaku. V takýchto prípadoch používame relatívne charakteristiky variability. Tie vylučujú vplyv rôznej úrovne alebo vplyv merných jednotiek tým, že charakteristiky absolútnej variability dávajú do pomeru s aritmetickým priemerom alebo mediánom. Najznámejšou mierou relatívnej variability je variačný koeficient : definovaný ako pomer štandardnej odchýlky a aritmetického priemeru. Variačný koeficient je bezrozmerné číslo, jeho stonásobok udáva variabilitu v percentách. Podľa veľmi hrubého pravidla variačný koeficient vyšší ako 30 – 40 % je znakom značnej nesúrodosti štatistického súboru. Možnosť interpretovať variačný koeficient v % dosť často zvádza užívateľov k  chápaniu jeho definičného oboru od 0 % do 100 %, resp. od 0 do 1. Je to zásadný omyl, a to už preto, že nejde o štruktúrny ukazovateľ, v ktorom by súčet zložiek dával 100 % celku. Vzhľadom k tomu, že priemer môže byť i číslo záporné ( napr. priemerná teplota v januári u nás na Slovensku, či záporný zisk v súbore podnikov ), nie je možné vylúčiť, že variačný koeficient je aj číslo záporné. Všeobecne je teda definičným oborom interval . Špeciálnym prípadom je situácia, keď sa aritmetický priemer rovná nule, kedy nie je možné variačný koeficient vypočítať ( delenie nulou je z matematického hľadiska neprípustné ). doc.Ing. Peter Obtulovič,CSc

  22. doc.Ing. Peter Obtulovič,CSc

  23. doc.Ing. Peter Obtulovič,CSc

  24. Miery šikmosti a špicatosti • Miery šikmosti sú založené na porovnaní stupňa koncentrácie malých hodnôt sledovaného štatistického znaku so stupňom koncentrácie veľkých hodnôt tohto znaku. Rovnaký stupeň hustoty malých a veľkých hodnôt sa prejavuje v symetrii tvaru rozdelenia početností. Väčší stupeň koncentrácie malých hodnôt v porovnaní s koncentráciou veľkých hodnôt sa prejaví zošikmením tvaru rozdelenia doľava (príslušná miera šikmosti je kladná). Naopak väčšia koncentrácia veľkých hodnôt v porovnaní s hustotou malých hodnôt sa prejaví spravidla zošikmením tvaru rozdelenia početností doprava (príslušná miera šikmosti je záporná). doc.Ing. Peter Obtulovič,CSc

  25. a) Pearsonova miera šikmosti=0 symetrické rozdelenie >0 pozitívna asymetria 0 negatívna asymetria b) Koeficient šikmosti (stručne šikmosť) - jednoduchá forma - vážená forma 1 = 0 symetrické rozdelenie 1 > 0 pozitívna (ľavostranná) asymetria 1 < 0 negatívna (pravostranná) asymetria doc.Ing. Peter Obtulovič,CSc

  26. g1 > 0 g1 = 0 g1 < 0 doc.Ing. Peter Obtulovič,CSc

  27. Miery špicatosti sú založené na porovnávaní stupňa koncentrácie hodnôt prostrednej veľkosti so stupňom nahustenia ostatných hodnôt. Ak je podiel početnosti prostredných hodnôt porovnateľný s početnosťami ostatných, resp. všetkých hodnôt premennej, špicatosť sa prejavuje spravidla plochým tvarom rozdelenia početností, naopak väčší stupeň koncentrácie prostredných hodnôt v porovnaní s početnosťami všetkých ostatných hodnôt sa prejaví špicatým tvarom rozdelenia početností. doc.Ing. Peter Obtulovič,CSc

  28. g2 > 0 g2 > 0 g2 = 0 g2 < 0 doc.Ing. Peter Obtulovič,CSc

  29. koeficient špicatosti - 2 bezrozmerné číslo 2 = 0 normálne rozdelenie 2< 0 plochšie rozdelenie 2 > 0 špicatejšie rozdelenie - jednoduchá forma - vážená forma doc.Ing. Peter Obtulovič,CSc

More Related