420 likes | 566 Vues
Gazdaságstatisztika. LEÍRÓ STATISZTIKA I. 2. előadás 2013. szeptember 12. Mintavétel. KÖVETKEZTETŐ STATISZTIKA. Sokaság: a vizsgálat tárgyát képező egységek összessége. Következtetés. LEÍRÓ STATISZTIKA.
E N D
Gazdaságstatisztika LEÍRÓ STATISZTIKA I. 2. előadás 2013. szeptember 12.
Mintavétel KÖVETKEZTETŐ STATISZTIKA Sokaság: a vizsgálat tárgyát képező egységek összessége Következtetés LEÍRÓ STATISZTIKA Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel
Statisztikai módszertan ágai • LEÍRÓ vagy DESKRIPTÍV statisztika • A vizsgálat tárgyát képező jelenség tömör, számszerű jellemzését adja. • Nem lép túl a megfigyelés körén, de a megfigyelt adatok legjobb megértésére, bemutatására, összefoglaló jellemzésére törekszik. • Például: • Népszámlálási adatok feldolgozása, elemzése, a népesség számával, összetételével kapcsolatos jellemzők közzététele, megjelenítése • Gazdasági szervezetek legfontosabb adatainak közzététele statisztikai évkönyvekben • Lakásépítésről, oktatásról készített statisztikai összefoglaló • Vállalat gazdálkodásának vizsgálata
Statisztikai módszertan ágai • KÖVETKEZTETŐ statisztika • Fő célja a mintából való következtetés, általánosítás a teljes sokaságra vonatkozóan. • Például: • Minőség-ellenőrzés • Lakosság jövedelmi különbségeinek elemzése • Ingatlan árbecslések • Befektetési tanácsadások • Könyvvizsgálat • Mezőgazdaság
Leíró statisztika Területei: adatgyűjtés adatok ábrázolása adatok csoportosítása, osztályozása adatokkal végzett egyszerűbb aritmetikai műveletek eredmények megjelenítése
1. Adatgyűjtés • Az egyedi mérésekből származó adatok (mennyiségi ismérvek) lehetnek diszkrétek és folytonosak. • Egy diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan sok, egymástól jól elkülöníthető értéket vehet fel. • Háztartások nagysága • Gazdálkodó szervezetek nagysága • Balesetek száma • Mogyorós csokiban a mogyorók száma • Adott időszak alatti meghibásodások száma • Egy folytonos mennyiségi ismérv valamely adott intervallumon belül bármilyen értéket felvehet. • Háztartások jövedelme • Lakások alapterülete • Gépkocsi abroncsok futásteljesítménye • Bux index havi hozamadata
2. Az adatok ábrázolása • Eszközei: • Oszlopdiagram • Kördiagram • Vonaldiagram • Sávdiagram
3. Adatok csoportosítása, osztályozása • Egy mennyiségi ismérv szerinti rendezés és osztályozás • X mennyiségi ismérv (Xi változatai különbségi vagy arányskálán mért, valamilyen mértékegységgel rendelkező számértékek) • X a továbbiakban változó, Xi (ismérv)érték • Rangsor • A sokaság egységeinek sorba rendezése az X változó nagysága szerint • A rangsor a megfigyelési egységeknek és/vagy azokhoz tartozó Xi ismérvértékeknek monoton nemcsökkenő sorrendben történő felsorolása. • Készítésének célja: megkönnyítse a sokaság egységeinek X változó szerinti osztályozását • Osztályozás • Gyakorisági sor, gyakorisági eloszlás
3. Adatok csoportosítása, osztályozása Osztályközhosszúság:
3. Adatok csoportosítása, osztályozása • X ismérv szerinti osztályozás kérdései: • Az X változó diszkrét, és az általa felvehető értékek száma kicsi • Annyi osztályt képezünk ahány különböző X érték lehetséges • az i-edik osztály esetében fennáll az alsó és felső osztályhatár egybeesése • Az X változó folytonos, vagy diszkrét ugyan, de az általa felvehető különböző értékek száma nagy • X lehetséges értékeinek tartományát osztályközökre bontjuk • az i-edik osztályköz Xi1 felső határa nem eshet egybe az (i+1)-dik osztályköz Xi+1,0 alsó határával • Hány osztályt képezzünk? • Egy osztályozás akkor megfelelő, ha az osztályok számának és határainak egy bizonyos sávon belüli változtatása nem nagyon befolyásolja a grafikus képet. A gyakorlatban ehhez 5-15 osztály használata szinte mindig elegendő. • Osztályok számának meghatározása:
3. Adatok csoportosítása, osztályozása • A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. • Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); • gyakoriságok (fi) megállapítása; • relatív gyakoriságok (gi) megállapítása • összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; • gyakorisági táblázat készítése (fi , gi , fi’ , gi’ adataiból); • gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); • grafikus ábrázolás
Példa – kevés számú diszkrét adat Egy folyamatosan működő üzemben 24 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alábbi értékek adódtak óránkénti megoszlásban: Gyakorisági táblázat készítése: - Legkisebb és legnagyobb értékek megkeresése - Gyakoriságok meghatározása 0 1 :
Példa – kevés számú diszkrét adat A gyakorisági táblázat:
Relatív gyakoriságok gyakoriságok 0,2 5 0,16 4 0,12 3 2 0,08 1 0,04 0 1 2 3 4 5 6 Leállások száma Példa – kevés számú diszkrét adat Adatok ábrázolása: PÁLCIKA DIAGRAM
Példa – kevés számú diszkrét adat A gyakorisági táblázat folytatása:
1 Kumulált relatív gyakoriságok 0,5 Leállások száma 0 4 1 2 5 3 6 Példa – kevés számú diszkrét adat Kumulált relatív gyakoriság ábrázolása:
Példa – nagy számú folytonos adat A teljes értékköz: 30,844 (%) Rangsor
Példa – nagy számú folytonos adat GYAKORISÁGI TÁBLÁZAT
Példa – nagy számú folytonos adat GYAKORISÁGI HISZTOGRAM (tapasztalati sűrűségfüggvény) Gyakoriság vonaldiagramja
Példa – nagy számú folytonos adat Gyakorisági görbe
Példa – nagy számú folytonos adat Kumulált relatív gyakoriság vonaldiagramja KUMULÁLT RELATÍV GYAKORISÁGI HISZTOGRAM
Példa – nagy számú folytonos adat Ogiva KUMULÁLT RELATÍV GYAKORISÁG VONALDIAGRAMJA (tapasztalati eloszlásfüggvény)
Középértékek Helyzeti Számított Módusz Számtani átlag Mértani átlag Medián Harmonikus átlag Négyzetes átlag Gyakorisági eloszlásokjellegzetességei • Középérték-mutatók: helyzeti és számított • Ingadozásmutatók: abszolút és relatív • Alakmutatók • Középérték elvárások: • Közepes helyzetűek • Tipikusak • Egyértelműen meghatározhatóak • Lehetőleg könnyen értelmezhetőek
Medián • Helyzeti középérték – valódi középérték, a rangsor közepén található: az az érték, amelynél az előforduló értékek fele kisebb, fele pedig nagyobb • Páratlan számú adatnál a középső • Páros számú adatnál a két középső érték számtani átlaga • Érzéketlen a szélsőértékekre • Sok egyforma ismérvérték esetén nem tanácsos használni 1 0 6 17 23 13 3 2 19 1 0 6 17 23 13 3 2 0 1 2 3 6 13 17 19 23 0 1 2 3 6 13 17 23 ha 4,5
Medián becslése A mediánt tartalmazó osztály bal végpontja. me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy A mediánt tartalmazó osztály hossza.
Módusz • Helyzeti középérték – tipikus • Diszkrét ismérv esetén a leggyakrabban előforduló ismérvérték(ek) • Folytonos ismérv esetén pedig a gyakorisági görbe maximumhelye • Érzéketlen a szélsőértékekre
Módusz becslése moa legnagyobb gyakoriságú osztály(ok) sorszáma A móduszt tartalmazó osztály bal végpontja. A móduszt tartalmazó osztály hossza.
Számtani átlag • Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad • Leggyakrabban használt középérték • Meghatározható gyakorisági sorból is a gyakoriságokkal súlyozva • Számított középérték-mutató • Bármely alapadathalmazból egyértelműen meghatározható • Minden alapadatot felhasznál • Érzékeny a szélsőértékekre min. ,ha
Harmonikus átlag Mértani átlag • A mértani átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. A harmonikus átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad.
Négyzetes átlag • Az a szám, amellyel az átlagolandó értékeket helyettesítve, azok négyzetösszege változatlan marad • Tipikus alkalmazási területe a szórásszámítás Választás a középértékek között
Választás a középértékek között • Módusz, medián, számtani átlag? • Melyiket használjuk? • Egyértelműen meghatározható-e? • Az összes rendelkezésre álló adattól függ-e vagy sem? • Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? • Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?
Választás a középértékek között • Medián • Egyértelműen meghatározható, mindig létezik • Ha sok az egyforma ismérvérték, akkor nem tanácsos használni • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Sok egyforma ismérvérték esetén nem tanácsos használni • Módusz • Nem mindig határozható meg egyértelműen, nem is mindig létezik • Becslése bizonytalan (függ az osztályok kialakításától) • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Számtani átlag • Bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál, mindig létezik • Érzékeny a szélsőséges értékekre nyesett átlag • Nem feltétlen tipikus érték