1 / 47

OSNOVE STATISTIČKE OBRADE PODATAKA

OSNOVE STATISTIČKE OBRADE PODATAKA. Darko Hren Croatian Medical Journal Medicinski Fakultet u Zagrebu. populacija. uzorak. CILJ ISTRAŽIVANJA. Opisati. Objasniti. Predvidjeti. Oruđe : STATISTIKA. Nezavršena osnovna škola 19%. Osnovna škola 22%. Više ili visoko obrazovanje 12%.

odette
Télécharger la présentation

OSNOVE STATISTIČKE OBRADE PODATAKA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. OSNOVESTATISTIČKE OBRADE PODATAKA Darko Hren Croatian Medical JournalMedicinski Fakultet u Zagrebu

  2. populacija uzorak CILJ ISTRAŽIVANJA Opisati Objasniti Predvidjeti Oruđe:STATISTIKA

  3. Nezavršena osnovna škola19% Osnovna škola22% Više ili visoko obrazovanje 12% Srednja škola47% UZORAK Kakvo je stanje u populaciji? Nereprezentativan Reprezentativan Nereprezentativan

  4. UZORAK Vrste uzoraka (načini uzimanja uzoraka) Slučajni Svaki član populacije ima jednaku vjerojatnost biti odabran (izvlačenje brojeva iz šešira, tablice slučajnih brojeva,računalni programi...) Sustavni Uzima se svaki n-ti član populacije Stratificirani Populacija se dijeli na “slojeve” pa se iz njih uzimajuslučajni uzorci Prigodni Podatci se uzimaju od ispitanika koje imamo “pri ruci”

  5. UZORAK Veličina uzorka Željena preciznostmjerenja Varijabilnost mjerenepojave Snaga istraživanja – vjerojatnost pronalaženja razlike koja zaista i postoji u populaciji Pogreške: alfa – pronašli smo statistički značajnu razliku, a razlike zapravo nema beta–nismo pronašli razliku, a razlika zapravo postoji

  6. Uzorak randomizacija Kontrolna Eksperimentalna (1 ili više) OBLIKOVANJE SKUPINA

  7. VJEŽBA Želimo ispitati stavove studenata prema znanosti.Tijekom prvog tjedna upisa, upitnikom od 10 pitanja ispitali smo studente koji su čekali ispred referade. Slučajni? Stratificirani? Sustavni?

  8. LJESTVICE MJERENJA NOMINALNA broj stoji umjesto imena (npr. spol – muški=0, žene=1) ORDINALNA brojevi označavaju redoslijed, ali ne znamo KOLIKE su razlike (npr. pokretljivost bolesnika: I nepokretan, II slabo ili ograničenopokretan, III pokretan) INTERVALNA imamo redoslijed i razlike ali brojčani odnosi ne označavaju odnose u mjerenoj pojavi jer nema apsolutne nule (npr. temperatura – 20ºC nije dvostruko toplije od 10ºC) OMJERNA brojčani odnosi označavaju odnose u mjerenoj pojavi jer postoji apsolutna nula (npr. dužina – 20 cm je dvostruko duže od 10 cm)

  9. Stupanj opeklina Dob Brojevi na majicama nogometaša Zbroj bodova na ljestvici stavova prema znanosti(najmanji mogući rezultat je 10, a najveći 50) Doza lijeka koji se daje pacijentu (izražena u mg) VJEŽBA ordinalna omjerna nominalna intervalna omjerna

  10. Opis Usporedba Povezanost OBRADA PODATAKA: Kakvi su stavovi studenata medicine prema znanosti? Postoje li razlike u stavovima prema znanosti između studenata različitih godina? Postoji li povezanost između stavova prema znanosti prosjeka ocjena?

  11. Dominantna vrijednost (Mode) -najčešći rezultatat- Raspon Središnja vrijednost (Median) -središnji rezultatat- Poluinterkvartilno raspršenje Aritmetička sredina (Mean)-prosjek- Standardna devijacija OPIS Raspodjela Srednje vrijednosti i raspršenja

  12. Zbroj svih rezultata Broj rezultata SREDNJE VRIJEDNOSTI Aritmetička sredina Ovisi o vrijednosti rezultata, pa je osjetljiva na vrijednosti koje jako odstupaju Vrijednost koja se nalazi točno u sredini nizarezultata poredanih po veličini Središnja vrijednost Ne ovisi o vrijednosti rezultata, pa je vrijednosti koje jako odstupaju nemijenjaju, ali ju može promijeniti broj rezultata Dominantna vrijednost Vrijednost koja se najčešće pojavljuje Ne ovisi ni o vrijednosti ni o broju rezultata

  13. SREDNJE VRIJEDNOSTII RASPRŠENJA

  14. = 3 9 9 = 3 M=3 C=2 SREDNJE VRIJEDNOSTI 1+2+2+3+3+3+4+4+5 M=C 1+2+2+2+2+3+3+4+8

  15. RASPODJELA PODATAKA C=4 C=4

  16. 151 Pažnja! Možda je pogreška, a možda neistražena pojava! VRIJEDNOSTI KOJE SE JAKO RAZLIKUJU

  17. NORMALNA RASPODJELA Testiranje normaliteta raspodjele: Kolmogorov-Smirnov test

  18. DRUGE RASPODJELE Asimetrična udesno Asimetrična ulijevo Stožasta Spljoštena Bimodalna

  19. Aritmetička sredina i standardna devijacija Parametrijska statistika Središnja/dominantna vrijednost i interkvartilno raspršenje/totalni raspon Neparametrijska statistika

  20. ZBOG POGREŠKE MJERENJA DOBIVENI REZULTATI UVIJEK SU SAMO PROCJENA STANJA U POPULACIJI RASPON POUZDANOSTI (CONFIDENCE INTERVAL) RASPON U KOJI, UZ ODREĐENU SIGURNOST (95%, 99%), ZAHVAĆA “PRAVI” REZULTAT U POPULACIJI Npr. M=20, 95%CI 18-24 C=76, 99%CI 69-85

  21. IZBOR ODGOVARAJUĆEG STATISTIČKOG POSTUPKA

  22. 1. Kakvi su stavovi studenata medicine prema znanosti? 2. Postoje li razlike u stavovima prema znanosti između studenata različitih godina? 3. Postoje li razlike u stavovima prema znanosti između studenata i studentica? 4. Postoji li povezanost između stavova prema znanosti i prosjeka ocjena? VJEŽBA

  23. 1. Kakvi su stavovi studenata medicine prema znanosti?

  24. 2. Postoje li razlike u stavovima prema znanosti između studenata različitih godina?

  25. 3. Postoje li razlike u stavovima prema znanosti izmeđustudenata i studentica?

  26. 4. Postoji li povezanost između stavova prema znanostii prosjeka ocijena?

  27. TUMAČENJE REZULTATA Statistički značajno!!! p<0.05

  28. ŠTO ZNAČI “STATISTIČKI ZNAČAJNO”? p<0.05 – 95% sigurnosti da dobivenarazlika/povezanost nije posljedica slučaja p<0.01 – 99% sigurnosti da dobivenarazlika/povezanost nije posljedica slučaja PRIKAZ p-vrijednosti– tri decimalna mjesta Npr. p=0.024 p=0.007 p<0.001

  29. Statistički značajnone mora biti iSTVARNOznačajno!!!

  30. PRIMJER Rezultati randomiziranog kontroliranog pokusapokazuju da je novi lijek u pokusnoj skupiniprosječno smanjio dijastolički tlaks 99 mmHg na 96 mmHg, p<0.001 Statistički značajno, ali ne i klinički!

  31. PRIMJER p<0.001

  32. SAMO POKUSOMMOŽEMO UTVRDITIUZROČNOST!!! POVEZANOST NE ZNAČI I UZROČNOST Korelacija između stavova prema znanostii slušanja kolegija “Uvod u znanstveni rad u medicini”iznosi ρ=0.84, p<0.001 Studenti koji su slušali kolegij vjerojatnoimaju pozitivnije stavove prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijihstavova prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijihstavova prema znanosti

  33. BIOSTATISTICS INSTRUCTIONAL MANUALhttp://www.sjsu.edu/faculty/gerstman/StatPrimer/ ELEMENTARY CONCEPTS IN STATISTICS http://www.statsoftinc.com/textbook/esc.html ONLINE STATISTICS TEXTBOOKhttp://www2.chass.ncsu.edu/garson/pa765/statnote.htm POWER CALCULATIONhttp://calculators.stat.ucla.edu/powercalc/

  34. Procjena veličine uzorka “Koliki uzorak mi treba?” često pitanje važno pitanje odgovor nije sasvim jednostavan grafički način procjene veličine uzorka – Altmanov nomogram

  35. na temelju razlike koju smatramo relevantnom možemo izračunati standardiziranu razliku koja ovisi o vrsti podataka (kontinuirani/kvantitativni ili kategorijski/kvalitativni) • za kategorijske varijable: • SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama) • p=(p1+p2)/2 (prosječna proporcija) • za kontinuirane varijable: • SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika • σ0 – očekivana standardna devijacija Procjena veličine uzorka potrebna 3 parametra (klinički) relevantna razlika razina značajnosti (0.05, 0.01) snaga

  36. SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama) • p=(p1+p2)/2 (prosječna proporcija) Procjena veličine uzorka – primjer 1 kategorijske varijable Ispitujemo novi antibiotik. Dosad korišteni lijek učinkovit je u 40% slučajeva, a novi, da bi se isplatio mora biti učinkovit u barem 60% slučajeva. Koliko ispitanika trebamo da bismo, uz dvosmjernu značajnost od 0.05 i snagu od 80%, provjerili takvu razliku u učinkovitosti lijekova? SR=(0.6-0.4)/0.5=0.4

  37. Procjena veličine uzorka – primjer 1 kategorijske varijable Koliki uzorak biste trebali da je sve isto, samo uz značajnost od 0.01?

  38. Procjena veličine uzorka – primjer 2 kontinuirane varijable Koliki uzorak je potreban da bi se, uz dvosmjernu značajnost od 0.05 i 80% snage, provjerila razlika u razini kolesterola od 1.0 mmol/l između aritmetičkih sredina dviju skupina ispitanika? Očekujemo podjednaku standardnu devijaciju u obje skupine od 3.0 mmol/l. • SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika • σ0 – očekivana standardna devijacija SR=1/3=0.333

  39. Procjena veličine uzorka – primjer 2 kontinuirane varijable 150 po skupini

  40. Procjena veličine uzorka – zaključno • u procjenu veličine uzorka treba uključiti i očekivano osipanje ispitanika • npr. dodati 20-30% za istraživanja koja će duže trajati • zaokružite na cijeli broj • veličina uzorka jest važna, ali ne znači ništa ako uzorak nije dobro odabran

  41. PRIKAZ PODATAKA - NAČELA Tablice i slike • Svaka tablica / slika mora bitisamorazumljiva(bez čitanja teksta) • Svaka tablica / slika mora imatinaslov– što informativniji • Gdje god su podatci statistički obrađeni,podbilješketablica / opisi slika moraju donijeti osnovne statističke informacije • Ne štediti na potrebnim opisima i objašnjenjima legendi (legende – opisne)

  42. PRIKAZ PODATAKA - NAČELA • Svaka tablica / slika treba donijetijednu poruku • Ta poruka jeodgovor na jedno pitanjekoje proistječe iz deduktivne raščlambe hipoteze • Prije izbora tablice / slike, mora se točno i jasno definiratišto se njome želi reći

  43. TABLICE • kategorijske varijable (numerički podatci, prebrojivi), frekvencije... • velik broj podataka • jednoznači, jasni i informativni naslovi stupaca i redova u tablici • u podbilješkama (* † ‡ §¶...) su navedena objašnjenja (statističkih testova, kratica...) • Primjeri: • – podatci o ispitanicima (broj, dob, spol, indeks tjelesne mase) • – broj bolničkih kreveta, broj liječnika, sestara, tehničara, pomoćnog osoblja na odjelu....

  44. SLIKE – RTG, EKG, PHD, fotografije, zemljovidi, grafovi... Grafovi – vremenski odnos (linijski graf) – odnos proporcija (stupčani graf) – korelacije – apscisa i ordinata uvijek jasno označene (naziv, mjerne jedinice)

  45. TABLICA VS. SLIKA Slika • RTG, PHD, EKG... • linijski graf - vremenski odnos • stupčani graf -odnos proporcija Tablica • numerički podatci • veliki broj podataka • podatci o ispitanicima (BMI, dob, spol...), broj bolničkih kreveta, broj muških bolesnika...

  46. Racionalan prikaz podataka u tablici: Pretvaranje dvaju stupaca u jedan broj pacijenata postotak pacijenata No. (%) of patients 43 34.4% 43 (34.4) 27 21.6% 27 (21.6) 32 26.1% 32 (26.1) 17 ... ... 6 Uporaba nadnaslova za stupce Broj (%) pacijenata broj (%) pacijenata broj (%) pacijenata koji su dobili infarkt koji nisu dobili infarkt s infarktom bez infarkta 17 (12.4) 74 (78.3) 17 (12.4) 74 (22.8)

  47. Raspored podataka u tablici • Organizirati podatke tako da se srodni elementi slažu u stupac, a ne u red (npr. dob, spol, srednji tlak, težina infarkta) • Stupce slažite ovom logikom: DOBSPOL SIMPTOMI FIZIKALNI NALAZ RTG NALAZ TERAPIJA ISHOD • Nastojte stupac s p vrijednostima staviti između stupaca s vrijednostima koje uspoređujete • P vrijednosti možete staviti i u redove ako uspoređujete podatke koji stoje jedni iznad drugih • P vrijednosti uvijek pišite na tri decimale, bez obzira na to je li razlika značajna

More Related