1 / 47

Teorema del limite centrale

Verifica delle ipotesi. Ipotesi sperimentaleVerifica delle ipotesi = analizzare le differenze tra i risultati osservati (cio

arleen
Télécharger la présentation

Teorema del limite centrale

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Teorema del limite centrale dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma delle distribuzione delle popolazione (quando si considera un campione di ampiezza > 30). E di importanza fondamentale in quanto non si lavora mai con una distribuzione della popolazione, ma soltanto dei campioni rappresentativi. Questo teorema alla base di tutta la statistica inferenziale. Sapendo che la distribuzione campionaria delle medie assume forma normale, allora possibile sfruttare le sue propriet per la stima dei parametri (o per la verifica delle ipotesi)

    2. Verifica delle ipotesi Ipotesi sperimentale Verifica delle ipotesi = analizzare le differenze tra i risultati osservati (cio i valori reali) e quelli attesi (basati sulla distribuzione della popolazione). Difficilmente si ottiene una perfetta sovrapposizione in quanto i dati della popolazione sono teorici. Per questo motivo si ragiona in termini di distanza (tra i due valori)

    3. Lipotesi nulla e lipotesi alternativa H0 = lipotesi nulla lipotesi sottoposta a verifica H1 = lipotesi alternativa vista come lipotesi antagonista allipotesi nulla e rappresenta la conclusione raggiunta quando lipotesi nulla rifiutata. Obiettivo: rifiutare lipotesi nulla

    4. Lipotesi nulla e lipotesi alternativa Es. verificare se il trattamento (farmaco XyZ) migliora la capacit di concentrazione. Si deve partire con lipotesi contraria, cio che non ci sia differenza (o meglio che la differenza, se rilevata, sia attribuibile al caso). Questa H0 , lipotesi nulla. Lipotesi alternativa include tutto ci che non definito nellipotesi nulla; in altre parole assume che il farmaco produca un effetto sulla capacit di concentrazione, migliorandola o peggiorandola. Questa H1 , lipotesi alternativa

    5. Lipotesi nulla e lipotesi alternativa Se la statistica mostra che il risultato osservato sul campione casuale (cio estratto dalla popolazione in modo random) differisce da quello atteso dallipotesi formulata, allora dovremmo rifiutare lipotesi nulla e accettare quella alternativa. In altre parole, potremmo affermare che il farmaco ha un reale effetto sulla capacit di concentrazione.

    6. Verifica delle ipotesi In base allipotesi che si vuol dimostrare si possono avere ipotesi unidirezionali H1: p > ? ma anche H1: p < ? ipotesi bidirezionali H1: p ? ?

    7. Regione critica

    8. Regione critica per H1 bidirezionale

    9. Regione critica per H1 bidirezionale anche indicata come Livello di significativit (solitamente viene scelto un valore di alfa pari a .05, cio si disposti a rifiutare lipotesi nulla con una probabilit di errore del 5 %). Il livello di significativit pu essere rappresentato come la regola decisionale che ci permette di accettare o rifiutare lipotesi nulla.

    10. Verifica delle ipotesi; errori Ad ogni ipotesi statistica associata una probabilit di errore. La decisione di accettare o rifiutare lipotesi nulla non mai completamente certa dal momento che si basa su una probabilit. Errore di I tipo: si incontra quando si decide che vi sono delle differenze tra i due campioni, mentre in realt non ve ne sono. Le differenze trovate sono dovute esclusivamente al caso Errori di II tipo: si incontra quando si decide di accettare lipotesi nulla quando in realt falsa. In altre parole si decide che non ci sono differenze tra i due gruppi quando in realt il trattamento ha avuto un effetto sulla concentrazione.

    11. Verifica delle ipotesi; errori Tipi di errore Decisione Rifiutare H0 Mantenere H0 H0 vera p(err. I tipo) = ? 1 - ? H0 falsa 1 - ? (potenza) p (err. II tipo) = ?

    12. Potenza di un test 1 - ? = potenza p (err. II tipo) = ? la potenza di un test indica lefficienza nel poter evitare di prendere decisioni errate. Diventa molto importante durante la preparazione di un esperimento in quanto viene utilizzato il calcolo dei soggetti necessari per un esperimento (partendo dalla grandezza delleffetto)

    13. Ancora sulla verifica delle ipotesi Es. verificare se il peso delle scatole prodotte nella fabbrica XZY rientra negli standard definiti (368gr ipotizzati; ? = 15gr) n = 25 scatole 1) Ipotesi?

    14. 2) Scegliere un livello di significativit (?): solitamente un livello che assicuri una margine di errore ? = .05 3) (scegliere lampiezza campionaria in base alla potenza del test) 4) Individuare il test pi appropriato test z

    15. 5) Calcolare i valori critici che separano la regione di rifiuto da quella di accettazione

    16. 6) Calcolare le medie campionarie X = 372.5 7) Standardizzare la media calcolata Z = [(x - ?)]/[?/rq(n)] = = [(372.5 - 368)]/[15/rq(25)] = 4.5/3 = 1.5

    17. 8) Stabilire se la media cade nella regione di rifiuto o di accettazione confrontiamo i valori di z X = 372.5 ? = 368 z = 1.5 z critico = 1.96

    18. Conclusioni 9) Siccome la statistica (punti z) cade nella regione di accettazione, lipotesi nulla NON pu essere rifiutata In conclusione possiamo concludere che i campioni estratti non hanno evidenziato nessuna differenza significativa con la media standard di 368

    19. Un po di metodologia il disegno sperimentale variabile dipendente e indipendente condizione di controllo vs sperimentale disegno entro i soggetti e tra i soggetti

    20. Il disegno sperimentale Condizioni sperimentali e condizioni di controllo Si possono usare pi gruppi di controllo? Pi gruppi sperimentali? Es. effetto di un farmaco sul livello di concentrazione La condizione di controllo serve come verifica e confronto con il gruppo sperimentale per vedere se il trattamento ha avuto un effetto

    21. Variabile dipendente e indipendente Cos una variabile? Tutto ci che potenzialmente potrebbe cambiare al variare di una qualsiasi condizione (es. temperatura, attivazione, fame, ecc.) Dipendente o indipendenteda chi? Dal trattamento Livelli della variabile indipendente: es. disegno 2 x 2 x 4 x 2

    22. Between vs. Within Ovvero variabile tra i soggetti ed entro i soggetti Per definizione si ha un disegno tra i soggetti quando ogni soggetto riceve un solo livello della variabile indipendente. Ad esempio

    23. Disegno Between subjects Es. Gruppo 1: test di richiamo libero Gruppo 2: test di richiamo con suggerimento Disegni BS con una variabile indipendente a pi livelli 2 livelli: richiamo libero vs. richiamo con suggerimento Variabile dipendente: punteggi nel test

    24. Disegno Between subjects Es. Testare leffetto dellorientamento e della lunghezza sulla velocit di riconoscimento. Quindi: 2 (orientamenti) X 2 (lunghezze) Per avere un disegno between subjects dovremmo quindi avere 4 gruppi di persone. In questo modo ogni gruppo affronta un livello della variabile diverso Viene utilizzato soprattutto quando lesperimento diventa troppo lungo

    25. Disegno misto (o mixed design) Es. 2 (orientamenti) X 5 (lunghezze). In questo caso dovremmo avere 10 gruppi di persone. Ma i problemi legati al reclutamento dei soggetti un altro fattore da tenere sempre in considerazione. Quindi potrei testare leffetto delle variabili indipendenti un po between e un po within. Ad esempio potremmo avere lorientamento come variabile between e la lunghezza come variabile within. In questo caso si parla di disegno MISTO.

    26. Disegno Within subjects Per definizione si ha un disegno entro i soggetti quando ogni soggetto viene testato per TUTTI i livelli della variabile indipendente. Disegno 2 (orientamenti) X 2 (lunghezza) Un solo gruppo di persone che quindi affrontano tutto lesperimento nella sua interezza Poich tutti i soggetti affrontano tutte le condizioni sperimentali, gli stessi soggetti servono come controllo a loro stessi (coerenza interna) I disegni within subjects vengono anche chiamati Repeated Measures o disegni per misure ripetute

    27. Vantaggi e svantaggi del disegno Within subjects Mantiene la variabilit dei soggetti costante (mentre nel disegno between non possibile visto che vengono utilizzati soggetti diversi) Aumenta la potenza riducendo la variabilit dovuto al caso. Riduce il numero di soggetti necessari per lindagine sperimentale. Gli svantaggi sono : Effetto dellordine (bilanciamento) Fatica

    28. Scelta del Disegno Esigenze sperimentali: qual lipotesi che devo verificare? Lunghezza esperimento: quanti soggetti devo testare? Quanto risulta lungo lesperimento? Molto spesso questo parametro diventa pi importante del precedente (anche se una scelta sperimentale errata)

    29. Come si sceglie il test pi appropriato? Esperienza Comprendere la logica dietro ad un test Utilizzo delle tabelle decisionali Conoscenza elementi di statistica base

    30. Domande da porsi Qual lipotesi di ricerca? I dati sono a livello di scala continua o discreta, ordinale o ad intervalli? Quante variabili abbiamo inserito nellesperimento? Quanti gruppi di persone abbiamo testato? I gruppi sono indipendenti? I dati raccolti hanno forma normale?

    31. Parametrico o non-parametrico? In generale si sceglie un test parametrico quando si sicuri che i dati siano distribuiti normalmente. Se non lo sono allora si sceglie un test non - parametrico In generale vengono utilizzati test non parametrici quando i dati grezzi sono punteggi. Ad esempio per classifiche (musicali), punteggi, scale (percezione del dolore), numero di stelline (cinema o ristoranti).

    32. Parametrico o non-parametrico? Ma come decidere se i dati sono distribuiti normalmente? Se vengono raccolti dati per un campione sufficientemente grande (pi di 100) si possono rappresentare graficamente i dati in un grafico e valutare visivamente se sono distribuiti normalmente (forma a campana). In alternativa esistono dei test per valutare la normalit delle distribuzioni (pi accurata) Se non si hanno campioni con numerosit elevata una soluzione alternativa consiste nel consultare dati di ricerche precedenti

    33. Test parametrici I test parametrici sono i pi usati in assoluto in psicologia cognitiva, della percezione, in studi con tempi di reazione, etc. Vantaggi riuscire a cogliere in maniera pi efficiente le differenze tra le condizioni sperimentali di quanto non sia possibile fare con i non-parametrici (maggiore potenza statistica).

    34. Test parametrici Condizioni da rispettare: Misurazioni su scala ad intervalli (o superiore) Alto numero di misurazioni Normalit delle distribuzioni di riferimento Omogeneit delle varianze

    35. Test non-parametrici I test non parametrici sono pi usati in psicologia sociale, della memoria, etc. Hanno il vantaggio di essere pi semplici da un punto di vista procedurale, di analisi, e di interpretazione, e di non dover rispettare le condizioni imposte dai test parametrici.

    36. Test non-parametrici Condizioni: Misurazioni su scala sia nominale che ordinale Lavora anche con campioni di numerosit ridotta Hanno lo svantaggio di avere una minore potenza statistica

    37. La tavola decisionale Terminologia: variabile (indipendente) condizioni = livelli della variabile soggetti diversi = between soggetti uguali = within Le tavole mostrano i test per i casi in cui una sola variabile dipendente venga testata.

    38. Test NON parametrici

    39. Test non-parametrici: il ?2 La statistica ?2 (chi quadro) lavora con le frequenze di un evento e quindi analizza la loro distribuzione. Es. lancio moneta 100 volte Teoricamente mi aspetto 50 testa/50 croce Difficilmente le frequenze osservate coincidono con quelle attese Il ?2 permette di misurare la discrepanza tra frequenze osservate e frequenze teoriche

    40. ?2 Molto spesso il test lavora con distribuzioni dicotomiche (come nellesempio delle monete) ma si possono avere dei casi con categorie multiple. Nel caso di 2 categorie viene anche chiamato test binomiale. Es. categorie multiple. Studio sulle preferenze per i giochi. movimento statici Indiv. Collett. Indiv. Collett. 20 20 20 20 5 40 5 30

    41. ?2 Importante: le categorie devono essere mutualmente esclusive e ben definite. Ad esempio, nel test con le monete non ha senso inserire una terza categoria testa/croce e se un evento cade nella categoria testa non pu appartenere anche alla categoria croce. Importante: il test del ?2 tratta con categorie o frequenze, e MAI con punteggi. Importante: il numero di soggetti in ogni categoria legato alle caratteristiche della categoria stessa, quindi non possibile cambiarlo. Occorre avere un alto numero di soggetti in modo da oviare a questo inconveniente.

    42. ?2 La formula per calcolare il ?2 la seguente: ?2 = ? [(fo fa)2/fa]

    43. I gradi di libert Per definizione i gradi di libert di una statistica corrispondono alle componenti richieste dal suo calcolo, che possono variare liberamente. In pratica corrispondono al numero di osservazioni di un campione, meno il numero relativo a dei vincoli algebrici lineari, costituiti in genere dalle statistiche relative al campione che devono essere calcolate prima della statistica in questione. La formula generica n 1

    44. I gradi di libert Una distribuzione con infiniti gradi di libert coincide con la distribuzione normale. Una distribuzione con un ridotto numero di gradi di libert caratterizzata da un numero pi elevato di osservazioni nelle code, cio ha una maggiore dispersione di conseguenza, minori sono i gdl, e maggiore la probabilit che un valore cada nella regione di rifiuto, e quindi maggiore probabilit di commettere un errore di tipo I.

    45. I gradi di libert per il ?2 I gl nella statistica del ?2 vengono identificati con la lettera v v = k 1 K il numero dei livelli della variabile

    46. Calcolo del ?2 per una variabile a pi livelli Il ?2 permette di misurare la discrepanza tra frequenze osservate e frequenze teoriche. Le frequenze osservate (0k) sono quelle ottenute dallosservazione del campione. Quelle attese (ek) vanno calcolate seguendo la logica della distribuzione delle probabilit Evento E1 E2 E3 Ek Freq. Osservate o1 o2 o3 ok Freq. Attese e1 e2 e3 ek

    47. Calcolo del ?2 per una variabile a pi livelli Una variabile = modalit di studio 3 livelli = regolare, irregolare e misto Evento reg. irreg. misto tot Freq. Osservate 6 14 13 33 Freq. Attese 11 11 11 33

    48. Calcolo del ?2 per una variabile a pi livelli ?2 = 1.628 Gradi di libert: v = k 1 [Quando si hanno due o pi variabili il calcolo dei gradi di libert cambia] v = 3 1 = 2 gl

More Related