480 likes | 863 Vues
Lezione 5 Strumenti statistici: campioni e stimatori. 1,61m < h < 1,63m X = 162 1,59m < h < 1,61m X = 160 1,57m < h < 1,59m X = 158. dalla caratteristica comune di una popolazione al suo modello probabilistico ….
E N D
1,61m < h < 1,63m X = 162 1,59m < h < 1,61m X = 160 1,57m < h < 1,59m X = 158 dalla caratteristica comune di una popolazioneal suo modello probabilistico … una popolazione (distribuita in modo) normalesu cui viene definita una variabile casuale continua Xcon media m e varianza s2può essere modellata mediante una funzione di densità di probabilità fX ( x )espressa nella forma:
dalla caratteristica comune di una popolazioneal suo modello probabilistico …
V = v ( X1, X2, …, Xn) gli stimatoricampionari correttezza: consistenza: le strategie di campionamento:- sistematico,- stratificato,- per quote,- a grappolo efficienza: Nella parte 1 ...
La media campionaria: corretto: consistente: Nella parte 2 ...
La varianza campionaria: La varianza campionaria corretta: corretto: Consistente: ? ? Nella parte 2 ...
Principali stimatori:varianza campionaria corretta Sn2 definizione 5.8: • estraendo da una popolazione per cui è definita la variabile casuale X un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }si definisce “varianza campionaria corretta” la quantità: con numerosità n del campione maggiore di 1.
Principali stimatori:varianza campionaria corretta Sn2 la “varianza campionaria corretta” di un campione proveniente da una popolazione su cui è stata definita la variabile casuale Xè uno stimatore corretto della varianza s2 della X per l’intera popolazione dato che:
consistenza degli stimatori campionari Principali stimatori:varianza campionaria corretta Sn2 Per verificare se la varianza campionaria corretta possa essere considerata uno stimatore consistente della varianza della Xrelativa all’intera popolazione si dovrà individuare la sua distribuzione, in modo da poter individuare il limite per n che tende all’infinito della sua varianza. Ricordiamo infatti che si era scritto:
Principali stimatori:varianza campionaria corretta Sn2 Per ricavare la distribuzione della varianza campionaria corretta si dovranno introdurre tre nuove distribuzioni: - la distribuzione “Gamma”, - la distribuzione “Chi - quadro”, - la distribuzione “C2 modificata”.
Distribuzione Gamma (G ) Costruiamo una funzione della variabile X in cui compaiono due parametri p e l a cui è possibile assegnare arbitrariamente valori realipositivi: in cui è stata indicata con G( p) la funzione:
Distribuzione Gamma (G ) La funzione : può essere presa come funzione di densità di probabilità dato che: • ha dominio in R e codominio in R + ; • il suo integrale è unitario; • rispetta gli assiomi di Kolmogoroff.
Distribuzione Gamma (G ) Una distribuzione per cui si possa adottare la come funzione di densità di probabilità viene chiamata “distribuzione Gamma con parametri p e l”
Media e varianza della distribuzione Gamma Se X è una variabile casuale che ha distribuzione Gamma con parametri p e l: si ha :
la distribuzione “chi-quadro”o“distribuzione di Pearson” Karl Pearson (1857-1936)
Distribuzione chi-quadro La distribuzione Gamma con parametri p = n / 2e l = 1 / 2 assume un particolare interesse: avendo indicato con G( n / 2) la funzione definita da:
Distribuzione chi-quadro Una distribuzione per cui si possa adottare la come funzione di densità di probabilità viene chiamata: distribuzione chi - quadroconn gradi di libertà
Media e varianza della distribuzione chi-quadro Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametrip = n / 2e l = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma : ottenendo:
Proprietà della distribuzione chi-quadro teorema 5.5: Se le variabili casuali X1, X2 … , Xn, sono indipendenti e ciascuna ha distribuzione normale con media m j e varianza s2j con j = 1, 2, … , n, allora la variabile casuale: segue una distribuzione chi-quadro con n gradi di libertà
la somma dei quadrati di n variabili casuali indipendenti, ciascuna distribuita in modo normale standard, segue una distribuzione chi-quadro con n gradi di libertà ! Proprietà della distribuzione chi-quadro corollario al teorema 5.5: Se le variabili casuali X1, X2 … , Xn, sono indipendentie ciascuna ha una distribuzione normalecon media mj e varianza s2j con j = 1, 2, … , n, allora le variabili casuali Z1, Z2 … , Zn definite come: sono indipendenti e seguono una distribuzione normale standard. Ma allora si può anche affermare che:
Media e varianza della distribuzione chi-quadro Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametrip = n / 2e l = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma : ottenendo: La distribuzione chi-quadro hamedia e varianza che aumentano all’aumentare di n
La variabile C 2 Partendo da una variabile casuale c 2 che segue una distribuzione chi-quadro con n gradi di libertà, definiamo una nuova variabile che indichiamo C 2 : che prende il nome di “variabile modificata di chi-quadro con n g.d.l.” La “variabile modificata di chi-quadro” è quindi una variabile casuale che si ottiene dividendo una variabile casuale distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà.
La distribuzione della variabile C 2 Dato che la C 2,“variabile modificata di chi-quadro”, si ottiene dividendo una variabile distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà, il suo valore medio e la sua varianza si possono facilmente ricavare da quelli della corrispondente c 2: ottenendo:
La distribuzione della variabile C 2 La distribuzione della varianza campionaria corretta
è facile vedere che la variabile casuale: segue una distribuzione normale con media nulla. Se definiamo una nuova variabile Z : possiamo affermare che essa segue una distribuzione normale standard. Distribuzione della varianza campionaria corretta Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media m e varianza s2 , un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }
Distribuzione della varianza campionaria corretta Se ora sommiamo i quadrati delle Z1, Z2, … , Zn : possiamo affermare che W segue una distribuzione chi-quadroconn - 1gradi di libertà in quanto somma deiquadrati di n -1 variabili indipendenti normali standard ( la media introduce un vincolo fra le n variabili Xi )
Definiamo ora una nuova variabile V : Distribuzione della varianza campionaria corretta che, esplicitando Sn2, possiamo anche scrivere come:
Distribuzione della varianza campionaria corretta Se ricordiamo che : possiamo notare che : e, ricordando che W segue una distribuzione chi-quadro possiamo affermare che ancheV segue una distribuzione chi-quadro con n - 1 gradi di libertà.
Distribuzione della varianza campionaria corretta Definiamo infine una nuova variabile che indichiamo C 2 : che risulta essere una “variabile modificata di chi-quadro conn - 1 gradi di libertà”
Lo stimatore varianza campionaria corretta • Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media m e varianza s2 , un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } posto: si ha che la varianza campionaria corretta: • è uno stimatore corretto in quanto • è uno stimatore consistente in quanto :
Lo stimatore varianza campionaria corretta • Estraendo casualmente da una popolazione per cui è definita la variabile casuale X,distribuita in modo normale con media m e varianza s2 , un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } posto:si ha che : • segue una distribuzione C 2 con n-1 gradi di libertà.
Lo stimatore varianza campionaria corretta • Il rapporto fra la varianza campionaria corretta dei campioni estratti casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media m e varianza s2 , e la stessa varianza s2 della X è una variabile casuale che segue una distribuzione C 2 con n-1 gradi di libertà.