680 likes | 968 Vues
Lezione 6 Inferenza statistica. parte 3 Esercizi sulla stima della media e della varianza. Strumenti di misura e strumenti di inferenza. incertezza dello stimatore campionario.
E N D
incertezza dello stimatore campionario • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri m e s2 relativi all’intera popolazione. • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
incertezza dello stimatore media campionaria • La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:
incertezza dello stimatore varianza campionaria corretta • La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:
incertezza degli stimatori campionari • La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.
Riassunto stimatori campionari • varianza campionaria corretta: • se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , • allora la variabile casuale c2:segue una distribuzione di tipo “chi-quadro” con n -1 gdl.
f (c² ) c² La variabile c2
Riassunto stimatori campionari • varianza campionaria corretta: • se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , • allora la variabile casuale C2:segue una distribuzione di tipo “modificata di chi-quadro”con n -1 gradi di libertà.
f (C² ) C² La variabile C2
Incertezza dello stimatore Sn2 Chiediamoci ora: “ Qual è la probabilità che, estraendo a caso un campione di n elementi da una popolazione su cui è stata definita una variabile casuale X con distribuzione normale, il rapporto fra la varianza campionaria corretta e la varianza relativa all’intera popolazione sia compreso nell’intervallo ?”
Incertezza dello stimatore Sn2 Estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s 2, c’è una probabilità pari a: che il rapporto fra il valore ottenuto della varianza campionaria corretta e la varianza della X per l’intera popolazione sia compreso nell’intervallo
Intervallo di confidenza a (1 – a ) possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità 1 - a pari a che l’intervallo casualecontenga il valore della varianza s2 per l’intera popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la varianza
Riassunto • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ? se la X ha distribuzione normale la probabilità cercata corrisponde alla :
Riassunto • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ?
corrisponde alla area della regione campita in verde: Riassunto • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ?
Riassunto • varianza campionaria corretta: • Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo • con le nostre tavole:
Riassunto • varianza campionaria corretta: • Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo • con le nostre tavole:
0,10 0,05 Intervallo di confidenza allo ... ? • per bassi valori di n la f (C 2 ) non è simmetricapertanto non è agevole individuare il valore di ev da cui si ottiene un intervallo simmetricocon una prestabilita confidenza • esempio:a= 0,10 gdl = 10C2 0,05 = 0,394 da cui:ev» 0,6 da cui a= 0,15 pertanto 1 - a= 0,85 e non 0,90 !!!
0,05 0,05 Intervallo di confidenza allo 0,90 • per bassi valori di n la f (C 2 ) non è simmetrica:si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili e • esempio: a= 0,10 gdl = 10
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili e corrispondenti alla confidenza scelta? corrisponde alla:
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili e corrispondenti alla confidenza scelta?l’intervallo cercato è:
Intervallo di confidenza varianza possiamo sostenere che: estraendo a caso un campione da una popolazione su cui è definita una variabile casuale Xcon distribuzionenormale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale in cui e sono rispettivamente i valori del quantile (a/2) e del quantile (1 - a/2) di una variabile C 2che segue la distribuzione “modificata di chi-quadro”con n -1 g.d.l contenga il valore della varianza s2.
Stima intervallo di confidenza con c2 • varianza campionaria: • avendo introdotto la distribuzione “chi-quadro” è stato possibile affermare che la variabile aleatoria c2segue tale distribuzione con n - 1 g.d.l..
Stima intervallo di confidenza con c2 • varianza campionaria: • se dispongo dei valori dellac2
Esercizio 1 Supponiamo di avere unapopolazione di induttori per la soppressione di rumori e su tale popolazione definiamo unavariabile casuale Xcheassume, per ciascuninduttore, valore uguale alvalore della induttanza misurata in mH alla frequenza di 1,0 MHz. Vogliamo individuare l’intervallo di confidenza allo 0,95 perla varianza della X mediante l’uso di un campione composto da n = 26 induttori.
Esercizio 1 Alla frequenza di 1,0 MHz la induttanza può essere misurata con l’uso di un “ponte per radio frequenza”
Esercizio 1 dai valori misurati determino prima il valore dello stimatore “media campionaria” e poi il valore dello stimatore “varianza campionaria corretta” nel nostro caso il campione di 26 induttori ci porta a:
Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro” Esercizio 1 Se la induttanza degli induttori presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale.
Esercizio 1 il campione è composto da n= 26 elementi pertanto opero con 25 g.d.l. Dalle tabelle dei valori critici di C ²25 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,52 e 1,62 Intervallo di confidenza allo 0,95
Esercizio 2 Un campione è costituito da 11 resistori estratti da una popolazione infinita con distribuzione normale. La misurazione della resistenza degli elementi del campione fornisce i seguenti valori, in kW: 12,1 ; 12,2 ; 12,2 ; 12,2 ; 12,3 ; 12,3 ; 12,3 ; 12,4 ; 12,4 ; 12,4 ; 12,5 ; Viene definita una variabile casuale X che assume, per ciascun resistore della popolazione, valore uguale a quello della resistenza in kW diminuito di 12. Si individui l’intervallo di confidenza allo 0,95 per la varianza della X.
Esercizio 2 dai valori misurati determino prima il valore dello stimatore “media campionaria” e poi il valore dello stimatore “varianza campionaria corretta”
Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi-quadro” Esercizio 2 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale.
Esercizio 2 il campione è composto da n= 11 elementi quindi opero con 10 g.d.l. Dalla tabella, per C ²10 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,325 e 2,05 Intervallo di confidenza allo 0,95
Esercizio 3 Un campione è costituito da 31 resistori estratti da una popolazione infinita con distribuzione normale. Viene definita una variabile casuale X che assume, per ciascun resistore della popolazione, valore uguale a quello della resistenza in kW diminuito di 12. La misurazione della resistenza degli elementi del campione fornisce: Si individui l’intervallo di confidenza allo 0,95 per la varianza della X usando sia la distribuzione “modificata di chi-quadro”sia la distribuzione “chi-quadro”.
Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro” Esercizio 3 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale.
Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale c2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 moltiplicato per n-1 segue una distribuzione di tipo “chi quadro” Esercizio 3 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale.
Esercizio 3 • il campione è composto da n= 31 elementi quindi opero con 30 g.d.l. • dalla tabella dei valori critici di C ²30 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,560 e 1,57 Intervallo di confidenza allo 0,95
Esercizio 3 • il campione è composto da n= 31 elementi pertanto opero con una distribuzione chi-quadro a 30 g.d.l. • Dalle tabelle della f. cumulativa di c²30 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 16,791 e 46,979 Intervallo di confidenza allo 0,95
Esercizio 4 Si è definita su di una popolazione di sfere da cuscinetto una variabile casuale avente, per ciascuna sfera prodotta, valore uguale al valore del diametro misurato in centimetri. Un campione casuale costituito da 41 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la varianza della variabile casuale relativa all’intera popolazione.
Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro” Esercizio 4 Anche in questo esercizio dovremo assumere che la variabilità del diametro della sfere sia provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora. Con questa premessa è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale.