1 / 35

RELAZIONI TRA 2 FENOMENI QUANTITATIVI

RELAZIONI TRA 2 FENOMENI QUANTITATIVI. STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it. RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Vi è una relazione tra le variabili oggetto di studio? Di quanto variano i valori d’una variabile quando cambiano i valori dell’altra?

ulla
Télécharger la présentation

RELAZIONI TRA 2 FENOMENI QUANTITATIVI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RELAZIONI TRA 2 FENOMENI QUANTITATIVI STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it

  2. RELAZIONI TRA 2 FENOMENI QUANTITATIVI • Vi è una relazione tra le variabili oggetto di studio? • Di quanto variano i valori d’una variabile quando cambiano i valori dell’altra? • CORRELAZIONE • REGRESSIONE

  3. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0

  4. E (30 6,2) G (14 2,3) DIAGRAMMA DI DISPERSIONE (SCATTER) M(Y) = 3,0 M(X) = 16

  5. DIAGRAMMA DI DISPERSIONE (SCATTER) • I quadranti in cui compare la maggioranza dei punti indicano il tipo di relazione • Punti in I e III  relazione diretta • Punti in II e IV  relazione inversa • Punti si distribuiscono casualmente in tutti i quadranti all’incirca nella stessa proporzione  nessuna relazione lineare tra le due variabili • L’osservazione della “nuvola” di punti nel diagramma di dispersione fornisce una prima idea sulla relazione eventualmente esistente tra i due fenomeni.

  6. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0

  7. COVARIANZA • = MEDIA ARITMETICA DEI PRODOTTI DEGLI SCOSTAMENTI • COV(X,Y) >0  RELAZIONE DIRETTA • COV(X,Y) <0  RELAZIONE INVERSA • COV(X,Y) =0  X, Y INCORRELATE

  8. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514

  9. Osservazione: per ottenere la covarianza è sufficiente calcolare solo gli scostamenti di una variabile, moltiplicandoli per i valori dell'altra variabile (p. 153)

  10. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514

  11. Osservazione: può essere ottenuta anche in funzione dei dati originari (p.154) M(X) = 16 M(Y) = 3,0 COV(X,Y) = 402,6/7-16*3=9,514

  12. Proprietà della covarianza • E’ ESPRESSA NEL PRODOTTO DELLE UNITA’ DI MISURA DI X E DI Y • COV(X,X)=VAR(X) • E’ scale equivariant

  13. Proprietà della covarianza

  14. Proprietà della covarianza • max | COV (X, Y) | = = [VAR(X) VAR(Y)]1/2= = σ(X) σ(Y)

  15. Dimostrazione • var(tX-Y)>0 • t2 var(X) -2t cov(X,Y) + var(Y) >0 • h(t) è una funzione quadratica in t. Se h(t)>0 le radici non sono reali • Δ<0 implica che • 4 [cov(X,Y)]2 -4 var(X) var(Y) <0 • [cov(X,Y)]2 < var(X) var(Y) • |cov(X,Y)| < σ(X) σ(Y)

  16. Come ovviare ai difetti della COV? • La covarianza ha il difetto di risentire dell'unità di misura e dell'ordine di grandezza dei due fenomeni originari essendo espressa in termini del prodotto delle unità di misura di X e Y • I valori che essa può assumere non sono compresi in un intervallo di interpretazione immediata,

  17. RICHIAMO SCOSTAMENTI STANDARDIZZATI(p. 125) • Proprietà: • Mz = 0 • z = 1 • puri numeri  confronto tra fenomeni diversi

  18. COEFFICIENTE DI CORRELAZIONE rxy • (media dei prodotti degli scostamenti standardizzati  è un numero puro)

  19. SCOSTAMENTI STANDARDIZZATI

  20. rxy=6,73/7 =0,961

  21. Formule di calcolo alternative (p. 157)

  22. Formule di calcolo alternative:

  23. Interpretazione di r • rxy = -1 perfetta relazione lineare inversa tra X ed Y (cioè quando yi = a + bxi, con b < 0 e a numero qualsiasi) • rxy = 0 X ed Y sono incorrelate (non vi è tra loro un legame lineare; non si esclude però l’eventuale esistenza d’una relazione non lineare, ad esempio parabolica o sinusoidale) rxy = +1 perfetta relazione lineare diretta tra X ed Y (cioè quando yi = a + bxi, con b > 0 e a numero qualsiasi)

  24. Punti in situazioni estreme e rxy

  25. Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare

  26. |rxy |= 1 se e solo c’è perfetta relazione lineare tra X ed Y • Se Y = a+|b| X

  27. Esempio: 7 supermercati COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7 =2,04

  28. Esempio: 7 supermercati (continua) COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7=2,04

  29. Caratteristiche di r • Dato che rxy = ryx, il coefficiente di correlazione è una misura simmetrica in X ed Y interdipendenza tra le due variabili. • In esso non si assume una variabile come antecedente e l’altra come conseguente, ma si valuta semplicemente il legame vicendevole tra X ed Y.

  30. Proprietàdirxy(p. 160) • è invariante in senso forte (cioè presenta lo stesso valore numerico) per trasformazioni lineari crescenti di una o di entrambe le variabili

  31. Proprietà di rxy • Proprietà di invarianza per trasformazioni lineari: il coefficiente di correlazione lineare rimane invariato effettuando una trasformazione lineare crescente di una o di entrambe le variabili. •  se si cambia l’origine del sistema di misurazione e/o l’unità di misura in cui sono espresse le variabili, il valore del coefficiente di correlazione non varia.

  32. Applicazione della precedente proprietà • Si ottiene il medesimo valore di rxy anche effettuando il calcolo sui n.i. a base fissa

  33. Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare, in presenza di dati contaminati indicati con il simbolo * (p. 162)

  34. Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. • (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione? M(x)= 132.5 M(y)=119.2

  35. CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile

More Related