1 / 23

LEZIONE A.5 Serie ordinate e numeri indici

TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli. LEZIONE A.5 Serie ordinate e numeri indici. In questa lezione. In questa lezione ci occuperemo delle Serie ordinate. Familiarizzeremo con la rappresentazione grafica.

Télécharger la présentation

LEZIONE A.5 Serie ordinate e numeri indici

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli LEZIONE A.5 Serie ordinate e numeri indici

  2. In questa lezione.. In questa lezione ci occuperemo delle Serie ordinate. • Familiarizzeremo con la rappresentazione grafica. • Analizzeremo le possibili trasformazioni delle serie. • Ci soffermeremo in particolare sui numeri indici. • Infine, partendo da dati di serie storiche, introdurremo una importante media analitica, la media geometrica.

  3. Serie ordinate e serie storiche Abbiamo definito SERIE ORDINATA la successione di modalità osser-vate di un carattere, rispettando l’ordine di rilevazione: X = {x1, x2, x3, .., xN-2, xN-1, xN} Ovviamente rinunciando a classificare ulteriormente le osservazioni per-diamo in sinteticità, ma manteniamo l’informazione dell’ordine della se-rie. E in certi casi (come per le ‘serie storiche’) l’ordine (l’unità di tem-po di rilevazione) è fondamentale. Attenti. In forma di tabella una serie storica appare spesso su due colonne, ma non si tratta di coppie di modalità e nu-merosità: la numerosità è sempre 1 per ogni modalità! La prima colonna riporta in realtà l’indice (di sequenza tem-porale) che caratterizza l’osservazione. L’analisi di serie storiche è, sì, un’analisi monovariata, ma difatto associa due variabili

  4. Rappresentazione grafica La rappresentazione grafica sul tempo è il modo più efficace per rappresen-tare l’evoluzione di una serie storica. Data la serie storica Xt, t=1,2,..N, si rappresentano in una piano cartesiano tutte le N coppie {t, Xt}, ponendo sulle ascisse il tempo t e sull’ordinata le osservazioni Xt, e unendo poi con una spezzata gli N punti così individuati. In questo modo si può tentare in modo intuitivo di scorporare le compo-nenti erratiche del processo da eventuali leggi temporali ipotizzabili. Trend lineare Trend nonlineare Ciclo Stagionalità

  5. Aids e e-commerce Previsioni milioni casi conclamati Aids 5 paesi (Cina,India,Nigeria,Russia,Etiopia) Due esempi sorprenden-temente simmetrici: a differenza dei diagram-mi ad aste, qui i punti di coordinate (Xt,t) sono legati in una spezzata. Fatturato in milioni di euro di imprese in settore E-commerce

  6. Un altro esempio In carico overdose Un altro esempio non certo leggero. Xt sono i pazienti tossicodipendenti in carico presso strutture del Sistema Sanitario Nazionale. Ytsono gli episodi di overdose rilevati (fonte: Ministero degli Interni). Zt (rapporto statistico) misura i casi di overdose ogni cento presi in carico.

  7. Trasformazioni di serie storiche Xt differenze Tassi di variazione Per capire l’andamento di una serie è utile calcolare (e rappre-sentare graficamente) una sua trasformata che renda conto (tramite differenze o rapporti) delle variazioni per unità di tempo.

  8. Numeri indici Abbiamo già visto come i numeri indici siano quozienti tra le intensità di uno stesso fenomeno in due istanti temporali diversi (o in due ambiti ter-ritoriali diversi) bIt = xt / xb I numeri indici temporali sono quindi misure derivate da una serie storica xt (per t=0,1,2,..,t,..T) Il denominatore è detto base del N.I. e costituisce il termine rispetto a cui si analizza la variazione del fenomeno. I due deponenti di i indicano: a sinistra b=tempo base, a destra t=tempo corrente. Sulla stessa serie storica xt si calcolano più serie parallele di N.I. : ·   N.I. a base fissa (denominatore fisso per tutta la serie) ·   N.I. a base mobile (denominatore di bit è = xt-i)

  9. Base fissa e base mobile Proprietà di circolarità o di concatenamento: concate-nando gli indici a base mobile (cioè moltiplicandoli tra loro in successione) si ritrovano i corrispondenti n.i. a base fissa x3/x0 =(x1/x0).(x2/x1).(x3/x2) 0i3 = 0i1 . 1i2 . 2i3 Tra n.i. a base mo-bile e tassi di va-riazione o incre-mento vale la rela-zione: t-1it=1+rt

  10. Valori assoluti e numeri indici: confronti grafici Il grafico dei n.i. a base mobile dei casi di tossi-cofilia evidenzia come l’incre-mento annuo, tolto il primo in-tervallo, è abba-stanza stabile (linea continua vs linea tratteg-giata) Xt t t-1it NB: l’ammontare iniziale del carattere può es-sere attualizzato moltiplicandolo per il prodot-to dei numeri indici a base mobile: Xt = X0 t t-1it 67500(1,37160)(1,12121)(..)(1,01455)= = 67550  (1,95136) = 131717 t

  11. Numeri indici e trend esponenziali Spesso (cfr casi di E-com e Aids) abbiamo a che fa-re con serie che si impen-nano ‘esponenzialmente’. Questo tipo di andamento è rivelato dalla serie degli indici a base mobile corri-spondenti: essi tenderan-no o a restare costanti o a variare linearmente. In casi simili a un grafico su scala lineare sfuggono le variazioni ‘basse’: si u-sano talvolta carte milli-metrate semilogaritmiche.

  12. La trasformata logaritmica Nella carta a scala semilogaritmica sulla ordinata si trova non X ma la sua trasformata logaritmica. Si tratta di una funzione matematica che cresce indefinitamente con X ma in modo assai più lento e indefinitamente decele-rato (se X<1 logX è negativo) Y=f(x)=logx x Perbacco, la trasformata logaritmica di X è davvero lineare! Calcolare un logaritmo è (oggi) semplicissimo. Digi-tate per esempio la cifra 5,3 sulla macchinetta, poi cliccate sul tasto “log” o “ln” (non Log): otterrete 1,6677, che è appunto il logaritmo corrispondente.

  13. Tassi medi di incremento Torniamo ai tassi di occupazione. In 4 intervalli di tempo (bienni) gli occupati passano da 9000mila a 11178mila, con un incremento totale del 24,2%. I 4 tassi di incremento annui sono 4,1%; 5,5%; 5,6%; 7%. Possiamo domandarci: qual è il tasso medio di incremento del periodo? Un modo per calcolare un tasso medio può consistere nel farne la media aritmetica semplice (somma dei tassi divisa per il loro numero). Tasso medio periodale semplice è la media aritmetica delle variazioni relative intervenute in ciascun periodo nell’intervallo 0—T. r = (r1+r2+..+rk)/k = (i=1..k ri)/k = (4,1+5,5+5,6+7,0)/4 = 22,2/4 = 5,55 Ma il tasso medio semplice ha un difetto: applicato allo stock iniziale non dà il corretto valore finale della serie. Il risultato finale è 11170, pari al 24,1% di incremento rispetto a x0 , mentre il valore esatto è il 24,2%.

  14. Tasso medio composto 0r4 = 0i4 -1 = (x1/x0).(x2/x1).(x3/x2).(x4/x3) - 1 = 1,242-1 Noi vogliamo che il tasso di incremento finale sia equiripartito tra i 4 periodi. Invece di fare la somma dei tassi di variazione (divisa per k=4), una alternativa consiste nella equiripartizione (tramite radice di ordine k=4) del prodotto dei numeri indici : r = 4(x1/x0).(x2/x1).(x3/x2).(x4/x3) - 1 = 4x4/x0 - 1 r = 411178/9000 - 1 = 41,242 - 1 = 1,055675 Ora il prodotto (N-1) volte dell’ammontare iniziale della serie storica per il tasso medio periodale composto è pari all’ammontare finale. 9000.r=9501.r=10030.r=10588.r=11178=xt CVD Il tasso medio periodale composto è la media geo-metrica delle variazioni relative intervenute tra 0 e T.

  15. Funzione obiettivo Abbiamo già detto che una buona media analitica implica l’esistenza di una sintesi algebrica delle proprietà individuali in una corri-spondente proprietà, dotata di significato, del collettivo. Media secondo Chisini rispetto a una data funzione obiettivo è appunto quel valore numerico che, sostituito a ogni modalità osservata, lascia inalterata la funzione obiettivo stessa. La funzione obiettivo più diffusa è l’intensità totale del carattere studiato, somma delle modalità osservate nelle N unità della popolazione. L’intensità totale ripartita tra le N unità è la media aritmetica. Per es., se Tizio Caio e Sempronio hanno rispettivamente 4, 6 e 11 euro in tasca, tutti insieme possiedono T=21 euro, e la media corretta è T/N=7 euro. Infatti se ciascuno di loro avesse 7 euro il totale non muterebbe.

  16. Prodotto come funzione obiettivo Ma supponiamo ora di analizzare la variabile “indice a base mobile del costo della vita” su due anni. Nel primo anno non ci sia incremento (0i1=1,00), nel secondo anno ci sia un’inflazione del 44% (1i2=1,44). Fatto 100 il costo della vita in t=0, esso sarà ancora 100 in t=1 e 144 in t=2. In questo caso non ci interessa tenere fissa l’intensità totale degli indici, ma il rapporto tra costo iniziale e costo finale della vita. 144=1000i11i2 0i11i2=(144/100)=1,44 Quando le modalità sono legate tra loro da un meccanismo moltiplicativo, la corretta funzione obiettivo è il prodotto delle modalità osservate. E se per ripartire equamente una somma la si divide per il numero di modalità [(a+a+a)/3=3a/3=a], per ripartire un prodotto occorre fare la radice di ordine N [3(aaa)=3(a3)=a]. Nell’esempio la media ‘giusta’ è 3(1,44)=1,2 che, sostituito ai due indici 0i1 e 1i2 osservati, dà il giusto costo finale della vita. Usando la media aritmetica m=1,22, il costo finale sarebbe stato 148,84: molto superiore!

  17. La media geometrica e il suo calcolo La media geometrica lascia inalterata una particolare funzione obiettivo, il prodotto di tutte le modalità, ponderate per le rispettive numerosità. Nota: nelle serie storiche la nume-rosità delle modalità è sempre 1!: La media geometrica non è così semplice da calcolare. La media aritme-tica si ottiene sommando N modalità e dividendo per N. La media geome-trica si ottiene moltiplicando N modalità e poi facendo la radice N-esima del prodotto. Che complicazione! • Il logaritmo di un prodotto è = alla som-ma dei logaritmi. • Il logaritmo di xn è = a nlogx • Il logaritmo di nX=x(1/n) è = a (1/n)logx • Se y=logX, X=antilogY • Dulcis in fundo, logaritmi e antilogaritmi si calcolano con le macchinette da 1 $! Ci viene in aiuto una funzione di trasformazione di X che abbiamo già conosciuto: la trasformata logaritmica Y=logX. Non temete, non toccheremo l’ar-gomento. Ci interessano solo cer-te proprietà ‘algebriche’ di logX.

  18. Ancora sul calcolo della media geometrica Date le proprietà della trasformata logaritmica, vediamo cosa succede al logaritmo della media geometrica: Quindi il logaritmo di Mg è nien-t’altro che una media aritmetica calcolata non sulle modalità di base ma sui loro logaritmi. Mg = E(logX) Abbiamo già visto come calcolare un logaritmo. Ma quando avremo fatto la somma ifilogxi, come fare per risalire alla media geometrica? E’ altrettanto semplice. Una volta calcolata la ifilogxi digitatela sulla vostra macchinetta e schiacciate la funzione “ex”. Per esempio l’antilogaritmo di 1,6677 è 5,3

  19. Un esempio di procedura di calcolo (e tre note) logxt = 0,6685 logMg=logxt/N=0,0955 Mg = antilog = 1,10021 M(X)=xt/N=7,740/7=1,106 La serie stimata è esponenziale NB1: se si ricalcola il montante (1990=67500) usando M(X) esso risulta sovrastimato. NB2: è sempre vero che Mg (X) M(X) NB3: Mg si calcola anche come n(xt/x0)= 7(131717/67500)= 71,95136=1,10021

  20. Un altro esempio Qual è il giusto (si fa per dire) tasso me-dio di crescita dell’epidemia di Aids? M(X)=xt/N=8,259/4=2,06475 logMg=logxt/N=2,86222/4=0,71555 Mg = antilog = 2,04532 NB:la media geometrica è sempre<M(X)! Nota: la media aritmetica porta a sovrastimare il valore finale di oltre il 3,8% (72700 invece che 72000)!!

  21. Confrontare incidenti e feriti Riportare due serie storiche su scale compara-bili con-sente a volte di cogliere interes-santi cor-relazioni tra serie storiche Per esempio, le due serie (incidenti in rosso a tratto continuo, feriti in blu a tratteggio) hanno ordini di grandezza differenti. Ma se li riportiamo su scale comparabili, ci accorgiamo come l’andamento sia simile. Scala e andamento sono cose distinte.

  22. Confrontare incidenti e vittime Ma cosa è mai questa ‘correla-zione’?Confron-tare due anda-menti ci condu-ce nel dominio dell’analisi bivariata In questo caso le due serie (in-cidenti in rosso a tratto conti-nuo, vittime in blu a tratteg-gio), riportati su scale compa-rabili, mostrano andamenti dif-ferenti. Non pare esserci ‘cor-relazione’ tra le due serie.

  23. Da tre serie, altre serie (rapporti statistici) Lavorare con serie di rap-porti statistici è dunque un modo più compatto per analizzare due fenomeni insieme Anche combinare due serie in for-ma di rapporto statistico permette spesso di capire di più. Per esem-pio, la serie delle vittime per inci-dente, in rosso a tratto continuo, sembra declinare, mentre quella dei feriti per incidente, in blu tratteggiato, si impenna.

More Related