1 / 32

Counterfactuals and Causal Inference

Introduzione. Logica della valutazione o metodo di attribuzione causale utile quando si devono gestire grandi numeri?Concentrazione del valore dell'intervento su un'unica variabile risultato quantitativaLogica di base dell'attribuzione causaleLOPC (Lista di cause possibili)GEM (Metodo generale d

rolando
Télécharger la présentation

Counterfactuals and Causal Inference

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Counterfactuals and Causal Inference by Stephen Morgan & Christopher Winship

    2. Introduzione Logica della valutazione o metodo di attribuzione causale utile quando si devono gestire grandi numeri? Concentrazione del valore dellintervento su ununica variabile risultato quantitativa Logica di base dellattribuzione causale LOPC (Lista di cause possibili) GEM (Metodo generale di eliminazione)

    3. Introduzione (2) Per attribuire la causalit ci sono almeno otto metodi tutti altrettanto validi che si applicano a seconda delle diverse situazioni: (i) osservazione diretta (visiva, tattile) (ii) osservazione riportata (studi di caso) (iii) inferenza eliminativa (autopsia, guasto meccanico) (iv) inferenza teorica, basata sull'uso di una teoria o di un'analogia, es. fisica, geologia, astronomia (v) manipolazione diretta (es. in cucina o in laboratorio) (vi) esperimenti naturali (metereologia, epidemiologia) (vii) quasi-esperimenti (medicina, pedagogia) (viii) RCTs randomizzazione, assegnazione casuale (farmacologia)

    4. Introduzione (3) Domande in merito ai rapporti di causa-effetto sono frequentemente allorigine di molti lavori empirici nelle scienze sociali. Altrettanto frequentemente, per, non possibile fornire una risposta a tali domande a causa delle difficolt che gli scienziati sociali incontrano nel raccogliere dati. Negli ultimi tre decenni stato sviluppato un modello controfattuale della causalit che ha permesso di diffondere una cornice unificata per gli studi sui rapporti causa-effetto.

    5. Il modello controfattuale per lanalisi dei dati osservativi Il modello controfattuale suppone che in una popolazione ogni individuo possa essere esposto a due stati alternativi di una causa (detti trattamenti alternativi; se si considerano solo due stati, essi vengono definiti trattamento e controllo). Ogni stato caratterizzato da un distinto gruppo di condizioni; essere esposto a tali condizioni potenzialmente produce un risultato di interesse.

    6. Il modello controfattuale per lanalisi dei dati osservativi (2) Ogni individuo nella popolazione di interesse ha un risultato potenziale sotto ogni stato di trattamento, ma ogni individuo pu essere osservato solo in uno specifico stato in un determinato momento. I potenziali risultati di ogni individuo sono definiti come i veri valori del risultato di interesse che risulterebbe dallesposizione agli stati causali alternativi.

    7. Il modello controfattuale per lanalisi dei dati osservativi (3) I potenziali risultati di un individuo i sono: yi1 nel caso di stato di trattamento yi0 nel caso di stato di controllo Poich in teoria sia yi1 sia yi0 esistono per ogni individuo, leffetto causale a livello individuale pu essere definito come la semplice differenza yi1 - yi0 Ma gli effetti causali non possono essere calcolati a livello individuale poich non possibile osservare yi1 e yi0 per ogni individuo della popolazione di interesse.

    8. Il modello controfattuale per lanalisi dei dati osservativi (4) Necessariamente, un ricercatore deve analizzare una variabile Y (risultato osservato), che ha valori yi per ogni individuo i uguali a: yi1 per tutti gli individui del gruppo di trattamento yi0 per tutti gli individui del gruppo di controllo Concordemente: yi0 un risultato controfattuale non osservato per ogni individuo i del gruppo di trattamento yi1 un risultato controfattuale non osservato per ogni individuo i del gruppo di controllo

    9. Il modello controfattuale per lanalisi dei dati osservativi (5) Nella tradizione della modellizzazione controfattuale, lattenzione focalizzata sullo stimare gli effetti causali medi, analizzando i valori yi di gruppi di individui definiti da specifiche caratteristiche. Per fare ci, il processo attraverso il quale individui di differenti tipi sono esposti alla causa di interesse deve essere modellizzato. Questo implica lintroduzione di assunzioni per la stima di valori controfattuali non osservabili medi per specifici gruppi di individui.

    10. Tipi di esempio usati nel libro Gli autori riportano, successivamente, tre esempi (gli effetti causali dellesperienza familiare e dellintelligenza sul risultato scolastico; gli effetti causali del risultato scolastico e dellabilit mentale sui guadagni; gli effetti causali dellesperienza familiare, del risultato scolastico e dei guadagni sulla partecipazione politica), che pongono alcune fondamentali sfide per lanalisi causale: 1) le complicazioni della misurazione, ossia le variabili causali sono molto astratte e internamente eterogenee; 2) le variabili individuali non sono facilmente manipolabili attraverso lintervento esterno.

    11. Tipi di esempio usati nel libro (2) Gli autori riportano, inoltre, quattro esempi (gli effetti causali della scolarizzazione cattolica sullapprendimento; gli effetti causali dei buoni scolastici sullapprendimento; gli effetti causali della formazione alla manodopera sui guadagni; gli effetti causali della tecnologia alternativa di voto sul votare validamente), che mostrano una diretta relazione causale.

    12. Dati osservativi e ricerche campionarie Gli autori specificano che, nel corso del testo, si assume soventemente che il campione sia infinito (al fine di considerare come pari a 0 lerrore di campionamento e che la media campionaria di una variabile osservata sia uguale a quella della popolazione) e che le variabili siano state misurate senza errori.

    13. Leffetto netto medio E(d) = E(Y1 - Y0) 1^ problema: ununica variabile quantitativa 2^ problema: valore atteso di una variabile aleatoria, stimato per tutta la popolazione a partire da un campione Metodi di inferenza statistica -> calcolo delle probabilit -> funzioni generalmente continue -> unit su cui ragioniamo sono infinitesimali, numeri reali leffetto individuale NON osservabile e non solo perch controfattuale leffetto non osservabile non solo per un individuo della popolazione, ma neanche per qualsiasi insieme finito di individui; leffetto pu essere stimato solo per un insieme infinito di individui, quello della popolazione teorica

    14. Due ordini di inosservabilit ricostruzione del dato controfattuale per il quale non c un chiaro referente empirico, ci sono elevati margini di discrezionalit Per i dati cosiddetti osservabili per i quali il campione un chiaro referente empirico dobbiamo per fare le ipotesi di rappresentativit del campione Randomizzazione, lo estraiamo in maniera casuale e ci assicuriamo che sia di numerosit sufficientemente elevata Lo stratifichiamo, introducendo ipotesi teoriche Senza queste cautele, le unit su cui ragioniamo sono astratte: ovvero talmente piccole da essere infinitesimali, su ognuna di loro leffetto talmente piccolo da essere prossimo allo zero, e nessuna somma di un numero finito di infinitesimi diversa da un infinitesimo per fortuna lunico metodo EVIDENCE-BASED!

    15. Confronto tra metodi qualitativi e quantitativi Metodi qualitativi sono imprecisi, inaffidabili, distorti, etc Metodi quantitativi (continui, che usano numeri reali) ragionano su entit che non esistono nella realt Quando sono applicati male, se i metodi qualitativi sono un difetto della vista, i metodi quantitativi sono una forma di cecit

    16. E(d) = E(Y1) - E(Y0) Y1 = valore della variabile sullintera popolazione (umana, mondiale, infinita v.a.) nel caso in cui sia sottoposta a trattamento. Y0 = valore della variabile sullintera popolazione (umana, mondiale, infinita v.a.) nel caso in cui NON sia sottoposta a trattamento Notazione: Y1 = Y se D = 1; Y0 = Y se D = 0 D variabile discreta (0,1) indica la presenza / assenza del trattamento d = (Y1 - Y0); E(d) = E(Y1 - Y0) = E(Y1) - E(Y0)

    17. Lo stimatore ingenuo delleffetto netto medio dNAIVE = media (y | d = 1) - media (y | d = 0) SE IL CAMPIONE E RAPPRESENTATIVO O CASUALE: n -> inf., dNAIVE -> E(Y1|D=1) - E(Y0|D=0) diverso dalleffetto netto medio nellintera popolazione E(d) = E(Y1) - E(Y0) quindi dNAIVE DISTORTO (dist. non campionaria) Leffetto netto medio totale = leffetto netto medio sulla popolazione rappresentata dai trattati + leffetto netto medio sulla popolazione rappresentata dai NON trattati E(d) = p * E(d|D=1) + (1-p) * E(d|D=0) p = proporzione di popolazione che tipicamente viene selezionata o si autoseleziona al trattamento Se queste due quantit sono uguali no problem, coincidono con leffetto medio netto; ma lidea che in realt la popolazione sottoposta al trattamento sia sostanzialmente diversa da quella non sottoposta, in particolare rispetto a caratteristiche che influenzano autonomamente il valore di y

    18. Non esiste IL controfattuale: esistono DUE tipi di controfattuale Per stimare leffetto medio netto devo stimare DUE diversi effetti medi netti (almeno quando sono interessata a tutta la popolazione e non solo quella rappresentata da uno dei due sottogruppi) E(d|D=1) = E[(Y1-Y0)|D=1] = E(Y1|D=1) - E(Y0|D=1) E(d|D=0) = E[(Y1-Y0)|D=0] = E(Y1|D=0) - E(Y0|D=0) E(d) = p*E(Y1|D=1) - p*E(Y0|D=1) + E(Y1|D=0) -p*E(Y1|D=0) - E(Y0|D=0) +p*E(Y0|D=0) E(d) = (p-1)*E(Y0|D=0) + p*E(Y1|D=1) + (1-p)*E(Y1|D=0) - p*E(Y0|D=1)

    19. Lo stimatore ingenuo (2) Media campionaria di y1 -> E(Y1|D=1) Media campionaria di y0 -> E(Y1|D=0) Se il campione casuale (randomizzazione) o rappresentativo (introdurre stratificazioni cio ipotesi causali) le quantit in giallo non sono osservabili NEANCHE a livello campionario; cio non hanno un corrispondente campionario diretto; per stimarle non mi basta fare ipotesi statistico-probabilistiche; devo fare ipotesi di altro tipo (di social science theory)

    20. Esempio: effetto dellistruzione universitaria sul successo nel mercato del lavoro Mi interessa conoscere la differenza tra il successo sul MdL dellumanit nel caso in cui tutti frequentassero luniversit e il successo sul MdL dellumanit nel caso in cui nessuno frequenti luniversit Nella realt io ho 2 gruppi, coloro che frequentano luniversit e coloro che non la frequentano e osservo determinati risultati E(Y1|D=1) = 10; E(Y0|D=0) = 5 E(Y0|D=1) = 6; E(Y1|D=0) = 8 dNAIVE = (10-5) = 5; diff. baseline = (6-5) = 1; effetto medio sui tendenti al tratt. = (10-6) = 4; effetto medio sui non tendenti al tratt. = (8-5) = 3; diff effetti medi tra i due gruppi = diff tra i tassi di acquisizione di capacit lavorative in seguito alluniversit = (4-3) = 1; supponiamo che p = 0,3 E(d) = 5 - 1 - (1-0,3)*1 = 5-1-0,7 = 3,3

    21. Come eliminare la distorsione dello stimatore ingenuo lo stimatore ingenuo distorto e quindi va corretto dNAIVE -> E(Y1|D=1) - E(Y0|D=0) E(d) - dNAIVE = distorsione dello stimatore ingenuo Distorsione dello stimatore ingenuo = E(Y0|D=1) - E(Y0|D=0) + (p-1)*[E(d|D=1) - E(d|D=0)] differenza baseline, differenza di partenza, prima o in assenza del trattamento, tra coloro che si selezionano per il trattamento e coloro che non si selezionano differenza tra gli effetti medi dellintervento sulle due popolazioni, indipendente dalle (differenze nelle) condizioni di partenza

    22. Come eliminare la distorsione dello stimatore ingenuo (2) Devo riuscire a stimare la distorsione; una strategia tipica cercare di azzerarla Azzerare le differenze di partenza / baseline Azzerare le differenze di effetto netto del trattamento, di acquisizione dei benefici del trattamento (se le diff di baseline sono nulle ci equivale ad azzerare le diff di arrivo) Ipotesi 1: E(Y0|D=1) = E(Y0|D=0) (diff di partenza / baseline NULLE) il valore della variabile in ASSENZA di trattamento deve essere uguale tra coloro che tendono a essere trattati e coloro che tendono a non essere trattati E(d|D=1) = E(d|D=0); E[(Y1- Y0)|D=1] = E[(Y1- Y0)|D=0]; E(Y1|D=1) - E(Y0|D=1) = E(Y1|D=0) - E(Y0|D=0); E(Y1|D=1) = E(Y1|D=0) Ipotesi 2: E(Y1|D=1) = E(Y1|D=0) (differenza tra effetti lordi a parit di baseline = differenza tra effetti netti)

    23. Randomizzazione (RCTs) Y e D sono indipendenti per costruzione, non c autoselezione / selezione spontanea dei trattati Anche se, si fa presto a dire costruzione: campioni di numerosit elevata e cmq devo sempre fare test di casualit Conseguenza auspicata 1: E(Y0|D=1) = E(Y0|D=0) Conseguenza auspicata 2: E(Y1|D=1) = E(Y1|D=0) Dinamica durante lesperimento Il campione pu non essere pi casuale per: Possono cambiare le caratteristiche dei gruppi durante lesperimento Uscita dal gruppo (diversa tra i due gruppi - differential attrition) (anche per il matching) Cross-contamination (i non trattati imitano i trattati) Hawthorne effect (la consapevolezza di appartenere a un certo gruppo modifica il comportamento) Doppio cieco (ignoranza del partecipante e di chi somministra) (certo questo molto pi facile in farmacologia)

    24. Regressione Stimare leffetto di D per esclusione, calcolando leffetto di TUTTE le altre variabili causali e sottraendolo alleffetto complessivo In particolare stimo il valore della diff di partenza / baseline E(Y0|D=1) - E(Y0|D=0) e la diff tra gli effetti medi [E(d|D=1) - E(d|D=0)] in questo modo, insieme a dNAIVE, riesco a stimare E(d) Il problema che mi servono informazioni TEORICHE su cosa causa il fenomeno rappresentato dalla variabile di interesse; in particolare su TUTTE LE sue CAUSE: in altre parole, mi serve tutta la teoria del mondo (vedi esempio di REGRESSIONE semplice di Trivellato: non si capisce bene la differenza tra gli effetti: quali sono le due popolazioni? Dove sono i due controfattuali?)

    25. Serie storiche Interventi in cui tutta la popolazione esposta al trattamento (dati PRE/POST) Dinamica spontanea dei fenomeni (rilevanti: tonnellate di ipotesi teoriche) fa s la che popolazione di arrivo non sia la stessa rispetto a quella di partenza; conosco E(Y1|D=1) e E(Y0|D=0) ma non conosco E(Y1|D=0) n E(Y0|D=1) effetto della politica al tempo t0 sulla popolazione / contesto di partenza ci che si sarebbe avuto nel contesto / popolazione di arrivo al tempo t1 in assenza di intervento le serie storiche stimano la seconda quantit ma non la prima; solo la prima parte della distorsione dallo stimatore ingenuo; in altre parole leffetto relativo al contesto di arrivo E(d|D=1) = E[(Y1-Y0)|D=1] = E(Y1|D=1) - E(Y0|D=1) Limite perch quello che mi interessa leffetto netto di quella politica rispetto a qualsiasi contesto, non solo a quelli che somigliano a quello di arrivo

    26. Costruire un gruppo di controllo tramite matching Per rendere comparabili i due gruppi si costruisce un gruppo di controllo in cui ogni componente ha un corrispondente nel gruppo sperimentale Matching rispetto a cosa? Come faccio a sapere quali sono le variabili causalmente rilevanti? Mi serve tanta teoria Il gruppo di controllo somiglia ai trattati! Mi serve per stimare E(Y0|D=1), quindi E(d|D=1), ovvero leffetto netto medio sulla popolazione di cui sono rappresentativi i trattati, non su tutta Per stimare E(d|D=0) (e quindi leffetto complessivo) ma mi manca ancora il secondo controfattuale: E(Y1|D=0) come per le serie storiche: un limite importante nel caso in cui lobiettivo sia indurre un effetto su una pluralit di gruppi e contesti spazio-temporali, non solo su (quelli che somigliano a) i trattati o su un contesto storico preciso A volte non riesco a fare il matching neanche dei trattati perch non esistono individui comparabili con tutti i trattati

    27. Il modello controfattuale per lanalisi dei dati osservativi (6) Se le assunzioni sono sostenibili e il metodo adatto per costruire una differenza media dai dati chiuso, allora pu essere data uninterpretazione causale alla differenza media nel valori di yi. Successivamente gli autori presentano una storia selezionata delluso del linguaggio sperimentale nelle scienze sociali. In particolare, ricostruiscono luso dei termini:

    28. Analisi causale e scienze sociali osservative 1) esperimento (Fisher, Cox e Reid, Stouffer, Chapin, Campbell) poich il modello controfattuale della causalit aiuta il ricercatore a stipulare le assunzioni, valutare tecniche alternative di analisi dei dati e riflettere sul processo di esposizione causale. Il suo successo dovuto al suo linguaggio di risultati potenziali, che permette allanalista di concettualizzare gli studi osservativi come se fossero disegni sperimentali. 2) Regressione (Balock, Duncan) poich essa pu lavorare in modo abbastanza sensibile nel cercare risposte a domande causali.

    29. La rappresentazione grafica della relazione causale Pearl (2000) ha sviluppato una serie di regole per rappresentare le relazioni causali con la teoria dei grafici. Si consideri le relazioni causali rappresentate a p. 25 e si supponga che queste relazioni siano derivate da un gruppo di proposizioni teoriche. In questo grafico: 1) ogni nodo rappresenta una variabile casuale osservabile;

    30. La rappresentazione grafica della relazione causale (2) 2) ogni freccia unidirezionale significa che la variabile allorigine della freccia causa quella alla fine della freccia; 3) ogni freccia curva e bidirezionale significa lesistenza di un nodo comune non osservato che causa entrambe le variabili poste allestremit. Supponiamo che la variabile di primario interesse sia D e che leffetto causale che desideriamo stimare sia leffetto di D su Y. Secondo Pearl, la variabile causale D ha una distribuzione di probabilit.

    31. La rappresentazione grafica della relazione causale (3) Sulla variabile D agiscono causalmente le variabili A, B e C, anche se dal grafico non si evince la forza della relazione. La variabile risultato Y causata direttamente da F, G e D, ma anche da altre cause indirette (A, B e C) ed altre ancora implicite (rappresentate dalle frecce curvilinee) che determinano la distribuzione di probabilit di Y.

    32. Le strategie per stimare gli effetti causali Tre strategie per stimare gli effetti causali: 1) si pu condizionare (con procedure come la stratificazione, il confronto, la ponderazione o la regressione) le variabili che blocchino tutte le traiettorie back-door dalla variabile causale alla variabile risultato; 2) si possono utilizzare variazioni esogene in una appropriata variabile strumento per isolare la covariazione fra le variabili causale e risultato; 3) si pu stabilire un meccanismo isolato ed esaustivo che relaziona la variabile causale alla variabile risultato e calcolare come leffetto causale si sia propagato attraverso il meccanismo.

More Related