300 likes | 533 Vues
www.akf.dk. Dansk Evalueringsselskabs konference 2007. Evalueringserfaring. AMU-deltagelse for nyledigeIntro. af tempor
E N D
1. www.akf.dk Dansk Evalueringsselskabs konference 2007 Evaluering og Effektmling i Praksis Lars Skipper
Anvendt KommunalForskning
2. www.akf.dk Dansk Evalueringsselskabs konference 2007
3. www.akf.dk Dansk Evalueringsselskabs konference 2007 Hvorfor evalueringer? THERE IS NO SHORTAGE OF POLICY PROPOSALS. THERE IS, HOWEVER, A SHORTAGE OF EMPIRICAL EVIDENCE ON THE EFFICACY OF THESE POLICIES
(James Heckman )
4. www.akf.dk Dansk Evalueringsselskabs konference 2007 Evalueringsformer Procesevaluering blev midler allokeret til et givet projekt ogs faktisk brugt til dette projekt? Blev de korrekte procedurer fulgt?
Effektevaluering hjalp et givet projekt, behrigt defineret, deltagerne? Var projektet selvfinansierende? Hjalp det eller skadede det nogen, som ikke deltog?
Der vil i de nste timer alene blive fokuseret p 2.
5. www.akf.dk Dansk Evalueringsselskabs konference 2007 Effekter og Effektevaluering Politikker og programmer ivrksat for at sttte konomisk eller social udvikling kan have positive effekter eller ingen effekter
I nogle tilflde kan fravret af positive effekter skyldes
Ringe design
Utilstrkkelig finansiering
I andre tilflde kan fravret af en positiv effekt skyldes at programmet alene eksisterer for at kanalisere penge fra skatteyderne over til politisk indflydelsesrige virksomheder, individer eller grupper og hvor konomisk udvikling blot fungerer som dkke.
6. www.akf.dk Dansk Evalueringsselskabs konference 2007 Effekter og Effektevaluering Nr programmer ikke producerer (tilstrkkelige) fordele, s kan en afdkning af dette muliggre at begrnsede ressourcer fr lov at blive anvendt p andre, og mere fordelagtige aktiviteter eller at de bliver sent retur til de evigt plagede skatteydere
Nr programmer producerer fordele, s kan viden om dette medfre politisk opbakning for programmets fortsttelse eller mske endda ekspansion
7. www.akf.dk Dansk Evalueringsselskabs konference 2007 Effekter og Effektevaluering Evidens omkring effektiviteten af konomiske udviklingsprogrammer og politikker kommer fra evalueringer.
Disse timer vil indeholde en diskussion af udviklingen inden for evaluering og effektstudier med praktiske eksempler
Den akademiske litteratur har vret i en voldsom udvikling i de sidste rtier
Desvrre er praksis mange steder stadig begravet i 1970erne
8. www.akf.dk Dansk Evalueringsselskabs konference 2007 Oversigt De forskellige konometriske evalueringsestimatorer. Hovedpointe
Valg af behrige estimator givet data til rdighed, (den konomiske) problemstilling og de institutionelle rammer omkring programmet
Heterogene treatment effekters betydning for evalueringens design og fortolkning
Implikationer af generelle ligevgtseffekter for policy evalueringer
9. www.akf.dk Dansk Evalueringsselskabs konference 2007 To vigtige pointer Skal man altid evaluere? Ogs sm programmer?
Tiden brugt p at lse litteraturen p gode evalueringer af lignende programmer kan give en strre indsigt og bedre resultater end en svag evaluering baseret p ringe data foretaget af en utilstrkkeligt kvalificeret empiriker med upassende metoder
10. www.akf.dk Dansk Evalueringsselskabs konference 2007 To vigtige pointer Evalueringer sikrer at projektmanagere fremmer mlene for deres verste chefer, nemlig skatteydere og donorer, og ikke blot overfrer ressourcer til magtfulde interessegruppe. I praksis eksisterer en masse lavkvalitets-evalueringer alene som dkning for prcis sdan en adfrd.
Vigtigt at vre meget klar om,
Hvad der udgr en god evaluering?
F designet institutioner, der kan reducere denne strm af vildledende evalueringer Evalueringer, nr de tages serist, er en metode, der sikrer at projektmanagere og politiske beslutnings-tagere fremmer mlene for deres verste chefer, nemlig skatteydere og donorer, og ikke blot overfrer ressourcer til magtfulde interessegruppe som program-operatrer, politisk favoriserede virksomheder, eller sig selv. I praksis eksisterer en masse lavkvalitets-evalueringer alene som dkning for prcis sdan en adfrd. Af netop den grund er det vigtig at vre meget klar om, hvad der udgr en god evaluering og f designet institutioner, der kan reducere denne strm af vildledende evalueringer
Evalueringer, nr de tages serist, er en metode, der sikrer at projektmanagere og politiske beslutnings-tagere fremmer mlene for deres verste chefer, nemlig skatteydere og donorer, og ikke blot overfrer ressourcer til magtfulde interessegruppe som program-operatrer, politisk favoriserede virksomheder, eller sig selv. I praksis eksisterer en masse lavkvalitets-evalueringer alene som dkning for prcis sdan en adfrd. Af netop den grund er det vigtig at vre meget klar om, hvad der udgr en god evaluering og f designet institutioner, der kan reducere denne strm af vildledende evalueringer
11. www.akf.dk Dansk Evalueringsselskabs konference 2007 Programmer og Parametre Lokale konomiske udviklingsprogrammer dkker over en bred vifte af initiativer:
Human kapital programmer
Finansielle og lignende subsidier til professionelle sportsklubber
Regionale udviklingsprogrammer
Skattesubsidier som lokkemad til bestemte typer virksomheder
OSV OSV OSV
12. www.akf.dk Dansk Evalueringsselskabs konference 2007 Pvirkede enheder Direkte pvirkede enheder: treated
Individer; nogle virksomheder; alle virksomheder i et omrde; byer; regioner; lande.
Indirekte pvirkede enheder (teoretisk guide)
Konkurrenceforvridning, positive spill-overs, finansieringen.
13. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation I diskussioner af programmer er fokus ofte p effekterne af disse som om effekterne af et program er en veldefineret enhed.
Vigtig pointe i dag: Programmer har en bred vifte af effekter! I faglitteraturen taler man om heterogene effekter.
Et programs betydning ndrer sig, nr vi erkender, at effekter kan variere over populationen af deltagere og i nogle tilflde endda pvirke ikke-deltagere
14. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation Lad Y benvne en udfaldsvariabel
For hver enhed, i, forestiller vi os to verdener. En verden, hvor enhed i deltager, og en verden hvor enheden ikke deltager.
I verden med deltagelse benvnes udfaldet Y1i
I verden uden deltagelse benvnes udfaldet Y0i
Effekten af et program for person i er givet ved
Di = Y1i - Y0i
Evalueringsproblemet bestr i at estimere den manglende af de to udfald. ln, beskftigelse, helbred for individer; profit, antal ansatte, omstning for virksomheder; antal indbyggere, luftkvaliteten, konomisk vkst for regioner.
ln, beskftigelse, helbred for individer; profit, antal ansatte, omstning for virksomheder; antal indbyggere, luftkvaliteten, konomisk vkst for regioner.
15. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation Standard praksis i litteraturen er at tage gennemsnit af Di hen over forskellige politik-relevante populationer.
Lad D angive deltagelse, s Di = 1 for enheder, der deltager, og Di = 0 ellers.
Oftest estimeres Average treatment on the Treated
Estimat p ATET og gennemsnitlige omk. muliggr alt-eller-intet CBA
16. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation Alternativt kunne Average Treatment Effect estimeres
Besvarer sprgsml omkring universal programmer - Nr hidtidige programmer fx gres obligatoriske, har beslutningstagere behov for estimater p ATET OG ATE - kan variere betragteligt!
17. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation En tredje parameter er marginale eller lokale Average Treatment Effects. Mler effekten af et program blandt en gruppe p en relevant margin.
Sammenligninger af MATE og marginalomkostninger ved udvidelse eller begrnsninger giver cost benefit omkring ndringer p marginen
En MATE til hver margin!
18. www.akf.dk Dansk Evalueringsselskabs konference 2007 Notation Disse parametre vil nogen gange inkludere generelle ligevgtseffekter afhnger af design af analysen
GE effekter kommer fra ndringer i adfrden for ikke-behandlede enheder pga. programmet
Kan vre direkte ikke-behandlede ndrer adfrd for at kunne f treatment
Kan vre indirekte som ved ndringer af relative priser eller ved displacements
19. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Rkke estimatorer prsenteres
Hvordan vlger man mellem disse?
De er ikke retter i en buffet! Vlg ikke fordi
De har et sejt navn
Er opfundet af kendte konomer eller statistikere
Er de jour estimatoren
Mske er der ikke en passende estimator givet data?
20. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Sociale Eksperimenter
Mest potente vrktj i evaluatorens vrktjskasse
Lser problemet med at finde E(Y0| D = 0) direkte
Kan ikke besvare alle sprgsml
Randomisering kan nogen gang ikke benyttes
Randomisering fanger mske ikke GE effekter
Giver ikke (uden yderligere antagelser) fordelinger af effekter.
Meningen med denne diskussion er ikke at give et pskud for dem, som ikke nsker at f foretaget eksperimenter, fordi de foretrkke auraen af uvidenhed/usikkerhed omkring de programmer, som de elsker (eller har konomiske interesser i hvilket ofte er det samme). Det er mere for at sikre, at eksperimenter ikke bliver brugt, nr de ikke kan eller vil give et svar p et givet sprgsml og for at sikre, at de tolkes korrekt, nr de bruges.
Randomisering: demokrati og konomisk vkst. Politiske faktorer (randomisering af bloktilskud)
Ekstern validitet: Selvselektion af centre, der nsker / indvilliger i at deltage!
Randomiseringsbias: risikoen for at blive randomiseret ud gr at man ndrer adfrd INDEN eksperimentet
Meningen med denne diskussion er ikke at give et pskud for dem, som ikke nsker at f foretaget eksperimenter, fordi de foretrkke auraen af uvidenhed/usikkerhed omkring de programmer, som de elsker (eller har konomiske interesser i hvilket ofte er det samme). Det er mere for at sikre, at eksperimenter ikke bliver brugt, nr de ikke kan eller vil give et svar p et givet sprgsml og for at sikre, at de tolkes korrekt, nr de bruges.
Randomisering: demokrati og konomisk vkst. Politiske faktorer (randomisering af bloktilskud)
Ekstern validitet: Selvselektion af centre, der nsker / indvilliger i at deltage!
Randomiseringsbias: risikoen for at blive randomiseret ud gr at man ndrer adfrd INDEN eksperimentet
21. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Sociale Eksperimenter
Praktiske problemer med implementeringen
Ekstern validitet
Randomiseringsbias (+ Hawthorne effekter)
Fortolkning af resultater ved drop outs
Hvilken behandling fr kontrolpersonerne?
Sociale Eksperimenter krver ogs antagelser!
Ekstern validitet: Selvselektion af centre, der nsker / indvilliger i at deltage!
Randomiseringsbias: risikoen for at blive randomiseret ud gr at man ndrer adfrd INDEN eksperimentetEkstern validitet: Selvselektion af centre, der nsker / indvilliger i at deltage!
Randomiseringsbias: risikoen for at blive randomiseret ud gr at man ndrer adfrd INDEN eksperimentet
22. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Sociale Eksperimenter
Varianter af randomisering
ved deltagelsestidspunktet
ved kvalifikationstidspunktet: Hurtigt i gang
p marginen: AMU eksperimentet
Flertrinsrandomisering: burde have vret i Hurtigt i gang
Randomisering af incitamenter for deltagelse
Hver variant besvarer sit sprgsml; nogle metoder er mske politisk mere tlelige end andre
23. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Sociale Eksperimenter
Oplgsholderen forstr ikke, hvorfor det ikke er embedsmndene, der br argumentere for ikke at udfre sociale eksperimenter ved alle dyre eller vigtige offentlige (med-)finansierede programmer, hvor der er behov for en evaluering og hvor det samtidigt er muligt
Samfundsvidenskaberne mangler deres thalidomid-katastrofe Etiske betragtninger: Der er konflikter mellem de mennesker, der deltager, og etikken bag at opdrive skatter til finansiering af programmer der ikke virker!Etiske betragtninger: Der er konflikter mellem de mennesker, der deltager, og etikken bag at opdrive skatter til finansiering af programmer der ikke virker!
24. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p observerbare karakteristika
Eksperimenter lser evalueringsproblemet med det uobserverede kontrafaktum, E(Y0 | D = 1) direkte ved tvungent, og tilfldigt, at holde D = 1 personer, som ville have deltaget under normale omstndigheder, ude af behandlingen
I modstning til dette lser matching eller regressioner evalueringsproblemet ved at antage, at selektionen er urelateret til det ikke-deltagende udfald betinget p et st af observerbare variable, X Motivation: RA er ofte umuligt at implementere enten pga. omkostninger eller pga. politiske eller sociale hensyn
Andre treatments er umulige at evaluere med randomisering: sprog, valg af bopl (og dog), familie-indkomst, brn Matching virker ikke som RA p nogen anden mde end enhver anden ikke-eksperimentel evalueringsmetode. Alle sdanne metoder er som RA NR antagelserne, der retfrdiggr dem, holder i dataMotivation: RA er ofte umuligt at implementere enten pga. omkostninger eller pga. politiske eller sociale hensyn
Andre treatments er umulige at evaluere med randomisering: sprog, valg af bopl (og dog), familie-indkomst, brn Matching virker ikke som RA p nogen anden mde end enhver anden ikke-eksperimentel evalueringsmetode. Alle sdanne metoder er som RA NR antagelserne, der retfrdiggr dem, holder i data
25. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p observerbare karakteristika
Betinget uafhngighed siger blot, at deltagelses-beslutningen bliver tilfldig betinget p et st af observerbare variable.
Betinget uafhngighed er opfyldt, hvis alle variable, der bde pvirker beslutningen om deltagelse, D, og fremtidige udfald, Y, observeres
Dette er potentielt en meget streng antagelse! Kan kun testes ved at udfre eksperimenter
26. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p observerbare karakteristika
Bemrk, at betinget uafhngighed kan holde for en gruppe variable men ikke for en anden
Men valget af X er ikke arbitrrt! Teori og institutionel viden kan guide os i valget af variable
Matching er KLART at foretrkke fra OLS
Fri af (altid forkert specificerede) funktionelle former, inkl. homogen effekt
Illustrerer common support problemet
Hvis betinget uafhngighed holder, men ikke linearitet, s er matching konsistent, mens regression ikke er det.
Simpelt: Matching gr det benbart, om kompatible ikke-deltagende enheder eksisterer for hver af de deltagende enheder. P den mde hjlper matching til ikke at identificere effekter alene ud fra projektioner ud i omrder, hvor der ikke er nogen datapunkter.Hvis betinget uafhngighed holder, men ikke linearitet, s er matching konsistent, mens regression ikke er det.
Simpelt: Matching gr det benbart, om kompatible ikke-deltagende enheder eksisterer for hver af de deltagende enheder. P den mde hjlper matching til ikke at identificere effekter alene ud fra projektioner ud i omrder, hvor der ikke er nogen datapunkter.
27. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p observerbare karakteristika
28. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p observerbare karakteristika
Er dette plausibelt? Det er op til empirikeren at argumentere for dette! Baseres p
konomisk (eller anden) teori om hvilke variable, der burde betyde noget for deltagelse og udfald
Viden om institutionerne, der pvirker selektions- og udfaldsprocesserne
Det til rdighed vrende data
Den eksisterende viden i litteraturen, inklusiv sammenligninger af effekt estimater baseret p matching og eksperimentelle estimater HUSK SUTVA som ved eksperimenter!HUSK SUTVA som ved eksperimenter!
29. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Paneldata metoder
Der eksisterer en periode, t, tilbage i tiden, hvor deltagelse i periode t = 0 ikke pvirker udfaldene
Stort praktisk problem: Vi er ndt til at have adgang til data fra en periode tilstrkkeligt langt bagud i tid, hvor beslutningen om den fremtidige deltagelse ikke pvirker adfrden (forventning) OG vi (ikke individerne p dette tidspunkt) skal vide, om der er deltagelse i fremtiden
30. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Paneldata metoder: Before-After
Brug et tidligere udfald for den deltagende enhed som dennes egen kontrol-enhed. Holder hvis
Nem at estimere
Behver kun data for deltagere
Holder kun, hvis forventet vrdi af potentielle udfald ikke ndrer sig over tid. MEGET urealistisk antagelse Fx hvis virksomheder kun vlger at deltage i et subsidie-program, nr de har et drligt r og hvis de fleste drlige r efterflges af gode r selv i fravret af subsidier, s vil en fr-efter sammenligning af udfaldene for deltagende virksomheder overdrive effekten af subsidierne p virksomhedernes performance ved at tilskrive den normale regression til midten til subsidie
Antager ogs, at aggregerede ndringer i udfaldene, fx bedre konjunkturer, ikke er muligeFx hvis virksomheder kun vlger at deltage i et subsidie-program, nr de har et drligt r og hvis de fleste drlige r efterflges af gode r selv i fravret af subsidier, s vil en fr-efter sammenligning af udfaldene for deltagende virksomheder overdrive effekten af subsidierne p virksomhedernes performance ved at tilskrive den normale regression til midten til subsidie
Antager ogs, at aggregerede ndringer i udfaldene, fx bedre konjunkturer, ikke er mulige
31. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Paneldata metoder: Before-After
Eksisterer i et hav af mere eller mindre parametriske versioner, eks. Fixed effects estimatorer og first difference
Alle ude af stand til at hndtere Ashenfelters Dyk
Eks: Deltagere i aktivering i frste uge af 1995
32. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori
33. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Paneldata metoder: Difference-in-Difference
Antagelsen om at deltagere kan fungere som deres egne kontrolenheder afhnger af temporr stabilitet af de potentielle udfald.
Da dette sjldent er plausibelt, forsger Dif-in-Dif at rense for ndringerne i det potentielle kontrol udfald over tid ved at antage at en anden gruppe eksisterer, der ikke er pvirket af deltagelsen, men er pvirket af de samme ndringer og reagerer p disse ndringer p en mde som deltagerne ville have gjort.
34. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Paneldata metoder: Difference-in-Difference
Nsten lige s simpelt at implementere som BA estimatoren.
Tager forskellen mellem den gennemsnitlige ndring i de observerede udfald for deltagerne og ndringen i de observerede udfald for ikke-deltagerne
Centrale antagelse: udfaldene for deltagere og ikke-deltagere udvikler sig p den samme mde over tid
Eksempel: Aktiverede i 1995 og ledige ikke-deltagere
35. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori
36. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Instrumental Variables
Ogs nogen gange benvnt exclusion restriction
Intuitivt er instrumenter variable, som flytter rundt p sandsynligheden for deltagelse, men som ikke pvirker udfaldsvariablene andet end gennem deres effekt p deltagelse
Statistisk er instrumenter variable, der er korrelerede med den endogene variabel, her deltagelsesbeslutningen D, men som ikke er korrelerede med uobserverbare variable i udfaldsligningen
37. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Instrumental Variables
Tre mulige mder at finde gode instrumenter p
Teori kombineret med smart dataindsamling: Eks. afstand til universitet
Eksogen variation i administrative implementeringer: Eks. sagsbehandler attitude, variation i pasningsgaranti over kommuner
Bevist konstruktion: Eks. eksperiment eller lotteri (session).
38. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Selektion p uobserverbare karakteristika
Instrumental Variables
Fordele: Nem at implementere. Bde Heckman selection model og IV ligger som standard procedurer i de fleste statistikprogrammer. Fortolkningen er ofte lige til og policy-relevant.
Ulempe: Mange gange svrt at argumentere for uafhngigheden af instrumentet med uobserverede led i udfaldsligningen. Litteraturen er ikke overstrget med eksempler p instrumenter.
39. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Regression Discontinuity Design
Er estimatoren i jeblikket i faglitteraturen
Id: Der eksisterer en gruppe af ikke-deltagere, som er tilstrkkelig lig deltagere bortset fra (ofte) n variabel, som reducerer deltagelsessandsynligheden deterministisk (eller fuzzy ) til nul
Eksempel: Hvis et trningsprogram kun er tilgngeligt for unge under 25, s i det mindste for ret, hvor programmet introduceres, vil der vre ikke-deltagere p 26, som mske er en god sammen-ligningsgruppe for de 25 rige (forudseenhed?).
Andet eksempel: Forbrydelse & Straf
40. www.akf.dk Dansk Evalueringsselskabs konference 2007
41. www.akf.dk Dansk Evalueringsselskabs konference 2007
42. www.akf.dk Dansk Evalueringsselskabs konference 2007 Interpretation: young criminals are either stupid (incorrect information set about punishment or simply irrational), extremely impatient (d way below 0.1), myopic, or all of the above
Interpretation: young criminals are either stupid (incorrect information set about punishment or simply irrational), extremely impatient (d way below 0.1), myopic, or all of the above
43. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Generel Ligevgtsmodeller
Fire typer af modeller:
Alle ovenstende antager problemet vk
Multiple ligningssystemer gammeldags og ikke klart hvordan kanalerne virker. Identifikation?
Magiske multiplikatorer. Sjldent funderet i noget (hvilket selvflgelig gr dem attraktive).
Direkte estimation / kalibrering af strukturel generel ligevgtsmodel Multiple ligningssystemer: svre at holde af, men kravet om tal kombineret med fravret af simple alternativer holder dem i spil. Husk Arrow og vejrudsigter under 2. verdenskrigMultiple ligningssystemer: svre at holde af, men kravet om tal kombineret med fravret af simple alternativer holder dem i spil. Husk Arrow og vejrudsigter under 2. verdenskrig
44. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Strukturel GE-model: SSP i Canada.
SSP meget lig det danske Ret og Pligt til lntilskud for langtidsledige
Stor succes i tidlige 1990ere som eksperimentelt forsg
Mlgruppe: Langtidsledige enlige forldre p kontanthjlp
Foranstaltning: Betinget p fuldtidsbeskftigelse (min 30 t/u) fik man halvdelen af forskellen mellem $3,000 og lnindkomsten pr mned i op til tre r
Eksempel: Mor p kontanthjlp fr $ 712 pr mned. 30 t/u til $ 5.00 = $650. Modregnes fuldt ud I kontanthjlpen. Men under SSP 0.5*(3,000-650) = $1,175 $712 vs. $1,825
Result: Imponerende ATET effekter p beskftigelsen og ssh for kontanthjlpsmodtagelse. Kortsigtseffekt p14 procent points. (En af) de strste effekter mlt ved eksperimentelle evalueringslitteratur
Men kun 7 % efter 1 r
45. www.akf.dk Dansk Evalueringsselskabs konference 2007
46. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Strukturel GE-model: SSP i Canada
Kombination af randomisering flere steder i processen samt kon-struktionen af en GE-model muliggjorde komplet evaluering:
Ingen samlet effekt p beskftigelsen: Dagpengemodtagere oplevede et fald i deres beskftigelseschancer - BDE ligevgtseffekt OG en reaktion p nye incitamenter
Et fald i lnniveauet:
Man er villig til at acceptere lavere ln som flge af tilskuddet
MEN blandt andre lnmodtagere steg lnnen en lille smule. Forhandlingsposition bedre for lnmodtagere!
RESULT: CBA konklusioner vendt p hovedet.
47. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Valg af estimator
Sociale eksperimenter mest overbevisende
Nr dette ikke er muligt, m en af de andre bruges.
Faglitteraturen er efterhnden fyldt med eksempler, hvor ikke-eksperimentelle estimatorer har vret anvendt p eksperimentelt data. En rkke forskellige scenarier at vlge imellem.
Tidligere var litteraturen i vidt omfang fokuseret p at finde den magiske kse der kunne sl panden ind p monstret selv-selektion Der er ingen slvkugle! Som gennemget, s hviler forskellige ikke-eksperimentelle evalueringsstrategier p forskellige antagelser om karakteren af selektionsprocessen og om tilrdighedvrende data. Nr disse antagelser holder s vil en given estimator producere konsistente estimater p bestemte interesse-parametre. Nr antagelserne ikke er overholdt vil den ikke!
S i stedet for at lede efter en bestemt estimator, der virker universelt, s lgger litteraturen i dag vgt p sammenhngen /mappingen mellem institutioner og data til rdighed i en given kontekst og valget af ikke-ekperimentel strategi. Nogen gange er data bare s ringe, at man ikke KAN gre noget. Der er ingen slvkugle! Som gennemget, s hviler forskellige ikke-eksperimentelle evalueringsstrategier p forskellige antagelser om karakteren af selektionsprocessen og om tilrdighedvrende data. Nr disse antagelser holder s vil en given estimator producere konsistente estimater p bestemte interesse-parametre. Nr antagelserne ikke er overholdt vil den ikke!
S i stedet for at lede efter en bestemt estimator, der virker universelt, s lgger litteraturen i dag vgt p sammenhngen /mappingen mellem institutioner og data til rdighed i en given kontekst og valget af ikke-ekperimentel strategi. Nogen gange er data bare s ringe, at man ikke KAN gre noget.
48. www.akf.dk Dansk Evalueringsselskabs konference 2007 konometrisk Teori Valg af estimator
benbare bemrkninger
Hvis man lner sig op ad selektion p observerbare karakteristika, s skal data vre rigt! Sammenlign individer fra samme arbejdsmarked, brug samme ml for udfaldsvariablen, brug information om dynamikken i selektionsprocessen.
F forstelse for institutionerne bag selektionen!
Hvis man bruger IV, s skal man have et instrument!
Hvis man bruger paneldata metoder, s skal man have data i et panel!
49. www.akf.dk Dansk Evalueringsselskabs konference 2007 Alternativer til konometrisk Evaluering Deltageres selvevaluering eller oplevet udbytte
sprge / interviewe deltagere eller sagsbehandlere direkte om, efter endt deltagelse, programmet havde nogle gavnlige effekter og i bekrftende fald, hvor store disse s var?
Dette ville spare folk med ansvar for evalueringerne masser af tid, penge, og indsats, hvis deltagere eller deres sagsbehandlere p trovrdig vis kunne evaluere et program direkte.
50. www.akf.dk Dansk Evalueringsselskabs konference 2007 Alternativer til konometrisk Evaluering Deltageres selvevaluering eller oplevet udbytte
Ringe evidens for at dette.
For at vre valide og brugbare, m respondenterne vre i stand til korrekt at estimere kontrafaktum hvordan det ville vre get hvis ikke de havde deltaget i interventionen og s foretage en meningsfyldt sammenligning med det faktiske udfald.
kognitive begrnsninger af betydning (de fleste af os er drlige intuitive statistikere)
problemer af survey-mssig karakter (den adspurgte nsker mske ikke at fornrme udsprgeren ved at tilkendegive, at indsatsen var virkningsls, eller mske oven i kbet indrmme over for sig selv, at deltagelsen havde vret spild af tid og ressourcer?).
51. www.akf.dk Dansk Evalueringsselskabs konference 2007 Alternativer til konometrisk Evaluering Deltageres selvevaluering eller oplevet udbytte
Dette er selvflgelig ikke det samme, som at der ikke kan udtrkkes nyttig information fra interviews med involverede aktrer
rsager til deltagelsen
forventningerne til denne
mulige bureaukratiske og administrative hindringer, der besvrliggr deltagelsen
etc.
52. www.akf.dk Dansk Evalueringsselskabs konference 2007 Alternativer til konometrisk Evaluering Performance Standarder
Reinventing Government
potentielt billigt vrktj til effekt analyser.
Bestr typisk af en rkke kvantitative ml for en indsats output (antallet af rettidigt servicerede klienter, fx) eller udfald (hvor mange af de servicerede klienter havde fundet job seks mneder efter endt deltagelse).
Disse ml er som regel en funktion af Y1
Udbredt i offentlige administration.
53. www.akf.dk Dansk Evalueringsselskabs konference 2007 Alternativer til konometrisk Evaluering Performance Standarder
Nogle gange fortller de alt, hvad man har behov for at vide: Er det opgaven at evaluere om en given socialrdgiverafdeling har kontakt med sine klienter minimum n gang pr tredje mned, s vil et ml, der angiver andelen af klienterne, som kontaktes minimum hver tredje mned give (hvis ikke andet s) et skn p om forskrifter overholdes.
Hvis sagsbehandleres indsats alene bestr af et output (en samtale) og ikke en effekt, s er ml for output et tilstrkkeligt styringsredskab. Selvflgelig vil samtalen have adfrdsmssige effekter p klienten, som interesserer forskere og andre. Sdanne effekter fanges ingenlunde af performance standarder baseret p hverken outcome eller output.
54. www.akf.dk Dansk Evalueringsselskabs konference 2007 Hvornr skal man ikke evaluere? Evalueringer tager tid og ressourcer.
Evalueringer, lige som de programmer der evalueres, br derfor kun foretages, nr fordelen ved sdanne har mulighed for at overstige deres omkostninger!
I en rkke situationer vil en evaluering ikke kunne passere et standard cost-benefit test, hvorfor pengene, der ville have vret brugt p en evaluering heller br bruges p andre ting.
55. www.akf.dk Dansk Evalueringsselskabs konference 2007 Hvornr skal man ikke evaluere? Hvis midlerne er sm og andre basale administrative funktioner ikke er p plads
Fr man foretager en evaluering br program administratorer have en klar id om hvem der deltager, om deltagerne over-hovedet har ret til dette? Og hvis deltagelse er frivilligt, hvordan ser deltagerne s ud ift. mulige deltagere?
Man br ogs have et klart billede af hvor mange penge, der bruges p programmet, hvad disse bliver brugt p, og hvilke enheder, som pengene bliver brugt p. Indsamling og undersgelse af disse informationer br vre et krav til program managere, som optrder som bestyrere af skatteydernes midler
Disse pligter br vre overholdt inden man kaster sig ud i en evaluering; Et program der er ikke er under kontrol mht. hvem der deltager og hvad det koster har ikke mange chancer for at producere positive effekter
56. www.akf.dk Dansk Evalueringsselskabs konference 2007 Hvornr skal man ikke evaluere? Hvis effekten af et program er kendt p forhnd:
Mske eksisterer der allerede masser af evalueringer af hj kvalitet af en bestemt type program?
Hvis programmet alene eksisterer for at transferere penge til politisk begunstigede individer, firmaer eller interessegrupper og hvor konomisk udvikling bare bruges til at retfrdiggre dette over for en ligegyldig offentlighed og ubehjlpsomme medier
Hvis antallet af deltagere er utilstrkkeligt til statistisk inferens:
Et program, der servicerer 20 skoler, fem virksomheder eller 35 ledige kan ikke effektevalueres Subsidier eller andre former for begunstigelser til bestemte virksomheder, man gerne vil have placerer sig i ens nromrde er et eksempel p det sidste. Set fra et nationalt synspunkt kan sdanne programmer allerhjest have nul effekt, og i det omfang at det medvirker til geografisk fejlallokering af produktion kan det ligefremt vre skadeligt.Subsidier eller andre former for begunstigelser til bestemte virksomheder, man gerne vil have placerer sig i ens nromrde er et eksempel p det sidste. Set fra et nationalt synspunkt kan sdanne programmer allerhjest have nul effekt, og i det omfang at det medvirker til geografisk fejlallokering af produktion kan det ligefremt vre skadeligt.
57. www.akf.dk Dansk Evalueringsselskabs konference 2007 Hvornr skal man ikke evaluere? Hvis data ikke er til stede eller er dyrt at indsamle:
Mange ret dyre evalueringer af strre offentlige programmer hviler ofte p survey data med chokerende lave svarprocenter
Der eksisterer en nedre grnse for datakvalitet, hvorunder evalueringer bliver meningslse!
Hvis man ikke er i besiddelse af tilstrkkelig ekspertise til at foretage evalueringerne
Isr ikke, hvis der allerede eksisterer studier p omrdet
Svagt udfrte evalueringer er ikke pengene (ingen penge) vrd
Quick & Dirty er GIGO
58. www.akf.dk Dansk Evalueringsselskabs konference 2007 Valg af Evaluator Ikke beskyttet titel!
Eksperimenter er svrere end man tror. Hvis man ptnker at udfre et og man ikke har prvet det fr, s f fat i et firma, der ved hvordan det skal gres.
Forskellige evalueringseksperter har forskellige ekspertiser skal matches med ens behov.
Nogle skaldte eksperter vil gladelig tage imod pengene fra en vunden opgave og aflevere noget rent ud sagt makvrk. Se Gregory (2000) i Evaluation.
Nogen gange kan man f foretaget den statistiske analyse af en evaluering nsten gratis, hvis bare man stiller interessant data til rdighed for forskere og garanterer, at disse m trykkes i videnskabelige tidsskrifter Professionelle firmaer er selvflgelig dyrest men har ogs masser af erfaring og leverer et velpoleret produkt til tiden og til lovede pris. Akademikere er ofte billigere, har ofte bedre kendskab til statistik og konometri men har en lavere sandsynlighed for at aflevere produktet til tiden og det endelige produkt er ogs mindre velpudset.Professionelle firmaer er selvflgelig dyrest men har ogs masser af erfaring og leverer et velpoleret produkt til tiden og til lovede pris. Akademikere er ofte billigere, har ofte bedre kendskab til statistik og konometri men har en lavere sandsynlighed for at aflevere produktet til tiden og det endelige produkt er ogs mindre velpudset.
59. www.akf.dk Dansk Evalueringsselskabs konference 2007 Valg af Evaluator Evalueringer br ogs evalueres. Mske sidder man ikke inhouse med den tilstrkkelige viden til at vurdere kvaliteten af en rapport.
Ekstern kvalitetskontrol kan vre en stor gevinst for evalueringens kvalitet og trovrdighed.
60. www.akf.dk Dansk Evalueringsselskabs konference 2007 Konklusion RTFM: Ls litteraturen. Store fremskridt i de sidste to rtier. Bde mht. metode og praksis; dataindsamling, vrdien af administrative data og smarte identifikationsstrategier
Der er ingen magic bullet: Der eksisterer ingen konometrisk eller statistisk strategi/estimator, der altid vil give konsistente estimater for vilkrlige kombinationer af data, institutionelle rammer og parametre, man mtte vre interesseret i.
Heterogene effekter betyder noget! De pvirker valget og fortolkningen af ens empiriske estimater. Tilstedevrelsen af disse forudstter grundige overvejelser omkring den prcise parameter, som vil kunne svare p et specifikt sprgsml.
Ligevgtseffekter betyder noget. Anbefalinger, der ikke tager hjde for sdanne risikerer at gre mere skade end gavn.
Ikke alle programmer kan med fordel evalueres. Overvej dette og foretag en uformel cost-benefit analyse inden selve evalueringen pbegyndes