Download
slide1 n.
Skip this Video
Loading SlideShow in 5 Seconds..
Παλινδρόμηση με Βοηθητικές Μεταβλητές PowerPoint Presentation
Download Presentation
Παλινδρόμηση με Βοηθητικές Μεταβλητές

Παλινδρόμηση με Βοηθητικές Μεταβλητές

148 Views Download Presentation
Download Presentation

Παλινδρόμηση με Βοηθητικές Μεταβλητές

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. Παλινδρόμηση με Βοηθητικές Μεταβλητές • Υπάρχουν τρεις σημαντικές απειλές: • Η μεροληψία από την παράλειψη κάποιας μεταβλητής που συσχετίζεται με το X και η οποία δεν είναι παρατηρήσιμη, και, ως εκ τούτου, δεν μπορεί να συμπεριληφθεί στην παλινδρόμηση. • Η μεροληψία αμφίδρομης αιτιότητας (το X αιτιάζει τοY και το Y αιτιάζει το X). • Η μεροληψία σφάλματος στις μεταβλητές (το X μετράται με κάποιο σφάλμα). • Η παλινδρόμηση με βοηθητικές μεταβλητές μπορεί να εξαλείψει και τις τρεις αυτές μορφές μεροληψίας.

  2. Ορολογία: ενδογένεια και εξωγένεια Ενδογενής ονομάζεται μία μεταβλητή που συσχετίζεται με το διαταρακτικό όρο του υποδείγματος u. Εξωγενής ονομάζεται μία μεταβλητή που δε συσχετίζεται με το u. Παρατήρηση:«Ενδογενής μεταβλητή» είναι μία μεταβλητήπου «προσδιορίζεται μέσα στο σύστημα», ή, με άλλα λόγια, προσδιορίζεται από κοινού με την Y, δηλαδή μία μεταβλητή που υπόκειται σε αμφίδρομη αιτιότητα. Ο ορισμός, όμως, αυτός δεν είναι αρκετά ευρύς: η παλινδρόμηση με βοηθητικές μεταβλητές δε χρησιμοποιείται μόνο για τη διερεύνηση υποδειγμάτων που εμφανίζουν μεροληψία αμφίδρομης αιτιότητας, αλλά και υποδειγμάτων με μεροληψία σφάλματος στις μεταβλητές ή με μεροληψία από παραλειπόμενες μεταβλητές.

  3. Ο Εκτιμητής Βοηθητικών Μεταβλητών (IV Εκτιμητής) με μία Ερμηνευτική και μία Βοηθητική Μεταβλητή Yi = 0 + 1Xi + ui • Η παλινδρόμηση με βοηθητικές μεταβλητές χωρίζει τοX σε δύο μέρη: • σε ένα μέρος που ενδέχεται να συσχετίζεται με το διαταρακτικό όρο u • σε ένα δεύτερο που δε συσχετίζεται με τοu. Απομονώνοντας το μέρος εκείνο που δε συσχετίζεται με τοu, μπορούμε να εκτιμήσουμε το 1. • Αυτό επιτυγχάνεται με την εισαγωγή μιας βοηθητικής μεταβλητής, έστωZi, η οποία δε συσχετίζεται με τοui. • Η Zi ανιχνεύει κινήσεις στο Xi που δε συσχετίζονται με το ui και τις χρησιμοποιεί για να εκτιμήσει το 1.

  4. Δύο συνθήκες για να είναι έγκυρη η βοηθητική μεταβλητή Yi = 0 + 1Xi + ui • Για να είναι μια βοηθητική μεταβλητή Zέγκυρη, θα πρέπει να ισχύουν οι εξής δύο συνθήκες: • Συνθήκη Συσχέτισης: • Συνθήκη Εξωγένειας: Υποθέτουμε για την παρούσα ανάλυση ότι έχουμε μια βοηθητική μεταβλητήZi που πληρεί τις συνθήκες αυτές (θα ασχοληθούμε παρακάτω με το πώς βρίσκουμε μια τέτοια μεταβλητή). Πώς μπορούμε να χρησιμοποιήσουμε τη Zi, για να εκτιμήσουμε το συντελεστή 1;

  5. ο συντελεστής συσχέτισης παίρνει τιμές στο διάστημα [-1,1], δηλαδή: • αν corr(X,Z) = 1, τότε υπάρχει τέλεια θετική γραμμική συσχέτιση μεταξύ του Χ και του Ζ. • αν corr(X,Z) = -1, τότε υπάρχει τέλεια αρνητική γραμμική συσχέτιση μεταξύ του Χ και του Ζ. • αν corr(X,Z) = 0,τότε δεν υπάρχει γραμμική σχέση μεταξύ Χ και Ζ.

  6. Ο IV εκτιμητής, η μεταβλητή X και η μεταβλητή Z • Η Μέθοδος των Ελαχίστων Τετραγώνων σε Δύο Στάδια (TSLS):Όπως δηλώνει και η ονομασία της, η TSLS έχει δύο στάδια και, άρα, δύο παλινδρομήσεις: • (α) Στο Στάδιο 1, απομονώνεται το μέρος εκείνο της μεταβλητήςX που δε συσχετίζεται με τοu: παλινδρομούμε το X στο Z χρησιμοποιώντας την OLS: • Xi = 0 + 1Zi + v(1) • Επειδή το Zi είναι ασυσχέτιστο με τοui, η παράσταση 0 + 1Zi είναι και αυτή ασυσχέτιστη με το ui. Αν και δε γνωρίζουμε τις πραγματικές τιμές των 0 και 1, έχουμε, όμως, τις εκτιμήσεις τους, οπότε… • Υπολογίζουμε τις εκτιμημένες τιμές του Xi, δηλαδή το όπου =i = 1,…,n.

  7. (β) Στο Στάδιο 2, αντικαθιστούμε το Xi με τοκαι παλινδρομούμε το Y στοχρησιμοποιώντας την OLS: Yi = 0 + 1 + ui(2) • Επειδή το είναι ασυσχέτιστο με το ui για μεγάλα δείγματα, η 1η Υπόθεση Ελαχίστων Τετραγώνων ισχύει. • Συνεπώς, το 1 μπορεί να εκτιμηθεί με OLS χρησιμοποιώντας το υπόδειγμα παλινδρόμησης (2). • Ο εκτιμητής που προκύπτει ονομάζεται «εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια» ή TSLS εκτιμητής,

  8. Notes: 1η Υπόθεση Ελαχίστων Τετραγώνων:E(u|X = x) = 0.Δεδομένου του Χ ο μέσος του u είναι μηδέν.

  9. Η Μέθοδος των Ελαχίστων Τετραγώνων σε Δύο Στάδια (συνέχεια) Έστω ότι έχουμε μία έγκυρη βοηθητική μεταβλητή, Zi. Στάδιο 1: Παλινδρομώντας τοXi στο Zi, παίρνουμε τις προβλεπόμενες τιμές Στάδιο 2: Παλινδρομούμε το Yi στο : ο συντελεστής του, είναι ο TSLS εκτιμητής, Οπότε, οείναι ένας συνεπής εκτιμητής του 1.

  10. Ο IV εκτιμητής, η μεταβλητή X και η μεταβλητή Z (συνέχεια) Χρησιμοποιούμε λίγη (μόνο) άλγεβρα: Yi = 0 + 1Xi + ui Άρα, cov(Yi,Zi) = cov(0 + 1Xi + ui,Zi) cov(Yi,Zi)= cov(0,Zi) + cov(1Xi,Zi) + cov(ui,Zi) cov(Yi,Zi)=0 + cov(1Xi,Zi) + 0 cov(Yi,Zi)= 1cov(Xi,Zi) όπου cov(ui,Zi) = 0 (Συνθήκη Εξωγένειας) Άρα,

  11. Ο IV εκτιμητής, η μεταβλητή X και η μεταβλητή Z (συνέχεια) Ο IV Εκτιμητής αντικαθιστά τις συνδιακυμάνσεις αυτές του πληθυσμού με δειγματικές συνδιακυμάνσεις: sYZ και sXZ είναι οι δειγματικές συνδιακυμάνσεις.

  12. Συνέπεια του TSLS εκτιμητή Οι συνδιακυμάνσεις του δείγματος είναι συνεπείς: και Επομένως: Η συνθήκη συσχέτισης της βοηθητικής μεταβλητής εξασφαλίζει ότι δε διαιρούμε με το μηδέν.

  13. Παράδειγμα #1: Προσφορά και ζήτηση βουτύρου Η IV παλινδρόμηση αρχικά αναπτύχθηκε για να εκτιμήσει τις ελαστικότητες αγροτικών και κτηνοτροφικών προϊόντων ή παραγώγων τους, όπως, π.χ. του βουτύρου: • 1 = ελαστικότητα της τιμής του βουτύρου=ποσοστιαία μεταβολή της ποσότητας για μια μεταβολή της τιμής κατά 1%. • Στοιχεία: παρατηρήσεις της τιμής και της ποσότητας βουτύρου για διαφορετικά έτη. • Η OLS παλινδρόμηση τουστοεμφανίζει μεροληψία αμφίδρομης αιτιότητας (γιατί;)

  14. Η μεροληψία αμφίδρομης αιτιότητας κατά την παλινδρόμηση του στο οφείλεται στο ότι η τιμή και η ποσότητα καθορίζονται από την αλληλεπίδραση της ζήτησης και της προσφοράς.

  15. Η αλληλεξάρτηση αυτή μεταξύ ζήτησης και προσφοράς παράγει… Θα μπορούσε η καμπύλη ζήτησης να παραχθεί από μία παλινδρόμηση που θα χρησιμοποιούσε τα δεδομένα αυτά;

  16. Έστω ότι μετατοπίζαμε μόνο την καμπύλη προσφοράς. Τι θα παίρναμε, τότε; • Η μέθοδος TSLS εκτιμά την καμπύλη ζήτησης απομονώνοντας τις μεταβολές στην τιμή και την προσφορά που οφείλονται στις μετατοπίσεις της καμπύλης προσφοράς. • Η Z είναι μία μεταβλητή που μεταβάλλει την προσφορά, αλλά όχι τη ζήτηση.

  17. Η μέθοδος TSLS στο παράδειγμα προσφοράς και ζήτησης: • Έστω: Z = βροχόπτωση σε περιοχές όπου παράγονται γαλακτοκομικά προϊόντα. • Είναι το Z μια έγκυρη βοηθητική μεταβλητή; • Εξωγενής; • Λογικός συνειρμός: αν βρέχει ή όχι σε περιοχές • όπουπαράγονται γαλακτοκομικά προϊόντα, δεν • επηρεάζει τηζήτησή τους. • (2) Συσχετίζεται με την ερμηνευτική μεταβλητή που αντικαθιστά; • Λογικός συνειρμός:ανεπαρκής βροχόπτωση • συνεπάγεται λιγότερη βοσκή και, άρα, λιγότερο • βούτυρο.

  18. Η μέθοδος TSLS στο παράδειγμα προσφοράς και ζήτησης (συνέχεια) Zi = βροχήi = βροχόπτωση σε περιοχές όπου παράγονται γαλακτοκομικά προϊόντα. Στάδιο 1: παλινδρομούμε τοστο Ζ, και παίρνουμε τον εκτιμητή , ο οποίος απομονώνει τις μεταβολές που προκαλεί η προσφορά (ή μέρος αυτής) στο λογάριθμο της τιμής. Στάδιο 2: παλινδρομούμε το στο .

  19. Παράδειγμα #2: Βαθμοί εξετάσεων και μέγεθος τάξης • Οι παλινδρομήσεις με στοιχεία βαθμών εξετάσεων και μεγέθους τάξεων από την Καλιφόρνια, είναι πιθανό να εμφανίζουν μεροληψία από παραλειπόμενες μεταβλητές (π.χ. παράλειψη της γονικής συμβολής στις επιδόσεις των παιδιών τους). • Αυτού του είδους η μεροληψία θα μπορούσε να εξαλειφθεί αν χρησιμοποιούσαμε IV παλινδρόμηση (TSLS). • Η IVπαλινδρόμηση προϋποθέτει μια έγκυρη IVμεταβλητή, δηλαδή, μία μεταβλητή που να είναι: (1) Σχετική με την ερμηνευτική μεταβλητή που αντικαθιστά: (2) Εξωγενής:

  20. Παράδειγμα #2: Βαθμοί εξετάσεων και μέγεθος τάξης (συνέχεια) Έστω ότι η IV μεταβλητή που ζητάμε είναι: Σχολικές μονάδες σε περιοχές που έχουν πληγεί από σεισμό (τυχαίο φυσικό φαινόμενο) και στις οποίες έχει διπλασιαστεί το μέγεθος της κάθε τάξης αναγκαστικά, καθώς ορισμένες σχολικές αίθουσες δεν μπορούν να χρησιμοποιηθούν για διδασκαλία λόγω των ζημιών που υπέστησαν: Zi = σεισμόςi = 1 αν η περιοχή έχει πληγεί από σεισμό, = 0 διαφορετικά Ισχύουν οι δύο συνθήκες που προαναφέραμε, άρα η βοηθητική μεταβλητή που έχουμε υποθέσει να είναι έγκυρη;

  21. Η επίδραση της υπόθεσης του σεισμού στις υπό εξέταση σχολικές μονάδες, λειτουργεί, όπως ακριβώς, θα λειτουργούσε και ένα τυχαίο πείραμα. Κατά συνέπεια, η μεταβλητότητα των τιμών του ΛΜΔ που οφείλεται στο σεισμό είναι εξωγενής. • Στο στάδιο 1 της TSLS παλινδρομούμε το ΛΜΔ στο σεισμό, απομονώνοντας έτσι το μέρος εκείνο του ΛΜΔ που είναι εξωγενές (δηλαδή, το μέρος εκείνο που λειτουργεί «σαν» ένα τυχαία εφαρμοσμένο πείραμα). • Θα εξετάσουμε και άλλα παραδείγματα πιο κάτω…

  22. Επαγωγή με τη μέθοδο TSLS • Για μεγάλα δείγματα, η κατανομή δειγματοληψίας του TSLS εκτιμητή είναι η κανονική κατανομή. • Η στατιστική επαγωγή (έλεγχοι υποθέσεων, διαστήματα εμπιστοσύνης) ακολουθεί τη συνήθη διαδικασία, π.χ. • Η κανονική κατανομή του TSLS εκτιμητή για μεγάλα δείγματα βασίζεται στην ιδέα ότι διαθέτει τις προϋποθέσεις εκείνες που απαιτούνται για να μπορούμε να εφαρμόσουμε το Κεντρικό Οριακό Θεώρημα (ΚΟΘ).

  23. Αρχικά οπότε:

  24. Άρα: Αφαιρούμε το 1 και από τα δύο σκέλη της εξίσωσης και παίρνουμε,

  25. Πολλαπλασιάζουμε και τα δύο σκέλη με και επειδή κατά προσέγγιση ισχύει , παίρνουμε ότι: • Εξετάζουμε, πρώτα, τον αριθμητή: για μεγάλα δείγματα, τοκατανέμεται κανονικά:N(0,var[(Z–Z)u]).

  26. Στη συνέχεια, εξετάζουμε τον παρανομαστή: • από το Νόμο των Μεγάλων Αριθμών, όπου επειδή η συνθήκη συσχέτισης ισχύει εξ’ υποθέσεως. • Τι συμβαίνει αν δεν ισχύει η εν λόγω συνθήκη;(Περισσότερα για το θέμα αυτό παρακάτω)

  27. Συνδυάζοντας τα παραπάνω: Το κατανέμεται κανονικά:N(0,var[(Z–Z)u]) Τελικά, τοκατανέμεται κατά προσέγγιση κανονικά: όπουσ2 = 1/n {[var[(Zi - μZ)ui] / [cov (Zi, Xi)]}

  28. Επαγωγή με τη μέθοδο TSLS (συνέχεια) Τοκατανέμεται κατά προσέγγιση κανονικά: • Η στατιστική επαγωγή ακολουθεί τη συνήθη διαδικασία. • Η αιτιολόγηση βασίζεται (όπως συνήθως) στο ότι τα δείγματα είναι μεγάλα. • Όλη η προηγούμενη ανάλυση προϋποθέτει ότι οι βοηθητικές μεταβλητές είναι έγκυρες – θα συζητήσουμε τι ακριβώς συμβαίνει αν δεν είναι έγκυρες λίγο πιο κάτω.

  29. Σημαντική παρατήρηση αναφορικά με τα τυπικά σφάλματα: • Τα τυπικά σφάλματα που προκύπτουν από την παλινδρόμηση με OLS στο δεύτερο στάδιο της μεθόδου TSLS δεν είναι ορθά - δε λαμβάνουν υπόψη τους την εκτίμηση του πρώτου σταδίου (που εκτιμάται το ). • Χρειαζόμαστε, λοιπόν, μια ενιαία εξειδικευμένη εντολή που να υπολογίζει τον εκτιμητή, καθώς και τα ορθά τυπικά σφάλματα. • Ως είθισται, λοιπόν, χρησιμοποιούμε τα ετεροσκεδαστικά -εύρωστα τυπικά σφάλματα.

  30. Μια πλήρης παρέκκλιση από την βασική μας ανάλυση: Η ιστορία της IV παλινδρόμησης • Πόσα χρήματα θα συγκεντρώνονταν από την επιβολή ενός εισαγωγικού δασμού στα ζωικά και φυτικά έλαια (βούτυρο, έλαιο σόγιας, κ.λ.π.); • Ο υπολογισμός αυτός απαιτεί να γνωρίζουμε τις ελαστικότητες προσφοράς και ζήτησης, τόσο τις εγχώριες, όσο και των κρατών απ’ όπου εισάγονται τα τα έλαια. • Το πρόβλημα αυτό έλυσε πρώτος ο Wright το 1928 στο Παράρτημα Β του έργου του “TheTariffonAnimalandVegetableOils”.

  31. Διάγραμμα 4, σελ. 296, Παράρτημα Β (1928):

  32. Ποιος, όμως, έγραψε το Παράρτημα Β…; …το παράρτημα αυτό πιστεύεται ότι το έγραψε είτε ο ίδιος ο PhilipWright σε συνεργασία με το γιό του, SewallWright, που ήταν εξαίρετος στατιστικολόγος ή ο γιος του μόνος του. Ποιοι ήταν οι δύο αυτοί άντρες και ποια η ιστορία τους;

  33. Philip Wright (1861-1934) άσημος οικονομολόγος και ποιητής MA Harvard, Econ, 1887 Lecturer,Harvard,1913-1917 Sewall Wright (1889-1988) διάσημος γενετικός στατιστικολόγος ScD Harvard, Biology, 1915 Prof., U. Chicago, 1930-1954

  34. Παράδειγμα: Ζήτηση τσιγάρων • Πόσο θα μειωνόταν η κατανάλωση τσιγάρων από την επιβολή ενός (υποθετικού) φόρου; • Για να απαντήσουμε στο ερώτημα αυτό, χρειάζεται να γνωρίζουμε την ελαστικότητα της ζήτησης τσιγάρων, δηλαδή, το συντελεστή παλινδρόμησης 1. • Ο εκτιμητής OLS θα είναι αμερόληπτος; Εξηγήστε.

  35. Παράδειγμα: Ζήτηση τσιγάρων (συνέχεια) • Διαστρωματικά στοιχεία χρονολογικών σειρών (paneldata): • Ετήσια κατανάλωση τσιγάρων και μέσο ύψος τιμών (συμπεριλαμβανομένου του φόρου). • 48 πολιτείες των ΗΠΑ, 1985-1995. • Προτεινόμενη βοηθητική μεταβλητή: • Zi = γενικός φόρος επί των πωλήσεων ανά πακέτο στην πολιτεία i= SalesTaxi • Είναι τοZi μία έγκυρη βοηθητική μεταβλητή; • Συσχετίζεται με την ερμηνευτική μεταβλητή του υποδείγματος: ; • Είναι εξωγενής: corr(SalesTaxi,ui) = 0;

  36. Αρχικά, χρησιμοποιούμε στοιχεία μόνο για το έτος 1995. OLS παλινδρόμηση Στάδιο 1: Στάδιο 2: Συνδυασμένη παλινδρόμηση με ορθά, ετεροσκεδαστικά-εύρωστα τυπικά σφάλματα:

  37. STATA Παράδειγμα: Ζήτηση τσιγάρων Στάδιο 1:Βοηθητική Μεταβλητή = Z = rtaxso = γενικός φόρος επί των πωλήσεων ($/πακέτο)

  38. Στάδιο 2 • Οι συντελεστές αυτοί είναι οι TSLS εκτιμήσεις. • Τα τυπικά σφάλματα δεν είναι ορθά, καθώς αγνοούν την εκτίμηση του πρώτου σταδίου.

  39. Ενώνουμε τα δύο στάδια σε ένα:

  40. Ανακεφαλαίωση της IV Παλινδρόμησης με ένα Xκαι ένα Z • Μία έγκυρη βοηθητική μεταβλητή Zπρέπει να ικανοποιεί τις ακόλουθες δύο συνθήκες: • Συνθήκη συσχέτισης: • Συνθήκη εξωγένειας: • Η μέθοδος TSLS, ξεκινά με την παλινδρόμηση ανάμεσα στοX και στο Z που μας δίνει το και συνεχίζει με την παλινδρόμηση του Y στο . • Η βασική ιδέα είναι ότι στο πρώτο στάδιο της παλινδρόμησης απομονώνεται το μέρος εκείνο της μεταβλητότητας των τιμών της Xπου δε συσχετίζεται με το u. • Αν η βοηθητική μεταβλητή είναι έγκυρη, τότε η κατανομή δειγματοληψίας του εκτιμητή για μεγάλα δείγματα είναι η κανονική και, άρα, η στατιστική επαγωγή διενεργείται κατά το συνήθη τρόπο.

  41. Tο Γενικό Υπόδειγμα Βοηθητικών Μεταβλητών • Έως τώρα έχουμε εξετάσει την παλινδρόμηση με μία ενδογενή ερμηνευτική μεταβλητή (X) και μία βοηθητική μεταβλητή (Z). • Χρειάζεται αυτό να το επεκτείνουμε σε: • -πολλαπλές ενδογενείς ερμηνευτικέςμεταβλητές(X1,…,Xk). • -πολλαπλές συμπεριληφθείσες εξωγενείς μεταβλητές (W1,…,Wr). • -πολλαπλές βοηθητικές μεταβλητές (Z1,…,Zm). Περισσότερες (συσχετισμένες) βοηθητικές μεταβλητές μας δίνουν μικρότερη διακύμανση της TSLS: η τιμή του R2που προκύπτει από το πρώτο στάδιο αυξάνει, οπότε έχουμε μεγαλύτερη μεταβλητότητα των τιμών του

  42. Παράδειγμα: ζήτηση τσιγάρων • Ένας ακόμα προσδιοριστικός παράγοντας της ζήτησης είναι το εισόδημα, το οποίο αν παραλείψουμε να συμπεριλάβουμε στο υπόδειγμα μπορεί να προκαλέσει μεροληψία. • Η ζήτηση τσιγάρων με ένα X , ένα W και δύο βοηθητικές μεταβλητές(2 Z), έχει ως εξής: Z1i = γενικός φόρος επί των πωλήσεων στην πολιτεία i Z2i = φόρος επί των πωλήσεων τσιγάρων στην πολιτεία i Κάποια W είναι πιθανό να αναφέρονται σε παράγοντες που επηρεάζουν τη ζήτηση τσιγάρων και που εμφανίζονται σε κάθε μεμονωμένη πολιτεία και/ή σε χρονικούς παράγοντες (στην περίπτωσηδιαστρωματικών δεδομένων χρονολογικών σειρών).

  43. Το γενικό υπόδειγμα IV παλινδρόμησης: ορολογία και συμβολισμοί Yi = 0 + 1X1i + … + kXki + k+1W1i + … + k+rWri + ui • Το Yiείναι η εξαρτημένη μεταβλητή. • Τα X1i,…, Xkiείναι οι ενδογενείς ερμηνευτικές μεταβλητές (που ενδέχεται να συσχετίζονται με το διαταρακτικό όρο ui) • Τα W1i,…,Wriείναι εξωγενείς ερμηνευτικές μεταβλητές (που δε συσχετίζονται με το ui) • Τα 0, 1,…, k+rείναι οι άγνωστοι συντελεστές παλινδρόμησης • ΤαZ1i,…,Zmiείναι οι mβοηθητικές μεταβλητές (οιεξωγενείς μεταβλητέςπου δεν συμπεριλαμβάνονται στο υπόδειγμα).

  44. Το γενικό υπόδειγμα IV παλινδρόμησης (συνέχεια) Yi = 0 + 1X1i + … + kXki + k+1W1i + … + k+rWri + ui • Είναι απαραίτητο να εισάγουμε κάποιες καινούργιες έννοιες και να επεκτείνουμε άλλες που έχουμε ήδη αναφέρει: • Ορολογία: ταυτοποίηση και υπερταυτοποίηση. • Οι υποθέσεις στις οποίες στηρίζεται η κανονική κατανομή δειγματοληψίας της TSLS. • -Εγκυρότητα της βοηθητικής μεταβλητής (συσχέτιση • καιεξωγένεια). • -Υποθέσεις του γενικού υποδείγματος IV παλινδρόμησης.

  45. Ταυτοποίηση • Ταυτοποιημένη εξίσωση είναι αυτή που μπορούν να εκτιμηθούν όλοι οι παράμετροι της συνεπώς. • Στην IV παλινδρόμηση, η ταυτοποίηση ή μη των συντελεστών εξαρτάται από τη σχέση μεταξύ του πλήθους των βοηθητικών μεταβλητών (m) και του πλήθους των ενδογενών μεταβλητών (k). • Aν οι βοηθητικές μεταβλητές είναι λιγότερες από τις ενδογενείς ερμηνευτικές μεταβλητές, δεν μπορούμε να εκτιμήσουμε τα 1,…,k. • Για παράδειγμα, όταν k = 1 αλλά m = 0 (καμία βοηθητική μεταβλητή) τότε το αρχικό υπόδειγμα δεν μπορεί να εκτιμηθεί!

  46. Ταυτοποίηση (συνέχεια) • Οι συντελεστές 1,…,k: • Ταυτοποιούνται πλήρως αν m = k. • Yπερταυτοποιούνται αν m > k. • Υποταυτοποιούνται ανm < k. Στην περίπτωση αυτή, υπάρχουν τόσες ακριβώς βοηθητικές μεταβλητές, όσες απαιτούνται για να εκτιμήσουμε τα 1,…,k. Εδώ, υπάρχουν περισσότερες βοηθητικές μεταβλητές, απ’ όσες χρειάζονται για να εκτιμήσουμε τα 1,…,k.Στην περίπτωση αυτή, μπορούμε να ελέγξουμε αν οι βοηθητικές μεταβλητές είναι έγκυρες (έλεγχος των «υπερταυτοποιημένων μεταβλητών») – θα επιστρέψουμε σε αυτό παρακάτω. Έχουμε λιγότερες βοηθητικές μεταβλητές απ’ όσες χρειαζόμαστε για να εκτιμήσουμε τα 1,…,k. Χρειάζεται να πάρουμε κι άλλες βοηθητικές μεταβλητές!

  47. Το γενικό υπόδειγμα IVπαλινδρόμησης: TSLS, μία ενδογενής ερμηνευτική μεταβλητή Yi = 0 + 1X1i + 2W1i + … + 1+rWri + ui • Βοηθητικές μεταβλητές: Z1i,…,Zm. • Στάδιο 1: • Στάδιο 2: • Για να πάρουμε ορθά τυπικά σφάλματα, πρέπει η παραπάνω διαδικασία να γίνει σε ένα στάδιο και όχι σε δύο. -Παλινδρόμηση της X1 σε όλες τις εξωγενείς ερμηνευτικές μεταβλητέςW1,…,Wr,Z1,…,Zm με OLS. -Υπολογισμός των προβλεπόμενων τιμών , i = 1,…,n. -Παλινδρόμηση της Y στα ,W1,…,Wr με OLS. -Οι συντελεστές αυτού του σταδίου είναι οι TSLS εκτιμητές, αλλά τα τυπικά τους σφάλματα δεν είναι ορθά.

  48. Παράδειγμα: ζήτηση τσιγάρων Z1i = γενικός φόρος επί των πωλήσεων Z2i = φόρος επί των πωλήσεων τσιγάρων • Ενδογενής μεταβλητή: «ένα Χ». • Συμπεριληφθείσες στο υπόδειγμα εξωγενείς μεταβλητές ln(Incomei) «ένα W». • Βοηθητικές μεταβλητές: γενικός φόρος επί των πωλήσεων, φόρος επί των πωλήσεων τσιγάρων «δύο Ζ». • Τι συμβαίνει με την ελαστικότητα ζήτησης του 1: υπερταυτοποιείται, ταυτοποιείται ή υποταυτοποιείται

  49. Παράδειγμα: Ζήτηση τσιγάρων, μία βοηθητική μεταβλητή • Αν «τρέξουμε» την IV παλινδρόμηση σαν μία και μοναδική εντολή, παίρνουμε ορθά τυπικά σφάλματα.

  50. Παράδειγμα: Ζήτηση τσιγάρων, δύο βοηθητικές μεταβλητές