נתוני פנל: השפעות רנדומאליות (Random Effects)

נתוני פנל: השפעות רנדומאליות(Random Effects) yit = b0 + b1xit1 + . . .+ bkxitk + ai+ uit

מודלים עם השפעות רנדומאליות • תזכרו כי מטרת האמידה בשיטתFE (אוFDבאותו אופן) הייתה להיפטר מ-aiמכיוון שאנו חושדים שהוא מתואם עם אחד או יותר מה-xitj-ים • נניח שכעת אנו חושבים ש-aiאינו מתואם עם אף אחד מהמשתנים המסבירים באף תקופת הניתוח. במקרה הנ"ל ביצוע טרנספורמציה לשם סילוק ה-aiמהמודל גורם לקבלת אומדנים לא יעילים.

מודלים מסוגRE • תחשבו על הדוגמא הבאה של אמידת התשואה על השכלה • נניח אנו יודעים רמת השכלה ומספר שנות לימוד של שני פרטים בשתי נקודות זמן

מודלים מסוגRE • התצפיות שלנו הן זוגות(A, C) בתקופה הראשונה ו-(B, D) בתקופה השנייה. • בתסריט המוצג בגרף לפרטIיש יותר "יכולת" והכנסתו גבוהה מהכנסתו של פרטII, ללא תלות ברמת ההשכלה. • זוהי השפעה לא נצפית של הפרט

מודלים מסוגRE • בניסיון לאמוד את הקשר בין רמת ההשכלה לבין רמת ההכנסה, שני סוגים של אינפורמציה כלולים בנתונים האלה: • אם אנו משווים בין הנקודותAו-Bאו בין הנקודותCו-D, אזי אנו מסתכלים על תשואה להשכלה עבור אותו פרט, לאחר שרמת השכלתו עלתה. ההפרש בהכנסה במקרה כזה נובע משינוי ברמת ההשכלה. השוואה מסוג זה מספקת לנו מידע על אותו פרט - “within” information. ברור שנרצה להשתמש בכל המידע הזה. • אם אנו משווים בין כל אחד מזוג התצפיות ((A,C), (B,C), (A,D) או (B,D)), אזי אנו משווים הפרשים בהכנסות של שני הפרטים בעלי רמת השכלה שונה. ההפרש בהכנסה מוסבר חלקית על ידי הבדל בהשכלה, אולם חלק מההסבר טמון ביכולת של כל פרט. השוואות כאלה נותנות לנו מידע שנקרא“between” information. חלק מהמידע הזה חשוב, אולם לא כולו, מכיוון שחלק מההשתנות נובעת מהשפעה אינדיווידואלית של הפרט.

מודלים מסוגRE • באופן כללי, נרצה להשתמש בכל ההשתנות בתוך יחידת תצפית (within-unit variation), אולם לא בכל ההשתנות בין יחידות התצפית (between unit variation) • חלק מההשתנות בין יחידות התצפית יכול לנבוע מקיום השפעות אינדיווידואליות, שיכולות לגרום להטיה באמידה, במידה והנן מתואמות עםX. • אומדן שמתקבל באמידה עם השפעות קבועות למעשה זורק את כל ההשתנות בין יחידות התצפית ומנצל את ההשתנות בתוך יחידת התצפית בלבד. • עם זאת, שימוש בחלק מההשתנות בין יחידות התצפית יכול לתת יתרון ולשפר יעילות האמידה. • אומדן שמתקבל באמידה עם השפעות רנדומאליות למעשה מנצל "קומבינציה אופטימלית" של השתנות בתוך ובין יחידות התצפית.

ערכי התחזית מחוץ למדגםOut-of-Sample Predictions • תחשבו על מודל עם השפעות קבועות • yit = β’xit + ai + uit • איך אנו יוצרים ערכים חזויים מתוך המודל הזה? במידה ואנו חייבים לנבא ערךyitעבור יחידת תצפית כלשהיiשכבר נמצאת במדגם, אזי אין שום בעיה: פשוט תציבו אומדנים שקיבלתםâiו-β^ • אבל מה יקרה אם תרצו ליישם את המודל הנאמד על תצפיות אחרות, מחוץ למדגם? • באיזה ערך של ההשפעה הקבועהâiתבחרו להשתמש במקרה כזה?

ערכי התחזית מחוץ למדגם • המודל עם השפעות קבועות אומד את הפרמטריםβמותנה בקיום השפעות אינדיווידואליות. • אולם אנו יכולים לנסות לקבל אומדנים לא מותנים. דרישה זו יוצרת מודל עם השפעות רנדומאליות. • בואו ננסח את המודל מחדש בצורה הבאה: • yit = β0+ β’xit + ai + uit • כרגע יש לנוKמשתנים מסבירים חדשים בנוסף לקבוע. המרכיבaiהנו הפרעה מקרית המאפיינת את התצפית ה-i-ית והנו קבוע

מודלים מסוגRE(המשך) • אנו קוראים למודל הזה בשם מודל של השפעות קבועות כשאנו מניחים שההשפעה הבלתי נצפית, aiאינה מתואמת עם אף אחד מהמשתנים המסבירים: • Cov(xitj,ai) = 0עבורt =1,2,…T; ,j = 1,2,..k • בהינתן הנחה חדשה זו, איך נוכל לקבל אומדנים עקיבים של ה-βj? • נוכל להשתמש ב-pooled OLS: פשוט תריצוOLSשלyitעל כל המשתנים המסבירים ומשתני דמי לתקופות. כך תקבלו אומדנים עקיבים עבורβj–ות תחת הנחת ההשפעות הרנדומאליות, אולם שיטה זה תתעלם מהתכונה העיקרית של המודל.

מודלים מסוגRE(המשך) • תגדירו את הטעות המרוכבת כ: • vit = ai + uit • תכתבו את המודל בצורה הבאה: • yit = β0+ β1xit1 + …+ βkxitk + vit • מכיוון ש-aiמופיע כחלק מהטעות המרוכבת בכל תקופת זמן, בין הטעויות,vit, תהיה קורלציה סדרתית על פני זמן. למעשה, תחת הנחות של מודלREנקבל: • Corr(vit,vis) = σ2a /(σ2a + σ2u ), t ≠ s

מודלים מסוגRE(המשך) • מכיוון שאמידה בשיטתpooled OLS מתעלמת מקיום קורלציה סדרתית חיובית בטעויות, האומדנים לא יהיה נכונים, וכמו כן הסטטיסטיים הרגילים לבדיקת השערות. • לפניכן הראנו איך ניתן להשתמש בשיטת האמידהGLSלפתרון בעיית קורלציה סדרתית (תזכרו פעולת ה-quasi-differencing). נוכל להשתמש באותו רעיון גם כאן.

מודלים מסוגRE(המשך) • ביצוע טרנספורמציהGLSשפותרת בעיית קורלציה סדרתית דורשת אלגברה מטריציונית מסובכת, אולם הטרנספורמציה עצמה היא פשוטה: • מקף עליון מסמל ממוצעים על פני זמן. הרגרסיה המוצגת מטה משתמשת בנתונים מהסוגquasi-demeaned data

מודלים מסוגRE(המשך) • טרנספורמציהREמחסירה חלק מהממוצע הזה, כאשר אותו חלק מוחסר תלוי ב-σa2, σu2ובמספר התקופות ,T • שימו לב שהטרנספורמציה מאפשרת הכללת משתנים מסבירים שאינם משתנים על פני זמן (בשונה מ-FDו-FE) – זהו אחד היתרונות שלREבהשוואה ל-FDאוFE. • המשמעות היא שבמשוואת השכר נוכל לכלול משתנה מסביר כמו השכלה שלא משתנה על פני זמן. • אולם, במקרה כזה אנו מניחים שהשכלה אינה מתואמת עםaiשמבטא יכולת ורקע משפחתי. • ביישומים רבים הרעיון העיקרי של השימוש בנתוני פנל הוא לאפשר קורלציה בין הגורמים הבלתי נצפים לבין המשתנים המסבירים.

מודלים מסוגRE(המשך) • אםl = 1, אזי נקבל אומדן של השפעות קבועות • אםl = 0, אזי נקבל אומדן שלOLS • ובכן, ככל שהשונות של ההשפעה הבלתי נצפית גדולה יותר, נקבל אומדן קרוב יותר ל-FE • ככל שהשונות של ההשפעה הבלתי נצפית קטנה יותר, נקבל אומדן קרוב יותר ל-OLS • ככל ש-Tגדל, נקבל אומדנים קרובים יותר ל-FEוכךREו-FEיהיו דומים

מודלים מסוגRE(המשך) • איננו צופיםλ, אולם נוכל להשתמש באומדן,λ^ • נוכל להעמיק את התובנה של איכויות יחסיות של שיטתFEלעומתREכשנכתוב את הטעותquasi-demeaned error בצורה: • vit –λvi = (1- λ)ai + uit–λuiכאשר _ מייצג ממוצעים על פני זמן • משקל של השפעות בלתי נצפות הנו(1- λ) • קורלציה ביןaiואחד או יותר מה-xit-ים גורמת לחוסר עקיבות באמידתRE, אולם הקורלציה הנ"ל נחלשת בהתאם למכפיל (1- λ). ככל ש-λ1, אלמנט ההטיה שואף לאפס ואומדןREנוטה להתקרב לאומדןFE. כאשר λקרובה לאפסאנו משאירים חלק גדול יותר של ההשפעה הבלתי נצפית בתוך הטעות, וכתוצאה מכך, ההטיה האסימפטוטית של אומדןREתהיה גדולה יותר. • Stata, דוגמא 21-1

בחירה ביןFEו-RE • השפעות קבועות,FE • יתרונות • המודל תקף תחת הנחות כלליות מאוד. אנו מאפשרים קיום קורלציה בין המשתנים המסבירים לבין ההשפעות האינדיווידואליות, אולם איננו חייבים להגדיר צורה ספציפית של הקורלציה. זהו היתרון הגדול • חסרונות • במידה והמשתנים המסבירים אינם מתואמים עם ההשפעות האינדיווידואליות, אנו מאבדים הרבה דרגות חופש. האומדן שמתקבל אינו יעיל. • האומדנים תלויים בבחירת המדגם: ההתייחסות ל-ai-ים היא כאל קבועים וניתנים לאמידה. איננו יכולים להשתמש במודל כדי לבנות תחזיות עבור התצפיות שמחוץ למדגם.

בחירה ביןFEו-RE • חסרונות (המשך) • איננו יכולים לזהות פרמטרים של אף משתנה מסביר שאינו משתנה על פני זמן. השפעת כל הגורמים האלה מגולמת בהשפעת הגורמים האינדיווידואליים. יתר על כן, המקדמים הנאמדים של המשתנים המסבירים שאין בהם השתנות מספקת, בדרך כלל אינם מדויקים. • העובדה כיβFEהנם עקיבים (אפילו עבורTקטן) הנה תכונה ספציפית מאוד של המודל הליניארי: במודלים הלא ליניאריים התואם לאומדןwithin estimator לא יהיה עקיב.

בחירה ביןFEו-RE • השפעות רנדומאליות,RE • יתרונות • אומדן יעיל יותר בהשוואה לאומדן השפעות קבועות, אולם מסתמך על הנחה של חוסר קורלציה בין ההשפעות האינדיווידואליות לבין המשתנים המסבירים. • יכולת לבנות ערכים חזויים לתצפיות מחוץ למדגם. • אותו הגיון ניתן ליישם במודלים לא ליניאריים. • חסרונות • ההנחה עלcorr(ai,xit)הנה חזקה מאוד. אם ההנחה הנ"ל אינה מתקיימת, האומדנים שנקבל יהיו לא עקיבים. • σu²ו-σa²הנן בלתי נצפות, לכן נצטרך להשתמש באמידתFGLSאו ML. זה יכול להיות קשה לביצוע.

בחירה ביןFEו-RE • באופן כללי, תנו למודלים התיאורטיים לנווט וכך תחליטו איזה מודל טוב יותר • מבחינה מעשית, מכיוון שלעיתים קשה באמת להניח כיaiאינו מתואם עם כל ה-xit-ים, שיטתFEיכולה להוות בחירה מועדפת • התוצאה של אמידה בשיטתFEכשאתם צריכים להפעילREהוא אובדן היעילות • התוצאה של אמידה בשיטתREכשאתם צריכים להפעילFEהוא אובדן העקיבות • ובכן, הבחירה ה"בטוחה" יותר היאFE וכאשרTגדול מספיק, יתקייםRE  FE

מבחן Hausman • השערת האפס:corr(ai,xit) =0 • REעקיב ויעיל,FEעקיב ולא יעיל • השערה אלטרנטיבית:corr(ai,xit) ≠0 • REלא עקיב,FEעקיב • הרעיון מאחורי מבחןHausman: הבדל בין השונות המשותפת של אומדן יעיל ואומדן לא יעיל שווה לאפס

מבחן Hausman • הבדל מובהק סטטיסטית מקבל פירוש כעדות נגד הנחת השפעות רנדומאליות • עקב כך, נוכל ליישם מבחןHausmanעל ידי: • הסטטיסטי של המבחן מתפלגχ² עם Kדרגות חופש (המימד שלβ)

מבחן Hausman • בנוסף, לעיתים קל יותר להשתמש בגרסת מבחןHausmanהמבוססת על רגרסיה. • דרך אחת פשוטה לבצע מבחן כזה היא להוסיף ממוצעים על פני זמן לכל המשתנים המסבירים, חוץ ממשתני דמי, ולאחר מכן לאמוד את המשוואה בשיטת השפעות רנדומאליותRE. כלומר, לאמוד את המשוואה • כאשרxitכולל חותך כללי של המודל יחד עם כל משתני הדמי לתקופות, וכמו כן אתwit, משתנים מסבירים שמשתנים על פניiו-t

מבחן Hausman • נוכל לאמוד את המשוואה הנ"ל בשיטת השפעות רנדומאליות ולאחר מכן לבדוק השערה H0:γ= 0 • במידה ונדחה את השערת האפס, נדחה את השערת הקיום של הנחות של המודל עם השפעות רנדומאליות • Stata, דוגמא21-2

נתוני פנל: השפעות רנדומאליות (Random Effects)