370 likes | 557 Vues
ГЕТЕРОСКЕДАСТИЧНОСТЬ. случайного члена. Нарушение 2-го условия Гаусса-Маркова: σ 2 u i = 2 = const для всех i . В случае ГСК: σ 2 u i = 2 i. Т. е. дисперсия случайного члена оказывается различной в разных наблюдениях.
E N D
ГЕТЕРОСКЕДАСТИЧНОСТЬ случайного члена
Нарушение 2-го условия Гаусса-Маркова: σ2ui = 2 = const для всех i. В случае ГСК: σ2ui= 2i.
Т. е. дисперсия случайного члена оказывается различной в разных наблюдениях. ГСК – неоднородность дисперсии случайного члена модели регрессии.
E(Y|X) = β1 + β2*X Есть гетероскедастичность
E(Y|X) = β1 + β2*X Есть гетероскедастичность
Наиболее часто ГСК встречается в случае использования в уравнении регрессии перекрестных данных.
ГСК становится проблемой, когда значения переменных значительно различаются в различных наблюдениях.
Пусть, например, EEi = + *GNPi + ui (*) где EEi– государственные расходы на образованиев i-й стране; GNPi – ВНП i-й страны.
В среднем государства тратят на образование где-то 6% от ВНП, т.е. 0,06. В то же время отклонения от этой нормы в ту или другую сторону для разных стран может быть от 1% до 3%. Но если для Уругвая, например, этот разброс вокруг среднего составит до 0,03*5,87 млрд. $ = 0,18 млрд $, то для США 0,03*2586,4 млрд.$ =77,6 млрд.$.
ГСК может встречаться в уравнениях регрессии, использующих временные ряды, если, например, при увеличении X и Y со временем, σ2uiтакже будет расти.
МНК-оценки коэффициентов регрессии, полученные по МНК, остаются несмещенными и состоятельными. • Оценки коэффициентов перестают быть наилучшими, т.е. наиболее эффективными. Можно указать другой метод, который будет давать более эффективные несмещенные, линейные оценки.
Полученные по МНК с.о. коэффициентов уравнения регрессии оказываются смещенными (чаще всего – заниженными). Поэтому t- и F–тесты становятся некорректными.
Чаще всего, t-статистики оказываются завышенными, а поэтому незначимые коэффициенты могут оказаться значимыми.
ГСК имеет множество разных форм. Конкретная ее форма в данном уравнении регрессии почти никогда неизвестна. Поэтому нет универсального, общепризнанного формального теста для обнаружения ГСК. Поэтому же большинство тестов на ГСК предполагают и обнаруживают только некоторую ее форму.
Часто предполагается, что σ2uiпропорциональны квадрату какой-то переменной (фактору пропорциональности - фп) Zi: σ2ui= 2i = 2*Z2i, для всех наблюдений i.
В качестве фп Z могут выступать : • одна из независимых переменных регрессии; • комбинация из нескольких регрессоров модели; • фактор (или комбинация факторов), не входящих в модель.
Графический метод выявления ГСК. Строится точечная диаграмма значений e2iили lne2iпо фактору пропорциональности Z. (e2iиспользуется как оценка для 2i = σ2ui. lne2i используется для уменьшения масштаба точечной диаграммы.)
Чаще всего точечная диаграмма значений e2i или lne2i строится по очереди по каждой из независимых переменных модели. Визуально по диаграмме пытаются определить наличие ГСК. При ГСК точки не будут идти «ровно» вдоль горизонтальной оси (оси OZ).
Тест Голдфелда-Квандта. Предположения теста: • σ2ui, т.е. 2i пропорциональна Z2i, где Z - какая-то переменная. • ui ~ N(0, 2i) и не подвержена автокорреляции.
Выполнение теста: • выборку упорядочивают по возрастанию Z; • упорядоченную выборку размера n делят на три части размеров n1, n2, n3 ( обычно n1= n3=3*n/8); среднюю часть далее не рассматривают; • оценивают уравнения регрессии (1) и (3) отдельно для 1-й и 3-й частей и получают соответствующие им RSS1и RSS3;
рассчитывают если RSS3>RSS1 или если RSS1>RSS3;
при уровне значимости αнаходят Fкр(n3-k; n1-k; α) (или Fкр(n1-k; n3-k; α)); • если Fстат >Fкр, гипотеза о гомоскедастичности отвергается при уровне значимости α, т. е. имеет место ГСК.
Пусть в модели Yi = 1+ 2*X2i + … + kXki + ui имеется ГСК, т.е. σ2ui= 2i и значения 2iнам известны. Тогда переходим к модели vi = ui / i .
В этой модели дисперсия случайного члена Дисперсия(vi) = Дисперсия(ui / i) = Дисперсия(ui )/ i2= 1 =const, т.е. проблема ГСК снята. Т.о., при известных 2i для преодоления ГСК мы вводим веса wi = 1/ i, «взвешиваем» переменные: Y/i = Yi*wi, X/ji = Xji*wi, вводим новую переменную q/i = 1/ i, и оцениваем модель без свободного члена:
Y/i =β1*q/i + 2*X/2i + … + k*X/ki + ui (*) Тогда в уравнении = b1*q/i + b2*X/2i + … + bk*X/ki (**) Оценки b1,…,bkсвободны от последствий ГСК, т.е. не только несмещенные, но и эффективные. Их с.о. также несмещенные.
Важное замечание. В уравнении (**) оценки b1,…,bk получены не по МНК, а по методу взвешенных наименьших квадратов (МВНК), который является частным случаем так называемого обобщенного МНК (ОМНК). При МВНК минимизируется взвешенная сумма квадратов
Второе важное замечание. В (*) наименьшие веса wi = 1/ i получают точки выборки, которые далеки от линии регрессии. И, наоборот, точки, близкие к этой линии получают наибольшие веса.
К сожалению, на практике значения 2i почти никогда неизвестны.
2) Случай, когда известен фактор пропорциональности Z. σ2ui = 2i = 2*Z2i, т.е. i= * Zi (а значит, Zi= i/ ). Вводят веса wi = 1/Ziи взвешивают обе части модели: Yi/Zi = 1/ Zi + 2*X2i / Zi + … + kXki / Zi + ui / i (***)
При этом Дисперсия(ui /Zi) = Дисперсия(ui /(i / )) =Дисперсия(ui )* 2/ 2i = 2=const, т.е. проблема ГСК снята. Т.о. в случае известного фп Z от исходной модели переходят к модели (***). Очень часто в качестве известного фп Z выступает какая-то из независимых переменных модели.
3) Оценки с.о. по методу Уайта. Сами оценки коэффициентов рассчитываются по МНК, а с.о. – по методу, который позволяет избежать их смещения. С такими с.о. можно работать, они корректны, с ними можно считать t-статистики и проводить t-тесты.
4) Существуют методы, относящиеся к МВНК, в которых устраняются ГСК вида: 2i = 0 + 1*Z1i +…+ p*Zpi + vi. где Z1,…,Zp- известные переменные, 0,…,p - параметры, vi - удовлетворяет условиям Г-М.