<<
>>

7.2. Обнаружение гетероскедастичности

В принципе число разных возможных видов гетероскедастичности неогра­ниченно. Соответственно, для разных ситуаций было предложено большое число различных тестов. Их можно разделить на две категории: те, что основа­ны на априорных предпосылках о природе гетероскедастичности, и те, что на них не опираются.
Рассмотрим по одному тесту из каждой категории: тест Голдфелда — Квандта и тест Уайта.

Тест Голдфелдв-Квандта

Вероятно, наиболее популярным формальным тестом на гетероскедастич- ностъ является тест Голдфелда-Квандта (Goldfeld, Quandt, 1965). При прове­дении этого теста предполагается, что стандартное отклонение (ои) распреде­ления вероятностей случайного члена в наблюдении i пропорционально зна­чению Хг Предполагается также, что случайный член распределен нормально и удовлетворяет другим предпосылкам регрессионного анализа.

0 200 000

Все п наблюдений в выборке упорядочиваются по величине X, после чего оцениваются отдельные регрессии для первых п' и для последних п' наблюде­ний; средние (п - 2п) наблюдений отбрасываются.

Если имеет место гетеро- скедастичность, и если предположение относительно ее природы верно, то дисперсия и в последних п' наблюдениях будет больше, чем в первых п', и это будет отражено в сумме квадратов остатков в двух указанных «частных» ре­

грессиях. Обозначая суммы квадратов остатков в регрессиях для первых ri и последних ri наблюдений соответственно через RSSX и RSSV рассчитаем отно­шение RSS2/RSSV которое при выполнении нулевой гипотезы о гомоскедас- тичности имеет ^-распределение с (ri -к) и (ri - к) степенями свободы, где к — число параметров в регрессионном уравнении. Мощность критерия зависит от выбора ri по отношению к я.

С. Голдфелд и Р. Квандт, основываясь на ре­зультатах некоторых проведенных ими экспериментов, утверждают, что ri должно составлять порядка трех восьмых от я, в частности около 11, если я = 30, и около 22, если я = 60. Если в модели имеется более одной объясня­ющей переменной, то наблюдения должны упорядочиваться по той из них, которая, как предполагается, связана с аи.

Нулевая гипотеза для данного теста состоит в том, что RSS2 не превышает значимо RSSV а альтернативная гипотеза — что значимо превышает. Если ве­личина RSS2 оказалась меньшей, чем RSSX, то вы не можете отвергнуть нулевую гипотезу, тогда вычислять тестовую статистику RSS1/RSS] нет нужды. Однако метод Голдфелда-Квандта может также использоваться для проверки на гете- роскедастичность при предположении, что стандартное отклонение случайно­го члена обратно пропорционально^.. При этом используется та же процедура, что и описанная выше, но тестовой статистикой теперь является показатель RSSJRSSj, который вновь имеет F-распределение с (ri -к) и (ri - к) степенями свободы при выполнении нулевой гипотезы о гомоскедастичности.

На основе данных табл. 7.1 с помощью обычного MHK были оценены ре­грессии сначала по наблюдениям для 11 стран с наименьшим ВВП, а затем для 11 стран с наибольшим ВВП. Сумма квадратов отклонений в первой регрес­сии равна 157 х 106, а во второй -13 518 х 106. Отношение RSS2/RSSV следова­тельно, составило 86,1. Критический уровень для F(9,9) при уровне значимо­сти 0,1% составляет 10,1, следовательно, нулевая гипотеза о гомоскедастич­ности была отклонена.

т Уайта

Тест Уайта (White, 1980) в более общем виде рассматривает зависимость между дисперсией случайного члена и объясняющими переменными. По­скольку дисперсия случайного члена в /-м наблюдении неизвестна, то в каче­стве ее замещающей переменной используется квадрат отклонения для этого наблюдения. Тест заключается в оценивании регрессии квадратов отклонений на объясняющие переменные модели, их квадраты и их попарные произведе­ния, исключая все повторяющиеся переменные (так, например, квадрат фик­тивной переменной будет иметь такое же значение, как и сама переменная, и поэтому в регрессию включен не будет).

Тестовая статистика равна nR2, где R2 — коэффициент детерминации этой модели. Если нулевая гипотеза об от­сутствии связи между дисперсией случайного члена и объясняющими пере­менными верна, то для больших выборок тестовая статистика имеет распреде­ление х2 с количеством степеней свободы, равным числу оцениваемых пара­метров (коэффициенты при объясняющей переменной и константа) минус один.

На основе данных табл. 7.1 была оценена регрессия квадратов отклонений на GDP, его квадрат и константу. R2 равен 0,2114, число наблюдений — 28, сле­довательно, тестовая статистика равна 5,92. Критическое значение распреде­ления х2 с двумя степенями свободы при уровне значимости 5% равно 5,99, что означает, что нулевая гипотеза о гомоскедастичности не отвергается.

Почему тест Голдфелда-Квандта указывает на наличие гетероскедастич- ности при достаточно высоком уровне значимости, тогда как тест Уайта ее не обнаружил? Одной из причин является то, что это тест для больших выборок, тогда как имеющаяся выборка невелика. Вторая причина состоит в неболь­шой мощности теста — это цена, которую приходится платить за большую общность подхода. Эти проблемы могут обостриться потерей степеней свобо­ды, если исходная модель имеет значительное число объясняющих перемен­ных. В рассмотренном примере только одна объясняющая переменная, по­этому при оценивании регрессии квадратов отклонений были затрачены только три степени свободы. В случае четырех объясняющих перменных было бы потеряно 15 степеней свободы — 5 для константы и переменных, еще че­тыре для квадратов переменных и дополнительные 6 для их попарных произ­ведений, что оставило бы лишь 13 степеней свободы собственно для оценива­ния регрессии.

Упражнения

7.1. В таблице приведены данные о государственных расходах G, инвестициях /, ва­ловом внутреннем продукте Y и численности населения Р для 30 стран в 1997 г. (Источник: International Monetary Fund Yearbook, 1999.) Величины G, Iи /изме­рены в миллиардах долларов США, Р — в миллионах человек.

Исследователь рассматривает вопрос о том, происходит ли «вытеснение» инвестиций государ­ственными расходами, и оценивает регрессию (в скобках — стандартные ошиб­ки):

/ = 18,10 — 1,07(7+ 0,36У; Л2 = 0,99.

(7,79) (0,14) (0,02)

Исследователь упорядочивает наблюдения по величине У и оценивает регрессии снова для 11 стран с наименьшим Y и для 11 стран с наибольшим Y. Величины RSS для этих регрессий равны 321 и 28 101 соответственно. Выполните тест Голд- фелда-Квандта на гетероскедастичность.

Страна / G У Р Страна / G У Р
Австралия 94,5 75,5 407,9 18,5 Нидерланды 73,0 49,9 360,5 15,6
Австрия 46,0 39,2 206,0 8,1 Новая Зеландия 12,9 9,9 65,1 3,8
Канада 119,3 125,1 631,2 30,3 Норвегия 35,3 30,9 153,4 4,4
Чехия 16,0 10,5 52,0 10,3 Филиппины 20,1 10,7 82,2 78,5
Дания 34,2 42,9 169,3 5,3 Польша 28,7 23,4 135,6 38,7
Финляндия 20,2 25,0 121,5 5,1 Португалия 25,6 19,9 102,1 9,8
Франция 255,9 347,2 1409,2 58,6 Россия 84,7 94,0 436,0 147,1
Германия 422,5 406,7 2102,7 82,1 Сингапур 35,6 9,0 95,9 3,7
Греция 24,0 17,7 119,9 10,5 Испания 109,5 86,0 532,0 39,3
Исландия 1,4 1,5 7,5 0,3 Швеция 31,2 58,8 227,8 8,9

Страна / G У Р Страна / G У Р
Ирландия 14,3 10,1 73,2 3,7 Швейцария 50,2 38,7 256,0 7,1
Италия 190,8 189,7 1145,4 57,5 Таиланд 48,1 15,0 153,9 60,6
Япония 1105,9 376,3 3901,3 126,1 Турция 50,2 23,3 189,1 62,5
Ю. Корея 154,9 49,3 442,5 46,0 Великобритания 210,1 230,7 1256,0 58,2
Малайзия 41,6 10,8 97,3 21,0 США 1517,7 1244,1 8110,9 267,9

Исследователь сохраняет остатки, полученные при оценивании регрессии в уп­ражнении 7.1, и оценивает регрессию их квадратов на G, Y,G2, Y2 и GY. Значение R2 в этой модели равняется 0,9878. Выполните тест Уайта на гетероскедастич- ность.

Оцените функцию заработка на основе набора данных EAEF, рассматривая EARNINGS как зависимую переменную, a S, ASVABC и MALE — как объясняю­щие переменные, и выполните тест Голдфелда—Квандта на гетероскедастич- ность относительно S. (Не забудьте вначале упорядочить данные по S.) Оцените функцию заработка на основе набора данных EAEF, используя ту же самую спецификацию модели, что и в упражнении 7.3, и выполните тест Уайта на гетероскедастичность.

По данным для школ Шанхая, рассмотренным в разделе 6.1, были оценены сле­дующие регрессии (в скобках — стандартные ошибки):

COST = 24 ООО + 339N; R1 = 0,39; (27 ООО) (50)

COST = 51 ООО - 4 ООООСС + 152N+ 284 NOCC\ R2 = 0,68, (31000) (41000) (60) (76)

где COST— годовые затраты на школы; N — численность учащихся; ОСС — фик­тивная переменная, равная нулю для обычных школ и единице — для профес­сиональных школ; NOCC — фиктивная переменная для коэффициента наклона, определяемая как произведение N и ОСС. В выборке всего 74 школы. После сор­тировки данных по Добыли снова оценены регрессии для 26 самых маленьких и 26 самых больших школ; полученные суммы квадратов отклонений представле­ны в таблице ниже.

26 самых маленьких школ 26 самых больших школ
Первая регрессия 7,8x1010 54,4 х 1010
Вторая регрессия 6,7x1010 13,8x1010

Выполните тест Голдфелда-Квандта на гетероскедастичность для этих двух мо­делей и, используя рис. 6.5, объясните, почему проблема гетероскедастичности менее остра для второй модели.

Файл educ.dta, находящийся в папке с данными о гетероскедастичности на на­шей странице в Интернете, содержит международные данные перекрестной вы­борки по показателям EDUC (совокупные расходы на образование), GDP (вало­вой внутренний продукт) и ЮР (численность населения) для 38 стран за 1997 г. Показатели EDUC и боданы в миллионах долларов США, а показатель POP — в тысячах человек. Загрузите этот набор данных, постройте диаграмму рассеяния

для зависимости EDUC от GDP и прокомментируйте возможное наличие в этих данных гетероскедастичности. Выполните упорядочение данных по GDP и тест Голдфелда—Квандта на гетероскедастичность, оценив регрессии для подвыбо- рок из 14 стран с наименьшими и наибольшими объемами ВВП.

Что можно сделать в случае гетероскедастичности?

Предположим, что истинная зависимость имеет вид

¥ = ^ + ^ + (7.2)

Пусть о и — стандартное отклонение случайного члена в наблюдении /. В том случае, если бы было известно ан для каждого наблюдения, можно было бы устранить гетероскедастичность, разделив каждое наблюдение на соответ­ствующее ему значение а. Тогда модель приобретает вид

= + (7.3)

аи, аи,

Случайный член «/ои здесь гомоскедастичен, поскольку его теоретическая дисперсия равна

1
(7.4)

1

=—£(„/) =—

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 7.2. Обнаружение гетероскедастичности:

  1. 7.3. Обнаружение гетероскедастичности
  2. ГЕТЕРОСКЕДАСТИЧНОСТЬ
  3. 7.4. Что можно сделать в случае гетероскедастичности?
  4. 7.2. Гетероскедастичностьи ее последствия
  5. 7. 1. Гетероскедастичность и ее последствия
  6. 13.3. Обнаружение нестационарности
  7. 7. ГЕТЕРОСКЕДАСТИЧНОСТЬ И АВТОКОРРЕЛИРОВАННОСТЬ СЛУЧАЙНОГО ЧЛЕНА
  8. Учет недостач и порчи материалов, обнаруженных при их приемке
  9. 9.6. Учет недостач и порчи, обнаруженных при приемке материалов
  10. События, обнаруженные после выпуска бухгалтерской отчетности
  11. 7.6. Обнаружение автокорреляции первого порядка: критерий Дарбина—Уотсона