7.2. Обнаружение гетероскедастичности
Тест Голдфелдв-Квандта
Вероятно, наиболее популярным формальным тестом на гетероскедастич- ностъ является тест Голдфелда-Квандта (Goldfeld, Quandt, 1965). При проведении этого теста предполагается, что стандартное отклонение (ои) распределения вероятностей случайного члена в наблюдении i пропорционально значению Хг Предполагается также, что случайный член распределен нормально и удовлетворяет другим предпосылкам регрессионного анализа.
0 200 000 |
Все п наблюдений в выборке упорядочиваются по величине X, после чего оцениваются отдельные регрессии для первых п' и для последних п' наблюдений; средние (п - 2п) наблюдений отбрасываются.
Если имеет место гетеро- скедастичность, и если предположение относительно ее природы верно, то дисперсия и в последних п' наблюдениях будет больше, чем в первых п', и это будет отражено в сумме квадратов остатков в двух указанных «частных» регрессиях. Обозначая суммы квадратов остатков в регрессиях для первых ri и последних ri наблюдений соответственно через RSSX и RSSV рассчитаем отношение RSS2/RSSV которое при выполнении нулевой гипотезы о гомоскедас- тичности имеет ^-распределение с (ri -к) и (ri - к) степенями свободы, где к — число параметров в регрессионном уравнении. Мощность критерия зависит от выбора ri по отношению к я.
С. Голдфелд и Р. Квандт, основываясь на результатах некоторых проведенных ими экспериментов, утверждают, что ri должно составлять порядка трех восьмых от я, в частности около 11, если я = 30, и около 22, если я = 60. Если в модели имеется более одной объясняющей переменной, то наблюдения должны упорядочиваться по той из них, которая, как предполагается, связана с аи.Нулевая гипотеза для данного теста состоит в том, что RSS2 не превышает значимо RSSV а альтернативная гипотеза — что значимо превышает. Если величина RSS2 оказалась меньшей, чем RSSX, то вы не можете отвергнуть нулевую гипотезу, тогда вычислять тестовую статистику RSS1/RSS] нет нужды. Однако метод Голдфелда-Квандта может также использоваться для проверки на гете- роскедастичность при предположении, что стандартное отклонение случайного члена обратно пропорционально^.. При этом используется та же процедура, что и описанная выше, но тестовой статистикой теперь является показатель RSSJRSSj, который вновь имеет F-распределение с (ri -к) и (ri - к) степенями свободы при выполнении нулевой гипотезы о гомоскедастичности.
На основе данных табл. 7.1 с помощью обычного MHK были оценены регрессии сначала по наблюдениям для 11 стран с наименьшим ВВП, а затем для 11 стран с наибольшим ВВП. Сумма квадратов отклонений в первой регрессии равна 157 х 106, а во второй -13 518 х 106. Отношение RSS2/RSSV следовательно, составило 86,1. Критический уровень для F(9,9) при уровне значимости 0,1% составляет 10,1, следовательно, нулевая гипотеза о гомоскедастичности была отклонена.
т Уайта
Тест Уайта (White, 1980) в более общем виде рассматривает зависимость между дисперсией случайного члена и объясняющими переменными. Поскольку дисперсия случайного члена в /-м наблюдении неизвестна, то в качестве ее замещающей переменной используется квадрат отклонения для этого наблюдения. Тест заключается в оценивании регрессии квадратов отклонений на объясняющие переменные модели, их квадраты и их попарные произведения, исключая все повторяющиеся переменные (так, например, квадрат фиктивной переменной будет иметь такое же значение, как и сама переменная, и поэтому в регрессию включен не будет).
Тестовая статистика равна nR2, где R2 — коэффициент детерминации этой модели. Если нулевая гипотеза об отсутствии связи между дисперсией случайного члена и объясняющими переменными верна, то для больших выборок тестовая статистика имеет распределение х2 с количеством степеней свободы, равным числу оцениваемых параметров (коэффициенты при объясняющей переменной и константа) минус один.На основе данных табл. 7.1 была оценена регрессия квадратов отклонений на GDP, его квадрат и константу. R2 равен 0,2114, число наблюдений — 28, следовательно, тестовая статистика равна 5,92. Критическое значение распределения х2 с двумя степенями свободы при уровне значимости 5% равно 5,99, что означает, что нулевая гипотеза о гомоскедастичности не отвергается.
Почему тест Голдфелда-Квандта указывает на наличие гетероскедастич- ности при достаточно высоком уровне значимости, тогда как тест Уайта ее не обнаружил? Одной из причин является то, что это тест для больших выборок, тогда как имеющаяся выборка невелика. Вторая причина состоит в небольшой мощности теста — это цена, которую приходится платить за большую общность подхода. Эти проблемы могут обостриться потерей степеней свободы, если исходная модель имеет значительное число объясняющих переменных. В рассмотренном примере только одна объясняющая переменная, поэтому при оценивании регрессии квадратов отклонений были затрачены только три степени свободы. В случае четырех объясняющих перменных было бы потеряно 15 степеней свободы — 5 для константы и переменных, еще четыре для квадратов переменных и дополнительные 6 для их попарных произведений, что оставило бы лишь 13 степеней свободы собственно для оценивания регрессии.
Упражнения
7.1. В таблице приведены данные о государственных расходах G, инвестициях /, валовом внутреннем продукте Y и численности населения Р для 30 стран в 1997 г. (Источник: International Monetary Fund Yearbook, 1999.) Величины G, Iи /измерены в миллиардах долларов США, Р — в миллионах человек.
Исследователь рассматривает вопрос о том, происходит ли «вытеснение» инвестиций государственными расходами, и оценивает регрессию (в скобках — стандартные ошибки):/ = 18,10 — 1,07(7+ 0,36У; Л2 = 0,99.
(7,79) (0,14) (0,02)
Исследователь упорядочивает наблюдения по величине У и оценивает регрессии снова для 11 стран с наименьшим Y и для 11 стран с наибольшим Y. Величины RSS для этих регрессий равны 321 и 28 101 соответственно. Выполните тест Голд- фелда-Квандта на гетероскедастичность.
Страна | / | G | У | Р | Страна | / | G | У | Р |
Австралия | 94,5 | 75,5 | 407,9 | 18,5 | Нидерланды | 73,0 | 49,9 | 360,5 | 15,6 |
Австрия | 46,0 | 39,2 | 206,0 | 8,1 | Новая Зеландия | 12,9 | 9,9 | 65,1 | 3,8 |
Канада | 119,3 | 125,1 | 631,2 | 30,3 | Норвегия | 35,3 | 30,9 | 153,4 | 4,4 |
Чехия | 16,0 | 10,5 | 52,0 | 10,3 | Филиппины | 20,1 | 10,7 | 82,2 | 78,5 |
Дания | 34,2 | 42,9 | 169,3 | 5,3 | Польша | 28,7 | 23,4 | 135,6 | 38,7 |
Финляндия | 20,2 | 25,0 | 121,5 | 5,1 | Португалия | 25,6 | 19,9 | 102,1 | 9,8 |
Франция | 255,9 | 347,2 | 1409,2 | 58,6 | Россия | 84,7 | 94,0 | 436,0 | 147,1 |
Германия | 422,5 | 406,7 | 2102,7 | 82,1 | Сингапур | 35,6 | 9,0 | 95,9 | 3,7 |
Греция | 24,0 | 17,7 | 119,9 | 10,5 | Испания | 109,5 | 86,0 | 532,0 | 39,3 |
Исландия | 1,4 | 1,5 | 7,5 | 0,3 | Швеция | 31,2 | 58,8 | 227,8 | 8,9 |
Страна | / | G | У | Р | Страна | / | G | У | Р |
Ирландия | 14,3 | 10,1 | 73,2 | 3,7 | Швейцария | 50,2 | 38,7 | 256,0 | 7,1 |
Италия | 190,8 | 189,7 | 1145,4 | 57,5 | Таиланд | 48,1 | 15,0 | 153,9 | 60,6 |
Япония | 1105,9 | 376,3 | 3901,3 | 126,1 | Турция | 50,2 | 23,3 | 189,1 | 62,5 |
Ю. Корея | 154,9 | 49,3 | 442,5 | 46,0 | Великобритания | 210,1 | 230,7 | 1256,0 | 58,2 |
Малайзия | 41,6 | 10,8 | 97,3 | 21,0 | США | 1517,7 | 1244,1 | 8110,9 | 267,9 |
Исследователь сохраняет остатки, полученные при оценивании регрессии в упражнении 7.1, и оценивает регрессию их квадратов на G, Y,G2, Y2 и GY. Значение R2 в этой модели равняется 0,9878. Выполните тест Уайта на гетероскедастич- ность.
Оцените функцию заработка на основе набора данных EAEF, рассматривая EARNINGS как зависимую переменную, a S, ASVABC и MALE — как объясняющие переменные, и выполните тест Голдфелда—Квандта на гетероскедастич- ность относительно S. (Не забудьте вначале упорядочить данные по S.) Оцените функцию заработка на основе набора данных EAEF, используя ту же самую спецификацию модели, что и в упражнении 7.3, и выполните тест Уайта на гетероскедастичность.
По данным для школ Шанхая, рассмотренным в разделе 6.1, были оценены следующие регрессии (в скобках — стандартные ошибки):
COST = 24 ООО + 339N; R1 = 0,39; (27 ООО) (50)
COST = 51 ООО - 4 ООООСС + 152N+ 284 NOCC\ R2 = 0,68, (31000) (41000) (60) (76)
где COST— годовые затраты на школы; N — численность учащихся; ОСС — фиктивная переменная, равная нулю для обычных школ и единице — для профессиональных школ; NOCC — фиктивная переменная для коэффициента наклона, определяемая как произведение N и ОСС. В выборке всего 74 школы. После сортировки данных по Добыли снова оценены регрессии для 26 самых маленьких и 26 самых больших школ; полученные суммы квадратов отклонений представлены в таблице ниже.
26 самых маленьких школ | 26 самых больших школ | |
Первая регрессия | 7,8x1010 | 54,4 х 1010 |
Вторая регрессия | 6,7x1010 | 13,8x1010 |
Выполните тест Голдфелда-Квандта на гетероскедастичность для этих двух моделей и, используя рис. 6.5, объясните, почему проблема гетероскедастичности менее остра для второй модели.
Файл educ.dta, находящийся в папке с данными о гетероскедастичности на нашей странице в Интернете, содержит международные данные перекрестной выборки по показателям EDUC (совокупные расходы на образование), GDP (валовой внутренний продукт) и ЮР (численность населения) для 38 стран за 1997 г. Показатели EDUC и боданы в миллионах долларов США, а показатель POP — в тысячах человек. Загрузите этот набор данных, постройте диаграмму рассеяния
для зависимости EDUC от GDP и прокомментируйте возможное наличие в этих данных гетероскедастичности. Выполните упорядочение данных по GDP и тест Голдфелда—Квандта на гетероскедастичность, оценив регрессии для подвыбо- рок из 14 стран с наименьшими и наибольшими объемами ВВП.
Что можно сделать в случае гетероскедастичности?
Предположим, что истинная зависимость имеет вид
¥ = ^ + ^ + (7.2)
Пусть о и — стандартное отклонение случайного члена в наблюдении /. В том случае, если бы было известно ан для каждого наблюдения, можно было бы устранить гетероскедастичность, разделив каждое наблюдение на соответствующее ему значение а. Тогда модель приобретает вид
= + (7.3)
аи, аи,
Случайный член «/ои здесь гомоскедастичен, поскольку его теоретическая дисперсия равна
1 |
(7.4) |
1
=—£(„/) =—
Еще по теме 7.2. Обнаружение гетероскедастичности:
- 7.3. Обнаружение гетероскедастичности
- ГЕТЕРОСКЕДАСТИЧНОСТЬ
- 7.4. Что можно сделать в случае гетероскедастичности?
- 7.2. Гетероскедастичностьи ее последствия
- 7. 1. Гетероскедастичность и ее последствия
- 13.3. Обнаружение нестационарности
- 7. ГЕТЕРОСКЕДАСТИЧНОСТЬ И АВТОКОРРЕЛИРОВАННОСТЬ СЛУЧАЙНОГО ЧЛЕНА
- Учет недостач и порчи материалов, обнаруженных при их приемке
- 9.6. Учет недостач и порчи, обнаруженных при приемке материалов
- События, обнаруженные после выпуска бухгалтерской отчетности
- 7.6. Обнаружение автокорреляции первого порядка: критерий Дарбина—Уотсона