<<
>>

6.5.Проверка линейного ограничения

В разделе 3.4 было показано, что можно смягчить проблему мультиколли- неарности, если вы убеждены, что параметры этого уравнения линейно зави­симы. Воспользовавшись этой зависимостью, вы сделаете оценки регрессии более эффективными.
Даже если начальная модель не была подвержена муль- тиколлинеарности, то выигрыш в эффективности может дать улучшение точ­ности оценок, что отражается в их стандартных ошибках.

В разделе 3.4 был обсужден пример модели охвата обучением с перемен­ной S, зависящей от ASVABC, SM и SF. Результаты регрессии показаны в табл. 6.7.

Несколько удивляет то, что коэффициент при SM оказался незначимым даже на уровне 5% с использованием одностороннего теста. Однако подбор супруга, чаще всего близкого по уровню, обусловливает высокую корреляцию

regSASVABC SM SF
Source SS df MS Number of obs = F(3,536) Prob > F

R-squared = Adj R-squared = Root MSE

540 104.30 0.0000 0.3686 0.3651 1.943
Model Residual 1181.36981 2023.61353 3

536

393.789935 3.77539837
Total 3204.98333 539 5.94616574
S Coef. Std.
Err.
t P>|t| [95% Conf. Interval]
ASVABC .1257087 .0098533 12.76 0.000 .1063528 .1450646
SM .0492424 .0390901 1.26 0.208 -.027546 .1260309
SF .1076825 .0309522 3.48 0.001 .04688 .1684851
cons 5.370631 .4882155 11.00 0.000 4.41158 6.329681

между БМ и 57% и регрессионная модель начинает страдать от мультиколлине- арности.

Мы далее предположили, что полученное матерью и отцом респондента образование равно важно, что позволило ввести ограничение Р3 = р4 и пере­писать уравнение как

£ = Р, + р2 АЯУАВС + р3 (5М + £/0+и = = $х+$2А8УАВС+$ъ8Р + и, (6.24)

где БР есть сумма 5М и Ж Для такой спецификации регрессии результаты показаны в табл. 6.8.

. д 5Р=ЗМ + ЭР . гед Б АЭ\/АВС ЭР

Стандартная ошибка у коэффициента переменной при ЯР намного мень­ше, чем у коэффициентов при ЯМ и ЯЕ, что указывает на выигрыш в эффек­тивности в результате введения ограничения, и вследствие этого значение /-статистики очень высоко. Тем самым была снята проблема мультиколлине- арности. Мы, однако, должны проверить значимость ограничения, и для это­го существуют две эквивалентные процедуры.

Таблица 6.8
Source SS df MS Number of obs = F(2,537) Prob > F

R-squared = Adj R-squared = Root MSE

540 156.04 0.0000 0.3675 0.3652 1.9429
Model Residual 1177.98338 2026.99996 2

537

588.991689 3.77467403
Total 3204.98333 539 5.94616574
S Coef. Std. Err. t P>|t| [95% Conf. Interval]
ASVABC .1253106 .0098434 12.73 0.000 .1059743 .1446469
SP .0828368 .0164247 5.04 0.000 .0505722 .1151014
cons 5.29617 .4817972 10.99 0.000 4.349731 6.242608

До осуществления этих процедур, мы должны сделать различие между ли­нейными и нелинейными ограничениями.

Для линейных ограничений, таких как Р2 = Р3 или Р2 + Р3 = 1, параметры удовлетворяют простому линейному уравнению. Для нелинейного ограничения, такого как р2 = Р3Р4, это не так. Описанные здесь процедуры подходят лишь для линейных ограничений. Не­линейные ограничения и тесты для их проверки будут рассмотрены в последу­ющих главах.

Проверка ограничения с помощью Р-критерия

Первая процедура заключается в осуществлении /'-теста для линейного ограничения. Построим обе формы регрессии (как с ограничением, так и без него) и обозначим сумму квадратов остатков через ЕЯЯд в варианте с ограни­чением и ЛУУ^ — в варианте без ограничения. Поскольку введение ограниче­ния ведет к сужению возможностей подбора уравнения регрессии, обеспечи­вающего наибольшее соответствие с имеющимися данными, ЯЯЯд не может быть меньше, чем АУЗ^, а будет (в общем случае) больше. Нам хотелось бы проверить, является ли улучшение качества регрессии при переходе от вари­анта с ограничением к варианту без ограничения статистически значимым. Если да, то ограничение должно быть отброшено.

(6.25)

Для этой цели мы можем использовать ./-критерий, сконструированный так же, как и в разделе 3.5:

Улучшение качества уравнения/Число использованных

________________ степеней свободы___

(6.26)

Оставшаяся сумма квадратов отклонений/ Оставшееся число степеней свободы

Здесь улучшение качества регрессии, получаемое при переходе от модели с ограничением к модели без ограничения, выражается величиной (АУУд - - ЛУЗ^). В модели без ограничения появляется одна дополнительная степень свободы (поскольку оценивается на один параметр больше), и сумма квадра­тов отклонений, остающаяся после перехода от ограниченного к неограни­ченному варианту, составляет ЛУУ^. Следовательно, /'-статистика в данном случае равна

ЛЯЯц /(п-к)

где к — число объясняющих переменных в варианте без ограничения.

Она распределена между единицей и (и - к) степенями свободы при нулевой гипо­тезе, причем ограничение верно. Первый аргумент /"-распределения равен единице, так как мы тестируем только одно ограничение. Второй аргумент ра­вен числу степеней свободы для модели без ограничений.

В случае функции охвата обучением нулевая гипотеза заключалась в следу­ющем: #0: Р3 = Р4, где Р3 — коэффициент при .УМ; Р4 — коэффициент при + и; (6.29)

О = р3 БМ + р4^ - рз^ = р3.Ш + р^ ^- р3 («Ш" + БР) = (Р4 - р3 )5/\ (6.30)

Добавив это слагаемое к модели с ограничением, мы получим вариант мо­дели без ограничений с комбинированными параметрами:

5 = Р12У45КАВС + Рз5Р + (Р4-РЗ)5Р + М. (6.31)

Нулевая гипотеза Н0: Р4 - р3 = 0 здесь заключается в том, что коэффициент при дополнительном члене равен нулю, а альтернативная гипотеза состоит в том, что он отличается от нуля. Конечно, нулевая гипотеза соответствует зна­чимости ограничения. Если оно значимо, то дополнительный член не нужен, и вариант модели с ограничением адекватен имеющимся данным.

В табл. 6.9 представлена соответствующая регрессия для примера с функ­цией охвата обучением. Можно видеть, что коэффициент при переменной Я/ не отличается значимо от нуля, и это говорит о том, что дополнительный член не нужен, а вариант модели с ограничением адекватно представляет имеющи­еся данные.

Почему этот способ эквивалентен использованию /'-теста? Напомним, что /'-тест проверяет улучшение качества уравнения при переходе от его варианта с ограничением к варианту без ограничения. Это осуществляется путем до­бавления дополнительного члена, но, как известно, /'-тест для проверки улуч­шения качества уравнения путем добавления дополнительного члена эквива­лентен /-тесту для проверки значимости коэффициента этого члена (см. раз­дел 3.5).

. reg S ASVABC SP SF
Source SS df MS Number of obs = F(3,536) Prob > F

R-squared = Adj R-squared = Root MSE

540 104.30 0.0000 0.3686 0.3651 1.943
Model Residual 1181.36981 2023.61353 3

536

393.789935 3.77539837
Total 3204.98333 539 5.94616574
S Coef. Std. Err. t P>|t| [95% Conf. Interval]
ASVABC .1257087 .0098533 12.76 0.000 .1063528 .1450646
SP .0492424 .0390901 1.26 0.208 -.027546 .1260309
SF .0584401 .0617051 0.95 0.344 -.0627734 .1796536
_cons 5.370631 .4882155 11.00 0.000 4.41158 6.329681

Упражнения

6.11. Так же ли важен прошлый стаж по сравнению со стажем работы у нынешнего работодателя? Используя данные EAEF, оцените регрессию LGEARN на S, ЕХР, MALE, ETHBLACKw ETHHISP. Далее определите

РREV EXP = EXP - TENURE.

Переменная TENURE здесь обозначает число лет, в течение которых респондент работает у нынешнего работодателя. Оцените регрессию LGEARN на S, PREVEXP, TENURE, MALE, ETHBLACKu ETHHISP. Оценки коэффициентов при PREVEXP и TENURE различаются. Это ставит вопрос о том, обусловлено ли это различие случайными факторами или же эти коэффициенты значимо различны. Сформу­лируем нулевую гипотезу Н0:8, = 52, где б, — коэффициент при PREVEXP, а 52 — коэффициент при TENURE. Объясните, почему регрессия с переменной ЕХР является правильной спецификацией, если Н0 верна, в то время как регрессия с переменными PREVEXP и TENURE должна быть использована в том случае, если Н0 ложна. Выполните /'-тест для ограничения, используя значения RSS для двух регрессий. Проделайте это для всей выборки, а также отдельно для мужчин и женщин.

6.12. Используя данные ЕЛЕЕ, оцените регрессию LGEARN на S, ЕХР, MALE, ETHBLACK, ETHHISP и TENURE. Покажите, что t-тест для коэффициента при TENURE является тестом для ограничения, описанного в упражнении 6.11. Удос­товерьтесь, что полученные результаты совпадают. Будет ли это так для совме­щенной выборки, а также для мужчин и женщин по отдельности?

6.13*. Первая часть приведенной ниже распечатки показывает результат оценивания регрессии переменной LGFDHO (логарифм годовых расходов домохозяйств на продукты питания домашнего потребления) на переменные LGEXP (логарифм общих годовых расходов домохозяйств) и LGSIZE (логарифм числа потребителей в домохозяйстве) на основе выборки из 868 домохозяйств в опросе о потреби­тельских расходах за 1995 г. Во второй части представлена регрессия LGFDHOPC (логарифм расходов на продукты питания на душу населения, FDHO/SIZE) на переменную LGEXPPC (логарифм общих расходов на душу населения, ЕХР/SIZE). В третьей части представлена регрессия LGFDHOPC на LGEXPPC и LGSIZE.

. reg LGFDHO LGEXP LGSIZE
Source SS df MS Number of obs = 868
Model 138.776549 2 69.3882747 F( 2,865) Prob > F 460.92 0.0000
Residual 130.219231 865 .150542464 R-squared = 0.5159
Adj R-squared = Root MSE 0.5148 .388
Total 268.995781 867 .310260416
LGFDHO Coef. Std. Err. t P>|t| [95% Conf. Interval]
LGEXP .2866813 .0226824 12.639 0.000 .2421622 .3312003
LGSIZE .4854698 .0255476 19.003 0.000 .4353272 .5356124
_cons 4.720269 .2209996 21.359 0.000 4.286511 5.154027
. reg LGFDHOPC LGEXPPC
Source SS df MS Number of obs = 868
Model 51.4364364 1 51.4364364 F( 1,866) Prob > F 313.04 0.0000
Residual 142.293973 866 .164311747 R-squared = 0.2655
Total 193.73041 867 .223449146 Adj R-squared = Root MSE 0.2647 .40535
LGFDHOPC Coef. Std. Err. t P>ltl [95% Conf. Interval]
LGEXPPC .376283 .0212674 17.693 0.000 .3345414 .4180246
_cons 3.700667 .1978925 18.700 0.000 3.312262 4.089072
. reg LGFDHOPC LGEXPPC LGSIZE
Source SS df MS Number of obs = 868
Model 63.5111811 2 31.7555905 F(2,865) Prob > F 210.94 0.0000
Residual 130.219229 865 .150542461 R-squared = 0.3278
Total 193.73041 867 .223449146 Adj R-squared = Root MSE 0.3263 .388
LGFDHOPC Coef. Std. Err. t P>ltl [95% Conf. Interval]
LGEXPPC .2866813 .0226824 12.639 0.000 .2421622 .3312004
LGSIZE -.2278489 .0254412 -8.956 0.000 -.2777826 -.1779152
_cons 4.720269 .2209996 21.359 0.000 4.286511 5.154027

1) Объясните, почему вторая модель является версией первой модели с ограни­чением, сформулировав это ограничение.

2) Выполните /"-тест для этого ограничения.

3) Выполните /-тест для этого ограничения.

4) Представьте выводы из анализа результатов оценивания регрессии.

6.14. В своей классической статье М. Нерлов (№г1оуе, 1963) предложил следующую функцию издержек для производства электроэнергии:

где С — совокупные издержки производства; У — выпуск (в киловатт-часах); Рх — цена использования единицы труда; Р2 — цена использования единицы ка­

питала; Ръ — цена топлива (все показатели измерены в соответствующих едини­цах); V — случайный член. Теоретически сумма ценовых эластичностей выпуска должна равняться единице:

и, следовательно, функцию издержек можно переписать как

V.
уА.

кА;

Два представленных варианта функции издержек были оценены Нерловом для выборки из 29 компаний среднего размера, и были получены следующие резуль­таты (в скобках приведены стандартные ошибки):

logC = -4,93 + 0,94 log У+0,31 log Р] -0,26 log Р2 +0,44 log Р3; RSS = 0,336;

(1,62) (0,11) (0,23) (0,29) (0,07)

" С Р Р

logy =-6,55 +0,91 log У+0,51 logy +0,09 logy; RSS = 0,364.

3 (0,16) (0,11) (0,23) 3 (0,19) 3 Сравните результаты оценивания двух уравнений регрессии и выполните тест на значимость ограничения.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 6.5.Проверка линейного ограничения:

  1. 6.5. Проверка линейного ограничения
  2. § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
  3. 1.7. Общие причины ограниченного применения бизнес-планирования и ограничения при формировании стратегий
  4. Линейная организационная структура
  5. 10.1. Линейная вероятностная модель
  6. § 16.1. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ
  7. Линейная организационная структура
  8. § 16.8. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ В ЛИНЕЙНОМ РЕГРЕССИОННОМ АНАЛИЗЕ
  9. 4.5. Сравнение линейной и логарифмической моделей
  10. ЛИНЕЙНАЯ И ЦИКЛИЧЕСКАЯ МОДЕЛИ В ПОЛИТИЧЕСКОМ ПРОГНОЗИРОВАНИИ
  11. Модели линейного программирования
  12. S 16.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ
  13. ЛИНЕЙНЫЙ СПОСОБ НАЧИСЛЕНИЯ АМОРТИЗАЦИИ
  14. Линейный способ начисления амортизации
  15. 27. ОСОБЕННОСТИ ЛИНЕЙНО-ФУНКЦИОНАЛЬНЫХ СТРУКТУР
  16. Кусочно-линейные агрегаты (КЛА).
  17. 1.1.Модель парной линейной регрессии
  18. 2.1. Модель парной линейной регрессии
  19. § 16.6. ИСПЫТАНИЕ ГИПОТЕЗЫ ДЛЯ ОЦЕНКИ ЛИНЕЙНОСТИ СВЯЗИ