6.5.Проверка линейного ограничения
В разделе 3.4 был обсужден пример модели охвата обучением с переменной S, зависящей от ASVABC, SM и SF. Результаты регрессии показаны в табл. 6.7.
Несколько удивляет то, что коэффициент при SM оказался незначимым даже на уровне 5% с использованием одностороннего теста. Однако подбор супруга, чаще всего близкого по уровню, обусловливает высокую корреляцию
regSASVABC SM SF
|
между БМ и 57% и регрессионная модель начинает страдать от мультиколлине- арности.
Мы далее предположили, что полученное матерью и отцом респондента образование равно важно, что позволило ввести ограничение Р3 = р4 и переписать уравнение как
£ = Р, + р2 АЯУАВС + р3 (5М + £/0+и = = $х+$2А8УАВС+$ъ8Р + и, (6.24)
где БР есть сумма 5М и Ж Для такой спецификации регрессии результаты показаны в табл. 6.8.
. д 5Р=ЗМ + ЭР . гед Б АЭ\/АВС ЭР |
Стандартная ошибка у коэффициента переменной при ЯР намного меньше, чем у коэффициентов при ЯМ и ЯЕ, что указывает на выигрыш в эффективности в результате введения ограничения, и вследствие этого значение /-статистики очень высоко. Тем самым была снята проблема мультиколлине- арности. Мы, однако, должны проверить значимость ограничения, и для этого существуют две эквивалентные процедуры.
Таблица 6.8
|
До осуществления этих процедур, мы должны сделать различие между линейными и нелинейными ограничениями.
Для линейных ограничений, таких как Р2 = Р3 или Р2 + Р3 = 1, параметры удовлетворяют простому линейному уравнению. Для нелинейного ограничения, такого как р2 = Р3Р4, это не так. Описанные здесь процедуры подходят лишь для линейных ограничений. Нелинейные ограничения и тесты для их проверки будут рассмотрены в последующих главах.Проверка ограничения с помощью Р-критерия
Первая процедура заключается в осуществлении /'-теста для линейного ограничения. Построим обе формы регрессии (как с ограничением, так и без него) и обозначим сумму квадратов остатков через ЕЯЯд в варианте с ограничением и ЛУУ^ — в варианте без ограничения. Поскольку введение ограничения ведет к сужению возможностей подбора уравнения регрессии, обеспечивающего наибольшее соответствие с имеющимися данными, ЯЯЯд не может быть меньше, чем АУЗ^, а будет (в общем случае) больше. Нам хотелось бы проверить, является ли улучшение качества регрессии при переходе от варианта с ограничением к варианту без ограничения статистически значимым. Если да, то ограничение должно быть отброшено.
(6.25) |
Для этой цели мы можем использовать ./-критерий, сконструированный так же, как и в разделе 3.5:
Улучшение качества уравнения/Число использованных
________________ степеней свободы___
(6.26) |
Оставшаяся сумма квадратов отклонений/ Оставшееся число степеней свободы
Здесь улучшение качества регрессии, получаемое при переходе от модели с ограничением к модели без ограничения, выражается величиной (АУУд - - ЛУЗ^). В модели без ограничения появляется одна дополнительная степень свободы (поскольку оценивается на один параметр больше), и сумма квадратов отклонений, остающаяся после перехода от ограниченного к неограниченному варианту, составляет ЛУУ^. Следовательно, /'-статистика в данном случае равна
ЛЯЯц /(п-к)
где к — число объясняющих переменных в варианте без ограничения.
Она распределена между единицей и (и - к) степенями свободы при нулевой гипотезе, причем ограничение верно. Первый аргумент /"-распределения равен единице, так как мы тестируем только одно ограничение. Второй аргумент равен числу степеней свободы для модели без ограничений.В случае функции охвата обучением нулевая гипотеза заключалась в следующем: #0: Р3 = Р4, где Р3 — коэффициент при .УМ; Р4 — коэффициент при + и; (6.29)
О = р3 БМ + р4^ - рз^ = р3.Ш + р^ ^- р3 («Ш" + БР) = (Р4 - р3 )5/\ (6.30)
Добавив это слагаемое к модели с ограничением, мы получим вариант модели без ограничений с комбинированными параметрами:
5 = Р1+Р2У45КАВС + Рз5Р + (Р4-РЗ)5Р + М. (6.31)
Нулевая гипотеза Н0: Р4 - р3 = 0 здесь заключается в том, что коэффициент при дополнительном члене равен нулю, а альтернативная гипотеза состоит в том, что он отличается от нуля. Конечно, нулевая гипотеза соответствует значимости ограничения. Если оно значимо, то дополнительный член не нужен, и вариант модели с ограничением адекватен имеющимся данным.
В табл. 6.9 представлена соответствующая регрессия для примера с функцией охвата обучением. Можно видеть, что коэффициент при переменной Я/ не отличается значимо от нуля, и это говорит о том, что дополнительный член не нужен, а вариант модели с ограничением адекватно представляет имеющиеся данные.
Почему этот способ эквивалентен использованию /'-теста? Напомним, что /'-тест проверяет улучшение качества уравнения при переходе от его варианта с ограничением к варианту без ограничения. Это осуществляется путем добавления дополнительного члена, но, как известно, /'-тест для проверки улучшения качества уравнения путем добавления дополнительного члена эквивалентен /-тесту для проверки значимости коэффициента этого члена (см. раздел 3.5).
. reg S ASVABC SP SF | ||||||
Source | SS | df | MS | Number of obs = F(3,536) Prob > F R-squared = Adj R-squared = Root MSE | 540 104.30 0.0000 0.3686 0.3651 1.943 | |
Model Residual | 1181.36981 2023.61353 | 3 536 | 393.789935 3.77539837 | |||
Total | 3204.98333 | 539 | 5.94616574 | |||
S | Coef. | Std. Err. | t | P>|t| | [95% Conf. | Interval] |
ASVABC | .1257087 | .0098533 | 12.76 | 0.000 | .1063528 | .1450646 |
SP | .0492424 | .0390901 | 1.26 | 0.208 | -.027546 | .1260309 |
SF | .0584401 | .0617051 | 0.95 | 0.344 | -.0627734 | .1796536 |
_cons | 5.370631 | .4882155 | 11.00 | 0.000 | 4.41158 | 6.329681 |
Упражнения
6.11. Так же ли важен прошлый стаж по сравнению со стажем работы у нынешнего работодателя? Используя данные EAEF, оцените регрессию LGEARN на S, ЕХР, MALE, ETHBLACKw ETHHISP. Далее определите
РREV EXP = EXP - TENURE.
Переменная TENURE здесь обозначает число лет, в течение которых респондент работает у нынешнего работодателя. Оцените регрессию LGEARN на S, PREVEXP, TENURE, MALE, ETHBLACKu ETHHISP. Оценки коэффициентов при PREVEXP и TENURE различаются. Это ставит вопрос о том, обусловлено ли это различие случайными факторами или же эти коэффициенты значимо различны. Сформулируем нулевую гипотезу Н0:8, = 52, где б, — коэффициент при PREVEXP, а 52 — коэффициент при TENURE. Объясните, почему регрессия с переменной ЕХР является правильной спецификацией, если Н0 верна, в то время как регрессия с переменными PREVEXP и TENURE должна быть использована в том случае, если Н0 ложна. Выполните /'-тест для ограничения, используя значения RSS для двух регрессий. Проделайте это для всей выборки, а также отдельно для мужчин и женщин.
6.12. Используя данные ЕЛЕЕ, оцените регрессию LGEARN на S, ЕХР, MALE, ETHBLACK, ETHHISP и TENURE. Покажите, что t-тест для коэффициента при TENURE является тестом для ограничения, описанного в упражнении 6.11. Удостоверьтесь, что полученные результаты совпадают. Будет ли это так для совмещенной выборки, а также для мужчин и женщин по отдельности?
6.13*. Первая часть приведенной ниже распечатки показывает результат оценивания регрессии переменной LGFDHO (логарифм годовых расходов домохозяйств на продукты питания домашнего потребления) на переменные LGEXP (логарифм общих годовых расходов домохозяйств) и LGSIZE (логарифм числа потребителей в домохозяйстве) на основе выборки из 868 домохозяйств в опросе о потребительских расходах за 1995 г. Во второй части представлена регрессия LGFDHOPC (логарифм расходов на продукты питания на душу населения, FDHO/SIZE) на переменную LGEXPPC (логарифм общих расходов на душу населения, ЕХР/SIZE). В третьей части представлена регрессия LGFDHOPC на LGEXPPC и LGSIZE.
. reg LGFDHO LGEXP LGSIZE
|
1) Объясните, почему вторая модель является версией первой модели с ограничением, сформулировав это ограничение.
2) Выполните /"-тест для этого ограничения.
3) Выполните /-тест для этого ограничения.
4) Представьте выводы из анализа результатов оценивания регрессии.
6.14. В своей классической статье М. Нерлов (№г1оуе, 1963) предложил следующую функцию издержек для производства электроэнергии:
где С — совокупные издержки производства; У — выпуск (в киловатт-часах); Рх — цена использования единицы труда; Р2 — цена использования единицы ка
питала; Ръ — цена топлива (все показатели измерены в соответствующих единицах); V — случайный член. Теоретически сумма ценовых эластичностей выпуска должна равняться единице:
и, следовательно, функцию издержек можно переписать как
V. |
уА. |
кА;
Два представленных варианта функции издержек были оценены Нерловом для выборки из 29 компаний среднего размера, и были получены следующие результаты (в скобках приведены стандартные ошибки):
logC = -4,93 + 0,94 log У+0,31 log Р] -0,26 log Р2 +0,44 log Р3; RSS = 0,336;
(1,62) (0,11) (0,23) (0,29) (0,07)
" С Р Р
logy =-6,55 +0,91 log У+0,51 logy +0,09 logy; RSS = 0,364.
3 (0,16) (0,11) (0,23) 3 (0,19) 3 Сравните результаты оценивания двух уравнений регрессии и выполните тест на значимость ограничения.
Еще по теме 6.5.Проверка линейного ограничения:
- 6.5. Проверка линейного ограничения
- § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
- 1.7. Общие причины ограниченного применения бизнес-планирования и ограничения при формировании стратегий
- Линейная организационная структура
- 10.1. Линейная вероятностная модель
- § 16.1. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ
- Линейная организационная структура
- § 16.8. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ В ЛИНЕЙНОМ РЕГРЕССИОННОМ АНАЛИЗЕ
- 4.5. Сравнение линейной и логарифмической моделей
- ЛИНЕЙНАЯ И ЦИКЛИЧЕСКАЯ МОДЕЛИ В ПОЛИТИЧЕСКОМ ПРОГНОЗИРОВАНИИ
- Модели линейного программирования
- S 16.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ
- ЛИНЕЙНЫЙ СПОСОБ НАЧИСЛЕНИЯ АМОРТИЗАЦИИ
- Линейный способ начисления амортизации
- 27. ОСОБЕННОСТИ ЛИНЕЙНО-ФУНКЦИОНАЛЬНЫХ СТРУКТУР
- Кусочно-линейные агрегаты (КЛА).
- 1.1.Модель парной линейной регрессии
- 2.1. Модель парной линейной регрессии
- § 16.6. ИСПЫТАНИЕ ГИПОТЕЗЫ ДЛЯ ОЦЕНКИ ЛИНЕЙНОСТИ СВЯЗИ