<<
>>

9.4. Фиктивные переменные для коэффициента наклона

Мы пока предположили, что качественные переменные, введенные в урав­нение регрессии, отвечают только за сдвиги в значении постоянного члена в уравнении регрессии. Мы неявно предположили, что наклон линии регрессии одинаков для каждой категории качественных переменных.
Это предположение не обязательно верно, и теперь мы рассмотрим, как сделать его менее строгим и проверить, воспользовавшись инструментом, известным как фиктивная пе­ременная для коэффициента наклона (иногда называемая также фиктивной пе­ременной взаимодействия).

Для объяснения его использования вернемся к примеру с оцениванием рег­рессионной зависимости веса при рождении (у) от интенсивности курения матери (х) и фиктивной переменной числа родов в прошлом (В = 1, если мать рожала раньше; В = 0, если мать раньше не рожала):

>> = а + 6/) + рх + и. (9.6)

В этой формулировке модели мы предполагаем, что воздействие курения мате­ри на вес новорожденного одинаково, независимо от того, рожала ли мать рань­ше.

Предположим, что теперь мы добавим в уравнение член уВх — произведение В и х с коэффициентом у.

у = а + ЬВ + рх + уВх + и. (9.33)

Это можно переписать как

у = а + 6/) + (Р + уВ)х + и. (9.34)

Если В = 0, то коэффициент при х:, как и раньше, равен р. Если В = 1, то коэффициент приобретает вид (Р + у). Поэтому величина у мо­жет рассматриваться как разность между коэффициентом при показателе ин­тенсивности курения для матерей, которые рожали раньше, и коэффициентом при показателе интенсивности курения для матерей, которые раньше не рожа­ли.

Коэффициент у можно оценить, используя уравнение (9.33), где >> связан рег­рессионной зависимостью с Д х и Вх; показатель Вх, представляющий собой фиктивную переменную для коэффициента наклона, рассматривается как третья и отдельная объясняющая переменная.

В табл. 9.6 показано, как вычис­ляется переменная Вх по 20 наблюдениям, приведенным в табл. 9.1.

Оценивание регрессии по данным выборки о 964 родах дает результат:

р = 3363 + 143/) - 4,Ох - 8,1/)х; Я2 = 0,036. (9.35)

(с.о.) (18) (29) (2,8) (4,1)

Положив В = 0 или /)= 1, можно вывести два частных соотношения:

у = 3363 - 4,Ох (для первенцев); (9.36)

у = 3506 - 12,1х (для детей, рожденных не первыми). (9.37)

Результат оценивания регрессии показывает, что снижение веса новорож­денного, связанное с курением матери в период беременности, значительно

Таблица 9.6
Наблю­дение Первенец? У X й Ох Наблю­дение Первенец? У X й Ох
1 Нет 3520 10 1 10 11 Нет 3210 29 1 29
2 Нет 3460 19 1 19 12 Нет 3290 15 1 15
3 Нет 3000 16 1 16 13 Да 3190 3 0 0
4 Нет 3320 26 1 26 14 Да 3060 12 0 0
5 Нет 3540 4 1 4 15 Да 3270 17 0 0
6 Нет 3310 14 1 14 16 Да 3170 14 0 0
7 Нет 3360 21 1 21 17 Да 3230 18 0 0
8 Нет 3650 10 1 10 18 Да 3700 11 0 0
9 Нет 3150 22 1 22 19 Да 3300 14 0 0
10 Нет 3440 8 1 8 20 Да 3460 9 0 0

больше для матерей, которые рожали раньше, чем для матерей, которые рань­ше не рожали (12,1 г на каждую сигарету в день против 4,0 г), и что различие значимо при уровне значимости в 5%.

Взаимодействие между фиктивными переменными

Мы до сих пор предполагали, что воздействия качественных характерис­тик на зависимую переменную являются независимыми друг от друга.

Напри­мер, в регрессии (9.30) предполагалось, что различие в весе при рождении для детей, родившихся у замужних и одиноких матерей, не зависит от того, рожала ли мать раньше, и наоборот. Мы можем сделать это предположение менее строгим за счет ввода фиктивных переменных взаимодействия, которые определяются по аналогии с фиктивными переменными для коэффициента наклона и имеют такое же назначение.

В рассматриваемом случае мы могли бы ввести фиктивную переменную вза­имодействия ((/МП), которая определяется как произведение им и Б и кото­рая, следовательно, равна единице для одиноких матерей, рожавших раньше, и равна нулю для трех других комбинаций. Модель регрессии имеет вид:

у = а + 62) + у им + хиМй + р х + и, (9.38)

и ее можно переписать либо как

у = а + (5 + X иМ)В + у им + р* + и, (9.39)

либо как

у = а + 8 Д + (у + ХО) им + рх + и. (9.40)

Поэтому коэффициент X можно по выбору (оба альтернативных варианта эк-

Бивалентны) рассматривать либо как прирост коэффициента при фиктивной переменной числа предшествующих родов, если мать является одинокой, либо как прирост коэффициента для одиноких матерей, если мать рожала раньше.

Оценивание регрессии с использованием данных о 964 родах дает следую­щий результат:

у = 3,385 + 113/)- M1UM — 12UMD— 7,3х; 2 = 0,041. (9.41)

(с.о.) (18) (28) (52) (115) (2,1)

Мы видим, что коэффициент при фиктивной переменной взаимодействия значимо не отличается от нуля при уровне значимости в 5%, и делаем вывод, что может не быть взаимодействия между переменной числа родов в прошлом и переменной для одиноких матерей. Однако следует отметить, что в выборке было только 16 одиноких матерей, которые рожали не в первый раз, и, сле­довательно, коэффициент при UMD имеет очень большую стандартную ошиб­ку. Этот пример дает предупреждение о том, что даже если выборка большая, но имеется несколько совокупностей фиктивных переменных, то число на­блюдений в отдельных подкатегориях может легко оказаться очень малым, и, следовательно, проведение удовлетворительных проверок гипотез может быть затруднено.

Упражнения

9.9. При использовании выборки, включающей данные о 964 родах, оце­нена регрессионная зависимость веса новорожденных (у) от интенсивности курения матери (х), фиктивной переменной (D), характеризующейся числом предыдущих родов, фиктивной переменной (М) пола ребенка (определен­ной как в упражнении 9.2) и фиктивной переменной для коэффициента наклона (Л/х), определяемой как произведение Л/и х (в скобках указаны стан­дартные ошибки):

£ = 3312+ 124D+ 108Л/ — 10,5х + 5JMx\ R2 = 0,057.

(23) (26) (28) (2,9) (4,1)

Прокомментируйте этот результат.

9.10. Та же самая регрессия повторно оценена с включением фиктивной пе­ременной взаимодействия (DM), определяемой как произведение D и Л/(в скоб­ках указаны стандартные ошибки):

у = 3304 + 144/)+ 123М - 39DM - 10,6х + 5,9х; R2 = 0,058.

(26) (38) (35) (53) (2,9) (4,1)

Прокомментируйте этот результат.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 9.4. Фиктивные переменные для коэффициента наклона:

  1. 5.3. Фиктивные переменные для коэффициента наклона
  2. 5.2.Обобщение для фиктивных переменных более чем двух категорий и их нескольких наборов
  3. 12. Взаимосвязь между Г-критерием общего качества регрессии и критерием для коэффициента наклона в парном регрессионном анализе
  4. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  5. 9.3. Множественные совокупности фиктивных переменных
  6. 5.1. Пример использования фиктивной переменной
  7. 9.1. Иллюстрация использования фиктивной переменной
  8. 9. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  9. 5.ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  10. Взаимосвязь моделей АБ-АБ и 1Б-ЬМ. Основные переменные и уравнения модели 1Б-1*М. Вывод кривых /5 и ЬМ. Наклон и сдвиг кривых 1Б и ЬМ. Равновесие в модели 1Б-ЬМ
  11. § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
  12. Два разложения для зависимой переменной
  13. 8.3. Понятия для целей главы 26.3 Налогового кодекса РФ 8.3.1. Коэффициент К1
  14. Пять главных коэффициентов для увеличения прибыльности
  15. § 16.3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА. КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
  16. ПРИМЕРЫ КОЭФФИЦИЕНТОВ, ИСПОЛЬЗУЕМЫХ ДЛЯ КОНТРОЛЯ ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ ПРОЕКТА