9.4. Фиктивные переменные для коэффициента наклона
Для объяснения его использования вернемся к примеру с оцениванием регрессионной зависимости веса при рождении (у) от интенсивности курения матери (х) и фиктивной переменной числа родов в прошлом (В = 1, если мать рожала раньше; В = 0, если мать раньше не рожала):
>> = а + 6/) + рх + и. (9.6)
В этой формулировке модели мы предполагаем, что воздействие курения матери на вес новорожденного одинаково, независимо от того, рожала ли мать раньше.
Предположим, что теперь мы добавим в уравнение член уВх — произведение В и х с коэффициентом у.
у = а + ЬВ + рх + уВх + и. (9.33)
Это можно переписать как
у = а + 6/) + (Р + уВ)х + и. (9.34)
Если В = 0, то коэффициент при х:, как и раньше, равен р. Если В = 1, то коэффициент приобретает вид (Р + у). Поэтому величина у может рассматриваться как разность между коэффициентом при показателе интенсивности курения для матерей, которые рожали раньше, и коэффициентом при показателе интенсивности курения для матерей, которые раньше не рожали.
Коэффициент у можно оценить, используя уравнение (9.33), где >> связан регрессионной зависимостью с Д х и Вх; показатель Вх, представляющий собой фиктивную переменную для коэффициента наклона, рассматривается как третья и отдельная объясняющая переменная.
В табл. 9.6 показано, как вычисляется переменная Вх по 20 наблюдениям, приведенным в табл. 9.1.Оценивание регрессии по данным выборки о 964 родах дает результат:
р = 3363 + 143/) - 4,Ох - 8,1/)х; Я2 = 0,036. (9.35)
(с.о.) (18) (29) (2,8) (4,1)
Положив В = 0 или /)= 1, можно вывести два частных соотношения:
у = 3363 - 4,Ох (для первенцев); (9.36)
у = 3506 - 12,1х (для детей, рожденных не первыми). (9.37)
Результат оценивания регрессии показывает, что снижение веса новорожденного, связанное с курением матери в период беременности, значительно
Таблица 9.6
|
больше для матерей, которые рожали раньше, чем для матерей, которые раньше не рожали (12,1 г на каждую сигарету в день против 4,0 г), и что различие значимо при уровне значимости в 5%.
Взаимодействие между фиктивными переменными
Мы до сих пор предполагали, что воздействия качественных характеристик на зависимую переменную являются независимыми друг от друга.
Например, в регрессии (9.30) предполагалось, что различие в весе при рождении для детей, родившихся у замужних и одиноких матерей, не зависит от того, рожала ли мать раньше, и наоборот. Мы можем сделать это предположение менее строгим за счет ввода фиктивных переменных взаимодействия, которые определяются по аналогии с фиктивными переменными для коэффициента наклона и имеют такое же назначение.В рассматриваемом случае мы могли бы ввести фиктивную переменную взаимодействия ((/МП), которая определяется как произведение им и Б и которая, следовательно, равна единице для одиноких матерей, рожавших раньше, и равна нулю для трех других комбинаций. Модель регрессии имеет вид:
у = а + 62) + у им + хиМй + р х + и, (9.38)
и ее можно переписать либо как
у = а + (5 + X иМ)В + у им + р* + и, (9.39)
либо как
у = а + 8 Д + (у + ХО) им + рх + и. (9.40)
Поэтому коэффициент X можно по выбору (оба альтернативных варианта эк-
Бивалентны) рассматривать либо как прирост коэффициента при фиктивной переменной числа предшествующих родов, если мать является одинокой, либо как прирост коэффициента для одиноких матерей, если мать рожала раньше.
Оценивание регрессии с использованием данных о 964 родах дает следующий результат:
у = 3,385 + 113/)- M1UM — 12UMD— 7,3х; 2 = 0,041. (9.41)
(с.о.) (18) (28) (52) (115) (2,1)
Мы видим, что коэффициент при фиктивной переменной взаимодействия значимо не отличается от нуля при уровне значимости в 5%, и делаем вывод, что может не быть взаимодействия между переменной числа родов в прошлом и переменной для одиноких матерей. Однако следует отметить, что в выборке было только 16 одиноких матерей, которые рожали не в первый раз, и, следовательно, коэффициент при UMD имеет очень большую стандартную ошибку. Этот пример дает предупреждение о том, что даже если выборка большая, но имеется несколько совокупностей фиктивных переменных, то число наблюдений в отдельных подкатегориях может легко оказаться очень малым, и, следовательно, проведение удовлетворительных проверок гипотез может быть затруднено.
Упражнения
9.9. При использовании выборки, включающей данные о 964 родах, оценена регрессионная зависимость веса новорожденных (у) от интенсивности курения матери (х), фиктивной переменной (D), характеризующейся числом предыдущих родов, фиктивной переменной (М) пола ребенка (определенной как в упражнении 9.2) и фиктивной переменной для коэффициента наклона (Л/х), определяемой как произведение Л/и х (в скобках указаны стандартные ошибки):
£ = 3312+ 124D+ 108Л/ — 10,5х + 5JMx\ R2 = 0,057.
(23) (26) (28) (2,9) (4,1)
Прокомментируйте этот результат.
9.10. Та же самая регрессия повторно оценена с включением фиктивной переменной взаимодействия (DM), определяемой как произведение D и Л/(в скобках указаны стандартные ошибки):
у = 3304 + 144/)+ 123М - 39DM - 10,6х + 5,9х; R2 = 0,058.
(26) (38) (35) (53) (2,9) (4,1)
Прокомментируйте этот результат.
…
Еще по теме 9.4. Фиктивные переменные для коэффициента наклона:
- 5.3. Фиктивные переменные для коэффициента наклона
- 5.2.Обобщение для фиктивных переменных более чем двух категорий и их нескольких наборов
- 12. Взаимосвязь между Г-критерием общего качества регрессии и критерием для коэффициента наклона в парном регрессионном анализе
- ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- 9.3. Множественные совокупности фиктивных переменных
- 5.1. Пример использования фиктивной переменной
- 9.1. Иллюстрация использования фиктивной переменной
- 9. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- 5.ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- Взаимосвязь моделей АБ-АБ и 1Б-ЬМ. Основные переменные и уравнения модели 1Б-1*М. Вывод кривых /5 и ЬМ. Наклон и сдвиг кривых 1Б и ЬМ. Равновесие в модели 1Б-ЬМ
- § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
- Два разложения для зависимой переменной
- 8.3. Понятия для целей главы 26.3 Налогового кодекса РФ 8.3.1. Коэффициент К1
- Пять главных коэффициентов для увеличения прибыльности
- § 16.3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА. КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
- ПРИМЕРЫ КОЭФФИЦИЕНТОВ, ИСПОЛЬЗУЕМЫХ ДЛЯ КОНТРОЛЯ ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ ПРОЕКТА