<<
>>

5.1. Пример использования фиктивной переменной

Часто случается так, что некоторые факторы, которые вы хотели бы ввести в ре- рессионную модель, являются качественными по своей природе и, следовательк не измеряются в числовой шкале.
Приведем несколько примеров.

1. Исследуется зависимость между продолжительностью образования и разме­ром заработка. В выборке представлены как мужчины, так и женщины. Снача.~; выясним, обусловливает ли пол респондента различие в результатах.

2. Исследуется зависимость между размером дохода и потреблением в Бельгии Выборка включает как франкоговорящие семьи, так и семьи, говорящие пс- фламандски. Выясним, имеет ли это этническое различие существенное значе ние.

3. Имеются данные о темпах прироста среднедушевого ВВП и о зарубежной эко­номической помощи в расчете на душу населения по группе развивающихся стран, из которых одни являются демократическими, а другие — нет. Проверни зависит ли влияние, оказываемое внешней помощью на экономический росф от формы правления.

В каждом из этих примеров одним из возможных решений было бы оценивание о~- дельных регрессий для двух указанных категорий с последующим выяснениеи различаются ли полученные коэффициенты. Другой возможный подход к решена: состоит в оценивании единой регрессии с использованием всей совокупности на­блюдений и измерением степени влияния качественного фактора посредством введения так называемой фиктивной переменной. Второй подход имеет два вал ных преимущества: во-первых, имеется простой способ проверки, является ли воз­действие качественного фактора значимым; во-вторых, при условии выполнена; определенных предположений регрессионные оценки оказываются более эффе« тивными.

Мы проиллюстрируем метод использования фиктивных переменных Ні примере изучения зависимости затрат на работу средней школы от числа уча­щихся в ней и от типа школы. В качестве начального шага рассмотрим мо­дель

CaST=p, + P2jV+w, (5.1»

где COST — последовательные годовые показатели затрат школы и N— числс обучающихся в ней.

При оценивании регрессии для выборки из 74 средню школ в Шанхае в середине 1980-х гг. (детали приведены в Приложении В) с помощью программы Stata получена распечатка результатов, приведенная г табл. 5.1.

*3 COST N
Source SS df MS Number of obs =

F(1,72)

Prob > F

R-squared = Adj R-squared = Root MSE

74

46.82 0.0000 0.3940 0.3856 1.1e+05

Model Residual 5.7974e+11 8.9160e+11 1

72

5.7974Є+11 1.2383Є+10
Total 1.4713e+12 73 2.0155e+10
COST Coef. Std. Err. t P>|t| [95% Conf. Interval]
N 339.0432 49.55144 6.842 0.000 240.2642 437.8222
_cons 23953.3 27167.96 0.882 0.381 -30205.04 78111.65

Таким образом, мы получаем уравнение регрессии (в скобках приведены стандартные ошибки):

ОЙТ = 24 ООО + 339УУ; Я2 = 0,39, (5.2)

(27 ООО) (50)

где издержки измерены в юанях (в период выборки один юань равнялся при­мерно 20 американским центам).

Уравнение показывает, что предельные за­траты в расчете на одного ученика составляют 339 юаней, а годовые постоян­ные затраты (администрация и обслуживание) равняются 24 ООО юаням.

И это — всего лишь отправная точка исследования. Далее мы займемся изучением влияния типа школы на издержки. Профессиональные школы, ориентированные на подготовку специалистов в определенных профессиях, требуют больших затрат, поскольку для них нужны специализированные мас­терские. Эти расчеты можно отразить в модели с помощью двух уравнений:

+ (5.3)

и

С05Т=$\ + (5.4)

где первое уравнение относится к обычным школам, а второе — к профессио­нальным. В действительности мы здесь полагаем, что постоянные затраты для двух типов школ различаются, в то время как переменные (предельные) затра­ты у них одинаковые. Это предположение о предельных затратах не слишком правдоподобно, и в свое время мы его ослабим. Пусть 8 есть разность между свободными членами: 5 = (3', - (Зг Тогда (3', = Р1 + 5, и мы можем переписать функцию издержек для профессиональных школ как

С05Г=Р, +8 + Р2ЛГ+М. (5.5)

Эта модель показана на рис. 5.1. Две линии на нем отражают зависимость затрат от числа студентов, без учета случайного члена. Линия для профессио­нальных школ здесь такая же, как и для обычных школ, за исключением того, что она сдвинута на величину 5.

Данная процедура предназначена для оценивания этого неизвестного фак­тора сдвига. Перепишем модель в виде

COST

MS

p

N

(5.-

Условные обозначения: • Профессиональные школы О Обычные школы

Рисунок 5.1. Функции издержек для обычных и профессиональных школ

COST= р, + 80СС + м>

где ОСС — фиктивная переменная, т.е.

искусственная переменная, приник ющая одно из двух возможных значений (0 и 1). Если ОСС равна нулю, тх функция издержек приобретает вид (5.3), который относится к обычным шк:- лам. Если ОСС равна единице, то функция издержек приобретает вид (5.5. который относится к профессиональным школам. Следовательно, вмесп двух отдельных регрессий для разных типов школ мы можем оценить един>т регрессию для всей выборки. Использование всей выборки в единой регре: сии уменьшает теоретические дисперсии оценок коэффициентов, и это отрг жается в меньших по величине стандартных ошибках. Мы получим также ед* ную оценку р2 вместо двух разных, которые могут противоречить друг др>7% Цена этого — необходимость предположения о совпадении р2 в двух подвь борках. В свое время это предположение будет ослаблено.

Данные для первых 10 школ из выборки показаны в табл. 5.2. Заметим, чтх ОСС меняется в зависимости от типа школы. Данные были введены в компьк- терную регрессионную программу, и была оценена множественная регрессю COST от N и ОСС. Мы обращаемся здесь с ОСС как с обычной переменно*, хотя ее значениями являются лишь нули и единицы.

(5"

Распечатка программы Stata в табл. 5.3 показывает результат оценивание регрессии для полной выборки из 74 школ. В виде уравнения мы получае» (в скобках — стандартные ошибки):

COST = -34 ООО + 133 ООООСС +3317V; Я2 = 0,62. (24 000) (21 000) (40)

Приравнивая ОСС к нулю или единице соответственно, мы получаем неяв­но записанные функции издержек для двух типов школ:

Таблица 5.2. Текущие расходы (COST) и численность учащихся (N) по типам школ (ОСС)
Школа Тип COST N ОСС
1 Профессиональная 345 ООО 623 1
2 Профессиональная 537 ООО 653 1
3 Обычная 170 000 400 0
4 Профессиональная 526 000 663 1
5 Обычная 100 000 563 0
6 Обычная 28 000 236 0
7 Обычная 160 000 307 0
8 Профессиональная 45 000 173 1
9 Профессиональная 120 000 146 1
10 Профессиональная 61 000 99 1

Обычные школы:

COST = -34 000 + 331Ж (5.8)

Профессиональные школы:

ОЖГ = -34 ООО + 133 ООО + 331ЛГ= 99 ООО + 33 Ш (5.9)

Эта регрессия показывает, что предельные издержки в расчете на одного студента в год равны 331 юаню, а ежегодные постоянные издержки обычной школы составляют 34 ООО юаней. Очевидно, отрицательный свободный член лишен всякого смысла, и модель в чем-то неверно специфицирована. Далее мы вернемся к этому. Коэффициент 133 ООО при фиктивной переменной пред­ставляет собой оценку дополнительной величины постоянных издержек для профессиональной школы. Предельные издержки для профессиональных и обычных школ совпадают, как это и должно быть для данной спецификации модели. Рисунок 5.2 отражает эти данные и функции издержек, полученные в результате оценивания регрессии.

Таблица 5.3
«з COST N ОСС
Source SS df MS Number of obs =

F(2,71)

Prob > F

R-squared

Adj R-squared =

Root MSE

74

56.86

0.0000

0.6156

0.6048

89248

Model Residual 9.0582e+11 5.6553e+11 2 71 4.5291e+11 7.9652e+09
Total 1.4713e+12 73 2.0155e+10
COST Coef. Std. Err. t P>|t| [95% Conf. Interval]
N 331.4493 39.75844 8.337 0.000 252.1732 410.7254
ОСС 133259.1 20827.59 6.398 0.000 91730.06 174788.1
_cons -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61

^ I мне в эконометрику

179

Условные обозначения: • Профессиональные школы О Обычные школы

Рисунок 5.2. Функции издержек для обычных и профессиональных школ в Шанхае

Стандартные ошибки и проверка гипотез

Помимо оценок коэффициентов, результаты оценивания регрессии вклк- чают стандартные ошибки и различные диагностические статистики. Выпо." ним /-тест для коэффициента при фиктивной переменной. Наша нулевая г* потеза есть в данном случае #0: Ь = 0, а альтернативная гипотеза Я,: ô * В словесной форме нулевая гипотеза здесь заключается в совпадении посто янных издержек для двух типов школ. Значение /-статистики здесь равно 6.4*; и нулевая гипотеза отвергается при уровне значимости 0,1%. Мы также може* выполнить обычные /-тесты для остальных коэффициентов. Значение /-CTe- тистики для коэффициента при N равно 8,34, и мы можем заключить, что прк дельные издержки значимо отличаются от нуля. Для свободного члена /-сте тистика равна -1,43, и здесь мы не отвергаем нулевую гипотезу #0: (3j = ; Таким образом, одно из возможных объяснений бессмысленного отрицатель­ного значения постоянных издержек для обычных школ может состоять в tov что они не имеют постоянных издержек вообще, и наша оценка есть прост: случайное число. Более реалистичен вариант гипотезы о том, что (3j положи­тельно, но мало (как можно видеть, 95%-ный доверительный интервал содер­жит положительные числа), а отрицательная оценка обусловлена поведение* случайного члена. И, как отмечалось ранее, еще одно возможное объяснены состоит в неверной спецификации модели.

Упражнения

5.1. Влияет ли пол студента на индивидуальную продолжительность обучения? Hi основе набора данных EAEF оцените регрессионную зависимость S от ASVAK SM, SFn MALE (фиктивной переменной, которая равна единице для респонден­тов мужского пола и нулю — для женского). Интерпретируйте коэффициенты »

выполните /-тесты. Есть ли какие-то подтверждения того, что продолжитель­ность обучения мужчин отличается от продолжительности обучения женщин?

2*. Ниже приведена распечатка результатов программы Stata для регрессии между весом и ростом, вначале — для линейной спецификации, а затем — для двойной логарифмической (в обоих случаях с включением определенной в упражнении 5.1 фиктивной переменной MALE). Дайте интерпретацию полученных уравне­ний и выполните соответствующие статистические тесты. Информация для ин­терпретации коэффициентов при фиктивных переменных в логарифмических регрессиях приведена во Вставке 5.1.

. reg WEIGHT85 HEIGHT MALE
Source SS df MS Number of obs = 540
F(2,537) Prob > F 191.56 0.0000
Model 273040.775 2 136520.388
Residual 382702.973 537 712.668479 R-squared = Adj R-squared = Root MSE 0.4164 0.4142
Total 655743.748 539 1216.59322 26.696
WEIGHT85 Coef. Std. Err. t P>|t| [95% Conf. Interval]
HEIGHT 4.006225 .3971644 10.09 0.000 3.226039 4.786412
MALE 13.7615 3.363568 4.09 0.000 7.154131 20.36886
cons -121.2502 25.70087 -4.72 0.000 -171.7367 -70.76363

. reg LGWEIGHT LGHEIGHT MALE
Source SS df MS Number of obs = 540
F(2,537) Prob > F 224.03 O.OOOC
Model 11.3390838 2 5.66954189
Residual 13.5897932 537 .025306877 R-squared = Adj R-squared = 0.4549 0.4526
Total 24.928877 539 .046250236 Root MSE .1590:
LGWEIGHT Coef. Std. Err. t P>|t| [95% Conf. Interval]
LGHEIGHT 1.675851 .1581459 10.60 0.000 1.36519 1.98651•
MALE .0975722 .0199191 4.90 0.000 .0584432 .1367011
cons -2.077515 .6590635 -3.15 0.002 -3.372173 -.78285c

Используя набор данных EAEF, оцените регрессионную зависимость LGEARNcr. S, EXP и MALE. Интерпретируйте коэффициенты и выполните /-тесты. Инфор­мация для интерпретации коэффициентов при фиктивных переменных в полу логарифмических регрессиях приведена во Вставке 5.1.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 5.1. Пример использования фиктивной переменной:

  1. 9.1. Иллюстрация использования фиктивной переменной
  2. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  3. 9.3. Множественные совокупности фиктивных переменных
  4. 9.4. Фиктивные переменные для коэффициента наклона
  5. 5.3. Фиктивные переменные для коэффициента наклона
  6. 9. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  7. 5.ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
  8. 5.2.Обобщение для фиктивных переменных более чем двух категорий и их нескольких наборов
  9. 5.Погашение долга с использованием переменных срочных уплат
  10. Использование данных учета переменных расходов для управления предприятием. Назначение директ-костинга
  11. Пример составления плана использования Интернет
  12. Примеры использования метода дисконтирования денежных потоков