5.1. Пример использования фиктивной переменной
1. Исследуется зависимость между продолжительностью образования и размером заработка. В выборке представлены как мужчины, так и женщины. Снача.~; выясним, обусловливает ли пол респондента различие в результатах.
2. Исследуется зависимость между размером дохода и потреблением в Бельгии Выборка включает как франкоговорящие семьи, так и семьи, говорящие пс- фламандски. Выясним, имеет ли это этническое различие существенное значе ние.
3. Имеются данные о темпах прироста среднедушевого ВВП и о зарубежной экономической помощи в расчете на душу населения по группе развивающихся стран, из которых одни являются демократическими, а другие — нет. Проверни зависит ли влияние, оказываемое внешней помощью на экономический росф от формы правления.
В каждом из этих примеров одним из возможных решений было бы оценивание о~- дельных регрессий для двух указанных категорий с последующим выяснениеи различаются ли полученные коэффициенты. Другой возможный подход к решена: состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения так называемой фиктивной переменной. Второй подход имеет два вал ных преимущества: во-первых, имеется простой способ проверки, является ли воздействие качественного фактора значимым; во-вторых, при условии выполнена; определенных предположений регрессионные оценки оказываются более эффе« тивными.
Мы проиллюстрируем метод использования фиктивных переменных Ні примере изучения зависимости затрат на работу средней школы от числа учащихся в ней и от типа школы. В качестве начального шага рассмотрим модель
CaST=p, + P2jV+w, (5.1»
где COST — последовательные годовые показатели затрат школы и N— числс обучающихся в ней.
При оценивании регрессии для выборки из 74 средню школ в Шанхае в середине 1980-х гг. (детали приведены в Приложении В) с помощью программы Stata получена распечатка результатов, приведенная г табл. 5.1.
*3 COST N | ||||||
Source | SS | df | MS | Number of obs = F(1,72) Prob > F R-squared = Adj R-squared = Root MSE | 74 46.82 0.0000 0.3940 0.3856 1.1e+05 | |
Model Residual | 5.7974e+11 8.9160e+11 | 1 72 | 5.7974Є+11 1.2383Є+10 | |||
Total | 1.4713e+12 | 73 | 2.0155e+10 | |||
COST | Coef. | Std. Err. | t | P>|t| | [95% Conf. | Interval] |
N | 339.0432 | 49.55144 | 6.842 | 0.000 | 240.2642 | 437.8222 |
_cons | 23953.3 | 27167.96 | 0.882 | 0.381 | -30205.04 | 78111.65 |
Таким образом, мы получаем уравнение регрессии (в скобках приведены стандартные ошибки):
ОЙТ = 24 ООО + 339УУ; Я2 = 0,39, (5.2)
(27 ООО) (50)
где издержки измерены в юанях (в период выборки один юань равнялся примерно 20 американским центам).
Уравнение показывает, что предельные затраты в расчете на одного ученика составляют 339 юаней, а годовые постоянные затраты (администрация и обслуживание) равняются 24 ООО юаням.И это — всего лишь отправная точка исследования. Далее мы займемся изучением влияния типа школы на издержки. Профессиональные школы, ориентированные на подготовку специалистов в определенных профессиях, требуют больших затрат, поскольку для них нужны специализированные мастерские. Эти расчеты можно отразить в модели с помощью двух уравнений:
+ (5.3)
и
С05Т=$\ + (5.4)
где первое уравнение относится к обычным школам, а второе — к профессиональным. В действительности мы здесь полагаем, что постоянные затраты для двух типов школ различаются, в то время как переменные (предельные) затраты у них одинаковые. Это предположение о предельных затратах не слишком правдоподобно, и в свое время мы его ослабим. Пусть 8 есть разность между свободными членами: 5 = (3', - (Зг Тогда (3', = Р1 + 5, и мы можем переписать функцию издержек для профессиональных школ как
С05Г=Р, +8 + Р2ЛГ+М. (5.5)
Эта модель показана на рис. 5.1. Две линии на нем отражают зависимость затрат от числа студентов, без учета случайного члена. Линия для профессиональных школ здесь такая же, как и для обычных школ, за исключением того, что она сдвинута на величину 5.
Данная процедура предназначена для оценивания этого неизвестного фактора сдвига. Перепишем модель в виде
![]() |
COST
MS
p
N (5.- |
Условные обозначения: • Профессиональные школы О Обычные школы
Рисунок 5.1. Функции издержек для обычных и профессиональных школ
COST= р, + 80СС + м>
где ОСС — фиктивная переменная, т.е.
искусственная переменная, приник ющая одно из двух возможных значений (0 и 1). Если ОСС равна нулю, тх функция издержек приобретает вид (5.3), который относится к обычным шк:- лам. Если ОСС равна единице, то функция издержек приобретает вид (5.5. который относится к профессиональным школам. Следовательно, вмесп двух отдельных регрессий для разных типов школ мы можем оценить един>т регрессию для всей выборки. Использование всей выборки в единой регре: сии уменьшает теоретические дисперсии оценок коэффициентов, и это отрг жается в меньших по величине стандартных ошибках. Мы получим также ед* ную оценку р2 вместо двух разных, которые могут противоречить друг др>7% Цена этого — необходимость предположения о совпадении р2 в двух подвь борках. В свое время это предположение будет ослаблено.Данные для первых 10 школ из выборки показаны в табл. 5.2. Заметим, чтх ОСС меняется в зависимости от типа школы. Данные были введены в компьк- терную регрессионную программу, и была оценена множественная регрессю COST от N и ОСС. Мы обращаемся здесь с ОСС как с обычной переменно*, хотя ее значениями являются лишь нули и единицы.
(5" |
Распечатка программы Stata в табл. 5.3 показывает результат оценивание регрессии для полной выборки из 74 школ. В виде уравнения мы получае» (в скобках — стандартные ошибки):
COST = -34 ООО + 133 ООООСС +3317V; Я2 = 0,62. (24 000) (21 000) (40)
Приравнивая ОСС к нулю или единице соответственно, мы получаем неявно записанные функции издержек для двух типов школ:
Таблица 5.2. Текущие расходы (COST) и численность учащихся (N) по типам школ (ОСС)
|
Обычные школы:
COST = -34 000 + 331Ж (5.8)
Профессиональные школы:
ОЖГ = -34 ООО + 133 ООО + 331ЛГ= 99 ООО + 33 Ш (5.9)
Эта регрессия показывает, что предельные издержки в расчете на одного студента в год равны 331 юаню, а ежегодные постоянные издержки обычной школы составляют 34 ООО юаней. Очевидно, отрицательный свободный член лишен всякого смысла, и модель в чем-то неверно специфицирована. Далее мы вернемся к этому. Коэффициент 133 ООО при фиктивной переменной представляет собой оценку дополнительной величины постоянных издержек для профессиональной школы. Предельные издержки для профессиональных и обычных школ совпадают, как это и должно быть для данной спецификации модели. Рисунок 5.2 отражает эти данные и функции издержек, полученные в результате оценивания регрессии.
Таблица 5.3
^ I мне в эконометрику 179 |
![]() Условные обозначения: • Профессиональные школы О Обычные школы Рисунок 5.2. Функции издержек для обычных и профессиональных школ в Шанхае |
Стандартные ошибки и проверка гипотез
Помимо оценок коэффициентов, результаты оценивания регрессии вклк- чают стандартные ошибки и различные диагностические статистики. Выпо." ним /-тест для коэффициента при фиктивной переменной. Наша нулевая г* потеза есть в данном случае #0: Ь = 0, а альтернативная гипотеза Я,: ô * В словесной форме нулевая гипотеза здесь заключается в совпадении посто янных издержек для двух типов школ. Значение /-статистики здесь равно 6.4*; и нулевая гипотеза отвергается при уровне значимости 0,1%. Мы также може* выполнить обычные /-тесты для остальных коэффициентов. Значение /-CTe- тистики для коэффициента при N равно 8,34, и мы можем заключить, что прк дельные издержки значимо отличаются от нуля. Для свободного члена /-сте тистика равна -1,43, и здесь мы не отвергаем нулевую гипотезу #0: (3j = ; Таким образом, одно из возможных объяснений бессмысленного отрицательного значения постоянных издержек для обычных школ может состоять в tov что они не имеют постоянных издержек вообще, и наша оценка есть прост: случайное число. Более реалистичен вариант гипотезы о том, что (3j положительно, но мало (как можно видеть, 95%-ный доверительный интервал содержит положительные числа), а отрицательная оценка обусловлена поведение* случайного члена. И, как отмечалось ранее, еще одно возможное объяснены состоит в неверной спецификации модели.
Упражнения
5.1. Влияет ли пол студента на индивидуальную продолжительность обучения? Hi основе набора данных EAEF оцените регрессионную зависимость S от ASVAK SM, SFn MALE (фиктивной переменной, которая равна единице для респондентов мужского пола и нулю — для женского). Интерпретируйте коэффициенты »
выполните /-тесты. Есть ли какие-то подтверждения того, что продолжительность обучения мужчин отличается от продолжительности обучения женщин?
2*. Ниже приведена распечатка результатов программы Stata для регрессии между весом и ростом, вначале — для линейной спецификации, а затем — для двойной логарифмической (в обоих случаях с включением определенной в упражнении 5.1 фиктивной переменной MALE). Дайте интерпретацию полученных уравнений и выполните соответствующие статистические тесты. Информация для интерпретации коэффициентов при фиктивных переменных в логарифмических регрессиях приведена во Вставке 5.1.
. reg WEIGHT85 HEIGHT MALE
|
. reg LGWEIGHT LGHEIGHT MALE
|
Используя набор данных EAEF, оцените регрессионную зависимость LGEARNcr. S, EXP и MALE. Интерпретируйте коэффициенты и выполните /-тесты. Информация для интерпретации коэффициентов при фиктивных переменных в полу логарифмических регрессиях приведена во Вставке 5.1.
Еще по теме 5.1. Пример использования фиктивной переменной:
- 9.1. Иллюстрация использования фиктивной переменной
- ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- 9.3. Множественные совокупности фиктивных переменных
- 9.4. Фиктивные переменные для коэффициента наклона
- 5.3. Фиктивные переменные для коэффициента наклона
- 9. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- 5.ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
- 5.2.Обобщение для фиктивных переменных более чем двух категорий и их нескольких наборов
- 5.Погашение долга с использованием переменных срочных уплат
- Использование данных учета переменных расходов для управления предприятием. Назначение директ-костинга
- Пример составления плана использования Интернет
- Примеры использования метода дисконтирования денежных потоков