<<
>>

10.1. Линейная вероятностная модель

Экономистов часто интересуют факторы, определяющие принятие решений инди­видами или фирмами. Приведем следующие примеры:

• Почему одни люди поступают в вузы, а другие — нет?

• Почему одни женщины работают или ищут работу, а другие — нет?

• Почему одни люди покупают жилье, а другие — арендуют?

• Почему одни люди меняют место жительства, а другие — нет?

Модели, разработанные для описания подобных ситуаций, носят название моде­лей двоичного выбора, или качественного отклика, с переменной выхода, которую мы обозначим У, принимающей значение 1, если данное событие произошло, иО — в противном случае. Существуют и модели с более чем одним исходом, но мы огра­ничим наше внимание моделями с двоичным выбором. Модели двоичного выбора, за исключением линейной вероятностной модели, оцениваются с помощью метода максимума правдоподобия. В конце данной главы мы рассмотрим этот вопрос на уровне вводного курса.

Простейшей моделью двоичного выбора является линейная вероятностная модель, где, как видно из названия, вероятность происходящего событияр яв­ляется линейной функцией объясняющей переменной (переменных):

pi=p(Yi=\) = V1 + V2Xi. (10.1)

Графически такая взаимосвязь показана на рис. 10.1 для случая единствен­ной объясняющей переменной. Конечно, величина р является ненаблюда­емой. Данные можно получить лишь по зависимой переменной Y. В линейной вероятностной модели она напоминает фиктивную переменную в качестве за­висимой переменной.

В качестве иллюстрации рассмотрим факторы, определяющие окончание средней школы. Определим переменную GRAD, которая равна единице для


индивида, окончившего среднюю школу, и нулю — в противном случае, и оце­ним ее регрессионную зависимость GRAD от переменной ASVABC — совокуп­ного результата тестирования познавательных способностей. Приводимая в табл. 10.1 распечатка показывает результат оценивания этой линейной веро­ятностной модели на основе набора данных EAEF 21.

Таблица 10.1

.reg GRAD ASVABC

Source SS df MS Number of obs = 540
F(1,538) 49.59
Model 2.46607893 1 2.46607893 Prob > F 0.0000
Residual 26.7542914 538 .049729166 R-squared 0.0844
Adj R-squared = 0.0827
Total 29.2203704 539 .05421219 Root MSE .223
GRAD Coef. Std.
Err.
t P>|t| [95% Conf. Interval]
ASVABC .0070697 .0010039 7.04 0.000 .0050976 .0090419
_cons .5794710 .0524502 10.05 0.000 .4764387 .6825035

Результат оценивания регрессии говорит о том, что вероятность окончить среднюю школу возрастает на 0,007, т.е. на 0,7 процентных пункта, при каж­дом увеличении показателя АБУАВС на один балл. Переменная АЯУАВС масш­табирована таким образом, что ее среднее равно 50, а стандартное отклоне­ние — 10. Поэтому увеличение результата тестирования на одно стандартное отклонение увеличивает вероятность окончания средней школы на 7 про­центных пунктов. Величина свободного члена говорит о том, что если бы АБУАВС равнялась нулю, то вероятность окончания средней школы составила бы 58%. Однако величина АБУАВС масштабирована так, что ее минимум со­ставляет около 20, так что было бы сомнительно принять подобную интерпре­тацию.

К сожалению, линейная вероятностная модель имеет серьезные недостат­ки. Во-первых, имеются проблемы, связанные со случайным членом. Как обычно, величина зависимой переменной Уі в г-м наблюдении содержит нестохастическую и случайную составляющие. Нестохастическая составля­ющая зависит от Хі и от параметров модели и равна математическому ожида­нию У1 при заданном Хп Е{УІ \ X). Случайная составляющая — это случайный член. Итак,

У і -Е{Уі\ X) + иг (10.2)

Нетрудно рассчитать составляющую Е(УІ \ Х^), ожидаемое значение У^ при данном X., поскольку У может принимать лишь два значения. Она равняется единице с вероятностьюрі и нулю — с вероятностью (1 -р)\

Щ) = 1 хр. + О х (1 -р.) =р. = р1 + р^.. (10.3)

Следовательно, математическое ожидание зависимой переменной в на­блюдении / равно Р, + р2Л;.. Это означает, что модель можно переписать как

^=Р1 + Р2^. + М,.. (10.4)

Вероятностная функция, таким образом, представляет также нестохасти­ческую составляющую зависимости между У и X. Следовательно, если резуль­тирующая переменная Уі равна 1, как представлено точкой А на рис. 10.2, то случайный член равен (1 - р, - р2Л^). Если же результат равен нулю, как пред­ставлено точкой В, то случайный член равен (~Р1 - Р2Л^). Таким образом, рас­пределение случайного члена включает лишь два его специфических значе­ния. Оно не только не является нормальным, но даже не непрерывно. Это означает, что стандартные ошибки и обычно применяемые тестовые статис­тики здесь рассчитываются некорректно. Наконец, два возможных значения случайного члена меняются при изменении X, и поэтому его распределение гетероскедастично: можно показать, что теоретическая дисперсия иі равна (Р1 + Р2^)(1 - Р, - р2^) и она меняется вместе с Хг



Еще одна проблема состоит в том, что предсказанная вероятность может быть больше единицы или меньше нуля для крайних значений X. В примере с окончанием средней школы уравнение регрессии предсказывает вероятность больше единицы для 176 респондентов, имеющих АБУАВС выше 56.

Первая из указанных проблем решается путем использования для оцени­вания метода максимума правдоподобия, описанного в разделе 10.6, вместо метода наименьших квадратов. Для решения второй проблемы модель преоб­разуется следующим образом. Определяется новая переменная 2, являющаяся линейной функцией объясняющих переменных. В данном случае, поскольку в ней лишь одна объясняющая переменная, эта функция такова:

Далее, предположим, чтор есть ^-образная функция 2, например, как по­казано на рис. 10.3. При величине 2ниже определенного значения у индивида очень мало шансов закончить университет. При ее значении выше определен­ного уровня индивид сделаехэто почти наверняка. При промежуточных зна­чениях Zиccлeдyeмaя вероятность чувствительна к ним.

Рис. 10.3. Логистическая функция


Это решает проблему с бессмысленными оценками вероятности, но воз­никает вопрос о том, какой должна быть точная математическая форма зави­симости. На этот вопрос нет определенного ответа. Две наиболее популярные формы — это логистическая функция, используемая в логит-оценивании, и кумулятивное нормальное распределение, используемое в пробит-оценива- нии. Один из наиболее признанных авторитетов в данной области Т. Амемия (Атегшуа, 1981) считает, что оба метода в большинстве случаев дают приемле­мые результаты и ни один из них не обладает каким-либо существенным пре­имуществом. Мы начнем с первого, ч

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 10.1. Линейная вероятностная модель:

  1. § 16.1. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ
  2. 4.5. Сравнение линейной и логарифмической моделей
  3. 1.1.Модель парной линейной регрессии
  4. Модели линейного программирования
  5. S 16.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ
  6. 2.1. Модель парной линейной регрессии
  7. ЛИНЕЙНАЯ И ЦИКЛИЧЕСКАЯ МОДЕЛИ В ПОЛИТИЧЕСКОМ ПРОГНОЗИРОВАНИИ
  8. § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
  9. 9.3. ВЕРОЯТНОСТНЫЕ И НЕВЕРОЯТНОСТНЫЕ СПОСОБЫ ПОСТРОЕНИЯ ВЫБОРКИ
  10. Анализ вероятностных распределений потоков платежей.
  11. Оценка аудиторского риска при применении выборочных вероятностно-статистических процедур