10.4. Цензурирование регрессии: тобит-анализ
У* = р, + |32ЛГ+м, (10.17)
где зависимая переменная лежит выше нижней границы У1 или ниже верхней границы Уи.
В случае с наличием нижней границы модель описывается какУ* = Р, + и;
У=У* для У* > Уь,
У=УХ дляУ 0, т.е. если
-40+1,2А. + и,.>0.
Проведя перестановку, получим
и(. >40-1,2Х.. (10.21)
Таким образом, м(. должен иметь усеченное распределение, показанное на рис. 10.9. В данном примере математическое ожидание и(. должно быть положительным и являться убывающей функцией от Хг Поскольку и(. отрицательно коррелирован с X., условие регрессионной модели нарушено, и МНК дает несостоятельные оценки. На рис. 10.10 влияние такой корреляции показано графически.
Наблюдения с четырьмя наименьшими значениями X присутствуют в выборке только потому, что значения случайного члена у них (помечены пунктиром) положительны и достаточно велики, чтобы сделать положительным У. Дополнительно в том диапазоне, где X достаточно велико, чтобы сделать положительной нестохастическую составляющую У, наблюдения с большими по модулю отрицательными значениями случайного члена опущены. Три таких наблюдения, показанные кружками, приведены на рис. 10.10. Оба этих эффекта при использовании МНК приводят к завышению оценки постоянного члена и к занижению оценки коэффициента наклона.Если можно предположить нормальное распределение случайного члена, то возможным решением проблемы может быть использование тобит-анали- за, сочетающего регрессионный и пробит-анализ.
Математическое описание подхода мы здесь не рассматриваем. Вместо этого дадим иллюстрацию на основе данных о расходах на бытовую технику из базы данных о потребительских расходах. Данная категория расходов показана на рис. 10.11, где она обозначена как HEQ, а общие расходы домохозяйств — как ЕХР. Для 86 из 869 наблюдений расходы на бытовую технику равны нулю. Распечатка результатов оценивания тобит-регрессии представлена в табл. 10.7. В программе Stata для этого используется функция «tobit», а точка ограничения слева показана в
40 -1,2Х О Рис. 10.9 |
Рис. 10.10 |
скобках после «И». В случае ограничения справа «11» заменяется на «и1». Могут быть включены в модель и оба ограничения.
МНК-регрессии с включением и без включения наблюдений с нулевыми расходами на бытовую технику дают оценки коэффициентов наклона 0,0472 и 0,0468 соответственно, и обе они, как и ожидалось, ниже тобит-оценки. Величина смещения, вообще говоря, увеличивается вместе с ростом доли ограни-