<<
>>

5.5. Мультиколлинеарность

Мультиколлинеарностъ — это понятие, которое используется для описания проблемы, когда нестрогая линейная зависимость между объясняющими пере­менными приводит к получению ненадежных оценок регрессии.
Разумеется, такая зависимость совсем необязательно дает неудовлетворительные оценки. Если все другие условия благоприятствуют, т. е. если число наблюдений и выборочные дисперсии объясняющих переменных велики, а дисперсия случайного члена — мала, то в итоге можно получить вполне хорошие оценки.

Итак, мультиколлинеарность должна вызываться сочетанием нестрогой за­висимости и одного (или более) неблагоприятного условия, и это — вопрос степени выраженности явления, а не его вида. Оценка любой регрессии будет страдать от нее в определенной степени, если только все независимые пере­менные не окажутся абсолютно некоррелированными. Рассмотрение данной проблемы начинается только тогда, когда это серьезно влияет на результаты оценки регрессии.

Эта проблема является обычной для регрессий временных рядов, т.

е. когда

данные состоят из ряда наблюдений в течение какого-то периода времени. Если две или более независимые переменные имеют ярко выраженный временной тренд, то они будут тесно коррелированы, и это может привести к мульти- коллинеарности.

Что можно предпринять в этом случае?

Различные методы, которые могут быть использованы для смягчения муль- тиколлинеарности, делятся на две категории: к первой категории относятся попытки повысить степень выполнения четырех условий, обеспечивающих на­дежность оценок регрессии; ко второй категории относится использование внешней информации. Если сначала использовать возможные непосредствен­но получаемые данные, то, очевидно, было бы полезным увеличить число на­блюдений. Если вы применяете данные временных рядов, то это можно сде­лать путем сокращения продолжительности каждого периода времени.

Напри­мер, при оценивании уравнений функции спроса в упражнениях 5.3 и 5.6 можно перейти с использования ежегодных данных на поквартальные дан­ные. После этого вместо 25 наблюдений их станет 100. Это настолько очевидно и так просто сделать, что большинство исследователей, использующих вре­менные ряды, почти автоматически применяют поквартальные данные, если они имеются, вместо ежегодных данных, даже если проблема мультиколли- неарности не стоит, просто для сведения к минимуму теоретических диспер­сий коэффициентов регрессии. В таком подходе существуют, однако, и по­тенциальные проблемы. Можно привнести или усилить автокорреляцию (см. главу 7), но она может быть нейтрализована. Кроме того, можно привнести (или усилить) смещение, вызванное ошибками измерения (см. главу 8), если поквартальные данные измерены с меньшей точностью, чем соответствую­щие ежегодные данные. Эту проблему не так просто решить, но она может оказаться несущественной.

Если вы используете данные перекрестной выборки и находитесь на ста­дии планирования исследования, то можно увеличить точность оценок рег­рессии и ослабить проблему мультиколлинеарности просто за счет большего расхода средств на увеличение размера выборки. Однако такой подход имеет уменьшающуюся предельную отдачу, поскольку стандартные отклонения ко­эффициентов регрессии обратно пропорциональны величине » в то время как расходы прямо пропорциональны п.

Столь же важно, если вы используете данные перекрестной выборки и на­ходитесь на стадии планирования исследования, максимизировать дисперсию наблюдений независимых переменных в выборке, например путем расслое­ния выборки. (Анализ теории и методов организации выборок, см., например, в работах Л. Киша [Kish, 1965] или К. Мозера и Г. Калтона [Moser, Kaiton, 1979].)

Далее, можно сократить величину а^. Случайный член включает в себя объе­диненный эффект всех переменных, оказывающих влияние на величину у, которые не включены явно в уравнение регрессии. Если вы допускаете мысль

о том, что важная переменная могла быть опущена и, следовательно, оказыва­ет влияние на и, то можно сократить величину о2, если добавить эту перемен­ную в уравнение регрессии.

Если, однако, новая переменная линейно связана с одной или нескольки­ми переменными, уже включенными в уравнение, то ее введение может еще больше усугубить проблему мультиколлинеарности. Мы вернемся к обсужде­нию этого вопроса, который представляет большую практическую важность, в конце следующей главы после рассмотрения ошибок спецификации.

Наконец, об использовании самого простого метода. Если вы действительно имеете возможность собрать дополнительные данные, то нужно постараться получить выборку, в которой независимые переменные слабо связаны между собой (конечно, это легче сказать, чем сделать).

Существуют два типа внешней информации, которая может оказаться по­лезной: теоретические ограничения и внешние эмпирические оценки. Теорети­ческое ограничение представляет собой допущение, касающееся величины ко­эффициента или некоторой связи между коэффициентами. Поясним это на при­мере.

При построении производственной функции с использованием данных вре­менных рядов (как это было сделано в разделе 5.3) следует иметь в виду, что на выпуск продукции, наряду с изменениями в капитальных и трудовых затратах, вероятно, будет оказывать влияние технический прогресс. Если вы имеете дело с агрегированными данными, то невозможно количественно оценить техничес­кий прогресс, и проще всего включить экспоненциальный временной тренд в уравнение, записав функцию Кобба—Дугласа, например, в виде:

Г= AK«Lte"v, (5.47)

где Y, К и L имеют те же определения, что и в разделе 5.3; t — время; г — темп прироста выпуска благодаря техническому прогрессу. Оценив это соотношение по данным табл. 5.1, получим (стандартные ошибки указаны в скобках):

log 2,81 - 0,53 log К+ 0,91 log L + 0,047/; R2 = 0,97; (5.48)

(1,38) (0,34) (0,14) (0,021) F= 189,8.

Со всей очевидностью этот результат показывает, что эластичность выпус­ка продукции по затратам капитала отрицательна, что означает снижение вы­пуска при увеличении затрат капитала. Уравнение также показывает темп при­роста выпуска продукции за счет технического прогресса порядка 4,7% в год, что является неправдоподобно высокой оценкой для рассматриваемого пери­ода.

Здесь можно предположить, что по крайней мере отчасти проблема свя­зана с мультиколлинеарностью, так как коэффициент корреляции между log К и t составляет 0,997, а стандартная ошибка коэффициента при log А" в 5 раз больше, чем в уравнении без величины / (5.32).

Отсюда появляется желание ввести ограничения на эффект от масштаба, рассматривая его как постоянную величину, что позволит переписать уравне­ние только с двумя независимыми переменными, имеющими временной тренд, вместо трех и с капиталовооруженностью труда в качестве объясняющей пере­менной вместо затрат капитала. Этот показатель по-прежнему тесно коррелиро­ван с временем (коэффициент корреляции составляет 0,96), но степень корре- лированности уже не так предельно высока. Оценив уравнение (5.28) с экспо­ненциальным временным трендом, мы получим (стандартные ошибки указа­ны в скобках):

log Y/L = -0,11 + 0,11 log K/L + 0,006r, R2 = 0,65; (5.49)

(0,03) (0,15) (0,006) F= 19,5.

Оценки величин а и г, хотя и незначимо отличаются от нуля, теперь более реалистичны, чем раньше, а стандартные ошибки — намного меньше, чем в уравнении (5.48). Тот факт, что величина г незначимо отличается от нуля, под­тверждает вывод Ч. Кобба и П. Дугласа о том, что темп увеличения общей про­изводительности факторов в рассматриваемый период был очень низким. Оче­видно, что обоснованность этой процедуры зависит от правильности введен­ного ограничения, поэтому сначала нужно статистически проверить ограни­чение, что рассматривается в следующей главе.

Наконец, можно использовать внешние оценки. Предположим, что вы ре­шили воспользоваться уравнением (5.24) в качестве формулы для функции спро­са, но имеется проблема мультиколлинеарности, так как располагаемый лич­ный доход и цена имеют ярко выраженные временные тренды, а следователь­но, тесно коррелированы. Предположим, однако, что вы также имеете пере­крестные статистические данные для у и х, полученные из другой выборки. Если допустить, что все домохозяйства в проводимом анализе платили за данный товар одинаковую цену, то модель примет вид:

log у = loga'+ P'log х' + и'. (5.50)

Получив оценку Ь\ для при оценивании регрессионной зависимости у от х\ вы можете подставить ее в уравнение (5.24). Теперь определяется новая переменная log у, равная (log y — b\log х), описывающая спрос, скорректиро­ванный на изменения дохода. После этого уравнение (5.25) принимает вид:

logy = loga + p2 log р + и. (5.51)

Рассчитав logy для каждого наблюдения, вы оцениваете его регрессионную зависимость от log р, и, так как здесь имеется только одна независимая пере­менная, мультиколлинеарность автоматически исключается.

При использовании этого метода могут возникнуть две проблемы, которые необходимо учитывать. Во-первых, оценка величины Р2 зависит от точности оценки величины Рр которая, безусловно, подвержена влиянию ошибки вы­борки. Во-вторых, вы допускаете, что коэффициент при доходе имеет одина­ковый смысл для случаев временных рядов и перекрестных выборок, что, ко­нечно, может быть и не так. Для большинства товаров краткосрочная и дол­госрочная эластичность спроса по доходу может значительно различаться. Одна из причин этого состоит в том, что характер расходов подвержен влиянию инерции, которое в краткосрочном периоде может превзойти эффекты до­хода. Другая причина заключается в том, что изменение уровня дохода может оказать на расходы как непосредственное (в виде изменения бюджетного ог­раничения), так и косвенное влияние (за счет изменения образа жизни), причем косвенное влияние происходит намного медленнее, чем прямое. В качестве первого приближения обычно считается, что регрессии для времен­ных рядов, особенно с небольшими периодами выборки, дают показатели краткосрочной эластичности, в то время как регрессии с использованием данных перекрестных выборок дают показатели долгосрочной эластичности. (Более подробно этот и другие связанные с ним вопросы рассматриваются в работе Э. Ку и Дж. Мейера [Kuh, Meyer, 1957, pp. 380-393].)

Упражнение

5.10. Оцените логарифмическую регрессию расходов на выбранный вами продукт, включив в уравнение временной тренд (наряду с доходом и относи­тельной ценой). Есть ли признаки мультиколлинеарности? Улучшились ли ре­зультаты?

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 5.5. Мультиколлинеарность:

  1. 3.4. Мультиколлинеарность
  2. 3.3. Свойства коэффициентов множественной регрессии
  3. 6.5. Проверка линейного ограничения
  4. 10.2. Распределение Койка
  5. 3. 1. Иллюстрация: модель с двумя объясняющими переменными
  6. Приложение 10.1
  7. 5.1. Иллюстрация: модель с двумя независимыми переменными
  8. § 4.11. Эконометрический анализ эффектов интервенций
  9. Бочаров В.В.. Инвестиции. СПб.: — 176 с. (сер. "Завтра экзамен"), 2008
  10. Капферер, Жан-Ноэль. Бренд навсегда: создание, развитие, поддержка ценности бренда, 2007
  11. Предисловие к русскому изданию Настольная книга специалистов по брендингу
  12. Предисловие к третьему изданию Объединение бренда и бизнеса
  13. ЧАСТЬ ПЕРВАЯ.Почему брендинг является стратегическим
  14. ГЛАВА 1.Рассмотрим капитал бренда
  15. Рассмотрим капитал бренда
  16. Что такое бренд?
  17. Дифференциация между активами, силой и ценностью брендов