<<
>>

3. 1. Иллюстрация: модель с двумя объясняющими переменными

В этой главе регрессионный анализ по методу наименьших квадратов обобщается для случая, когда в модели регрессии вместо одной объясняющей переменной ис­пользуется несколько объясняющих переменных.
Рассматриваются два новых во­проса. Один из них касается проблемы разграничения эффектов различных объяс­няющих переменных. Эта проблема в случае обострения известна под названием мультиколлинеарности. Другой вопрос состоит в оценке объединенной объясня­ющей способности независимых переменных в противоположность их отдельным предельным эффектам.

Множественный регрессионный анализ является развитием парного регрес­сионного анализа применительно к случаям, когда зависимая переменная ги­потетически связана с более чем одной объясняющей переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь мы сталкиваемся с двумя новыми проблемами. Во-первых, при оценке влияния данной объясняющей переменной на зависимую пере­менную нам придется решать проблему разграничения ее воздействия и воз­действий других объясняющих переменных. Во-вторых, мы должны будем ре­шить проблему спецификации модели. Часто предполагается, что несколько переменных могут оказывать влияние на зависимую переменную, с другой стороны, некоторые переменные могут не подходить для модели. Мы должны решить, какие из них следует включить в уравнение регрессии, а какие — ис­ключить из него. Вторая проблема будет рассмотрена в гл. 6. В данной главе мы полагаем, что спецификация модели правильная. В большинстве ситуаций мы ограничимся базовым случаем, где используются только две объясняющие пе­ременные.

Начнем с рассмотрения примера с факторами, определяющими величину заработка. Расширим первоначальную модель, включив учет влияния числа лет работы наряду с образованием, и допустим, что истинную зависимость можно выразить следующим образом:

EARNINGS = р, + р25 + рз EXP + и, (3.1)

где EARNINGS — часовой заработок; S — продолжительность обучения (чист полных лет учебы); ЕХР — число лета работы после получения образов^ ния; и — случайный член.

Такая модель, разумеется, является значительны» упрощением как с точки зрения состава независимых переменных, включен­ных в зависимость, так и с точки зрения математической формулы связи.

Для геометрической иллюстрации этой зависимости необходима трехме:- ная диаграмма с отдельными осями для EARNINGS, S и ЕХР, как показано ю рис. 3.1. Основание на рисунке содержит оси для S и ЕХР, и если пренебрег текущим влиянием случайного члена, то наклонная плоскость над ним покг зывает величину EARNINGS, соответствующую любому сочетанию (S, ЕХР) i измеренную расстоянием по вертикали до этой плоскости над основанием » данной точке. Так как заработки могут увеличиваться под влиянием как пр:- должительности обучения, так и опыта работы, изображение на диаграмч- было построено на основе допущения о том, что р2 и р3 положительны. Б\т вально свободный член р, показывает ожидаемую величину заработка при ну левом сроке обучения и нулевом опыте работы. Однако такая интерпретап» была бы некорректной, поскольку в выборке NLSYне было лиц с нулевым сро­ком обучения. В действительности лишь очень немногие в этой выборке нг завершили 8-летнее образование. Математическая формула (3.1) означает, чт если бы ЕХР равнялось нулю, то для любого положительного 5 заработок ра* нялся бы р, + р25, где приращение р25 показывает «чистый эффект S» в буз щем. При S, равном нулю, уравнение показывает, что при любой положите.т* ной величине ЕХР заработок был бы равен р, + р3ЕХР, где приращение р3E)J показывает «чистый эффект ЕХР». На рис. 3.1 показан также совокупный эо» фект продолжительности обучения и опыта работы p2S + р3ЕХР.

До сих пор мы пренебрегали случайным членом. Если он отсутствует в ура», нении (3.1), то значения переменной EARNINGS в данной выборке наблюл: ний для EARNINGS, S и ЕХР будут находиться точно на обозначенной накло-

f...... Р, + p2s + p3fxp + tv

Совокупный эффект S и ЕХР
Pi + P2s
EARNINGS
S
Истинная модель с двумя объясняющими переменными: заработок как функц/« продолжительности обучения и опыта работы
р
Рисунок 3.1.

р, + P2S + Р3ЕХР

ной плоскости, и будет довольно просто вывести точные значения ДЛЯ |3р р2 и Р3 (это не так просто сделать геометрически, если вы не имеете достаточно большого опыта в создании трехмерных моделей, однако это довольно просто сделать алгебраическим путем).

(3.2)

Наличие случайного члена приводит к тому, что фактические значения ве­личины заработка будут лежать несколько выше или несколько ниже значе­ний, соответствующих данной наклонной плоскости. Следовательно, теперь мы имеем трехмерный аналог для двумерной задачи, показанной на рис. 1.2. Вместо нахождения линии, соответствующей двумерному рассеянию точек, мы теперь должны расположить плоскость так, чтобы она соответствовала трехмерному рассеянию. Уравнение для выбранной плоскости будет иметь вид

EARNINGS = b{ + b2S + b3EXP,

и ее расположение будет зависеть от выбора величин Ь2, и Ьр являющихся соответственно оценками р,, Р2, и р3 При использовании набора данных ЕАЕР2\ мы получим распечатку результатов оценивания регрессии, представ­ленную в табл. 3.1.

Оцененное уравнение интерпретируется следующим образом. На каждый дополнительный полный год обучения при данном опыте работы приходится увеличение часового заработка в размере 2,68 долл. На каждый дополнитель­ный год опыта работы при данной продолжительности обучения приходится увеличение часового заработка в размере 0,56 долл. Постоянный член не имеет здесь содержательной интерпретации. Буквально он означал бы, что респон­дент с нулевым уровнем образования (на самом деле все респонденты учились не менее шести лет) и без опыта работы зарабатывал бы в час минус 26,49 долл.

Таблица 3.1

EARNINGS S EXP Source SS

Model 22513.6473 Residual 89496.5838 Total 112010.231

df MS

2 11256.8237

537 166.660305

539 207.811189

Number of obs = 540

F(2,537) = 67.54

Prob > F = 0.0000

R-squared = 0.2010

Adj R-squared = 0.1980

Root MSE = 12.91

Coef. Std. Err.

2.678125 .2336497

.5624326 .1285136

ЕХР

сопз

-26.48501 4.27251

11.46 0.000 4.38 0.000 -6.20 0.000

[95% Conf. Interval]

2.219146 3.137105

.3099816 .8148837

-34.87789 -18.09213

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 3. 1. Иллюстрация: модель с двумя объясняющими переменными:

  1. 5.1. Иллюстрация: модель с двумя независимыми переменными
  2. 8.1. Допущения моделей со стохастическими объясняющими переменными
  3. 8.1. Стохастические объясняющие переменные
  4. 9.1. Иллюстрация использования фиктивной переменной
  5. 8. СТОХАСТИЧЕСКИЕ ОБЪЯСНЯЮЩИЕ ПЕРЕМЕННЫЕ И ОШИБКИ ИЗМЕРЕНИЯ
  6. 8.СТОХАСТИЧЕСКИЕ ОБЪЯСНЯЮЩИЕ ПЕРЕМЕННЫЕ И ОШИБКИ ИЗМЕРЕНИЯ
  7. Взаимосвязь моделей АБ-АБ и 1Б-ЬМ. Основные переменные и уравнения модели 1Б-1*М. Вывод кривых /5 и ЬМ. Наклон и сдвиг кривых 1Б и ЬМ. Равновесие в модели 1Б-ЬМ
  8. Иллюстрация идей теории реального делового цикла на примере модели Солоу
  9. МОДЕЛИ, ОБЪЯСНЯЮЩИЕ ТЕМП РОСТА НАУЧНО-ТЕХНИЧЕСКОГО ПРОГРЕССА
  10. 10.МОДЕЛИ ДВОИЧНОГО ВЫБОРА, МОДЕЛИ С ОГРАНИЧЕНИЯМИ ДЛЯ ЗАВИСИМОЙ ПЕРЕМЕННОЙ И ОЦЕНИВАНИЕ МЕТОДОМ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
  11. 62. МАКРОЭКОНОМИЧЕСКИЕ МОДЕЛИ. ЭКЗОГЕННЫЕ И ЭНДОГЕННЫЕ ПЕРЕМЕННЫЕ
  12. Макроэкономические модели. Экзогенные и эндогенные переменные. Запасы и потоки