<<
>>

2.1. Модель парной линейной регрессии

В данной главе показано, как, используя соответствующие данные, можно по­лучить количественное выражение гипотетического линейного соотношения между двумя переменными. В главе объясняется важный принцип регрессион­ного анализа — метод наименьших квадратов, а также выводятся формулы, выражающие коэффициенты регрессии.

Большинство студентов, изучающих вводный курс эконометрики, уже зна­комы с основами дифференциального исчисления, поэтому вывод коэффици­ентов регрессии не будет для них сложным. Тем, кто не прошел этот курс, следует пропустить раздел 2.3 и доказательство в разделе 2.5. Им придется при­нять формулы расчета коэффициентов на веру, однако в общих чертах они смогут понять, как были получены эти выражения.

Коэффициент корреляции показывает, что две переменные связаны друг с другом, однако он не дает представления о том, каким образом они связа­ны. Рассмотрим более подробно те случаи, для которых мы предполагаем, что одна переменная зависит от другой.

Сразу же отметим, что не следует ожидать получения точного соотношения между какими-либо двумя экономическими показателями, за исключением тех случаев, когда оно существует по определению.

В учебниках по экономической теории эта проблема обычно решается путем приведения соотношения, как если бы оно было точным, и предупреждения читателя о том, что это аппроксима­ция. В статистическом анализе, однако, факт неточности соотношения призна­ется путем явного включения в него случайного фактора, описываемого слу­чайным остаточным членом.

Начнем с рассмотрения простейшей модели:

>> = сх + р;с + и. (2.1)

Величина у, рассматриваемая как зависимая переменная, состоит из двух со­ставляющих: 1) неслучайной составляющей а+рх, где х выступает как объяс­няющая (или независимая) переменная, а постоянные величины аир — как па­раметры уравнения; 2) случайного члена и.

На рис. 2.1 показано, как комбинация этих двух составляющих определяет величину у. Показатели хр х2, х3 и х4 — это четыре гипотетических значения объясняющей переменной. Если бы соотношение между >> их было точным, то соответствующие значения у были бы представлены точками (2{, 02, 03, (?4 на прямой. Наличие случайного члена приводит к тому, что в действительности значение у получается другим. Предполагалось, что случайный член возмуще­ния положителен в первом и четвертом наблюдениях и отрицателен в двух дру­гих. Поэтому если отметить на графике реальные значения у при соответствую­щих значениях х, то мы получим точки Р{, Р2, Р3, РА.

Следует подчеркнуть, что точки Р — это единственные точки, отражающие реальные значения переменных на рис. 2.1. Фактические значения а и (3 и, сле­довательно, положения точек 0 неизвестны, так же как и фактические значе­ния случайного члена. Задача регрессионного анализа состоит в получении оценок а и (3 и, следовательно, в определении положения прямой по точкам Р.

Очевидно, что чем меньше значения м, тем легче эта задача. Действитель­но, если бы случайный член отсутствовал вовсе, то точки Р совпали бы с точ­ками О и точно показали бы положение прямой. В этом случае достаточно было бы просто построить эту прямую и определить значения аи(3.

Рис. 2.1. Истинная зависимость между у и х

Почему же существует случайный член? Имеется несколько причин.

1. Невключение объясняющих переменных. Соотношение между у и х почти на­верняка является очень большим упрощением. В действительности существу­ют другие факторы, влияющие на у, которые не учтены в формуле (2.1). Вли­яние этих факторов приводит к тому, что наблюдаемые точки лежат вне пря­мой.

Часто происходит так, что имеются переменные, которые мы хотели бы включить в регрессионное уравнение, но не можем этого сделать потому, что не знаем, как их измерить, например психологические факторы. Возможно, что существуют также другие факторы, которые мы можем измерить, но которые оказывают такое слабое влияние, что их не стоит учитывать. Кроме того, могут быть факторы, которые являются существенными, но которые мы из-за отсутствия опыта таковыми не считаем. Объединив все эти составляю­щие, мы получаем то, что обозначено как и. Если бы мы точно знали, какие переменные присутствуют здесь, и имели возможность точно их измерить, то могли бы включить их в уравнение и исключить соответствующий элемент из случайного члена. Проблема состоит в том, что мы никогда не можем быть уверены, что входит в данную совокупность, а что — нет.

2. Агрегирование переменных. Во многих случаях рассматриваемая зависи­мость — это попытка объединить вместе некоторое число микроэкономичес­ких соотношений. Например, функция суммарного потребления — это по­пытка общего выражения совокупности решений отдельных индивидов о рас­ходах. Так как отдельные соотношения, вероятно, имеют разные параметры, любая попытка определить соотношение между совокупными расходами и доходом является лишь аппроксимацией. Наблюдаемое расхождение при этом приписывается наличию случайного члена.

3. Неправильное описание структуры модели. Структура модели может быть описана неправильно или не вполне правильно. Здесь можно привести один из многих возможных примеров. Если зависимость относится к данным о времен­ном ряде, то значение у может зависеть не от фактического значения х, а от значения, которое ожидалось в предыдущем периоде. Если ожидаемое и факти­ческое значения тесно связаны, то будет казаться, что между у их существует зависимость, но это будет лишь аппроксимация, и расхождение вновь будет связано с наличием случайного члена.

4. Неправильная функциональная спецификация. Функциональное соотношение между .у и х математически может быть определено неправильно.

Например, истинная зависимость может не являться линейной, а быть более сложной. Не­линейные зависимости будут рассмотрены в главе 4. Безусловно, надо постараться избежать возникновения этой проблемы, используя подходящую математичес­кую формулу, но любая самая изощренная формула является лишь приближе­нием, и существующее расхождение вносит вклад в остаточный член.

5. Ошибки измерения. Если в измерении одной или более взаимосвязанных переменных имеются ошибки, то наблюдаемые значения не будут соответство­вать точному соотношению, и существующее расхождение будет вносить вклад в остаточный член.

Остаточный член является суммарным проявлением всех этих факторов. Оче­видно, что если бы вас интересовало только измерение влияния х на >>, то было бы значительно удобнее, если бы остаточного члена не было. Если бы он отсут­ствовал, мы бы знали, что любое изменение у от наблюдения к наблюдению вызвано изменением х, и смогли бы точно вычислить р. Однако в действи­тельности каждое изменение у отчасти вызвано изменением и, и это значи­тельно усложняет жизнь. По этой причине и иногда описывается как шум.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 2.1. Модель парной линейной регрессии:

  1. 1.1.Модель парной линейной регрессии
  2. S 16.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ
  3. § 16.1. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ
  4. § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
  5. Глава 16. ЛИНЕЙНАЯ РЕГРЕССИЯ
  6. 4.5. Сравнение линейной и логарифмической моделей
  7. 10.1. Линейная вероятностная модель
  8. 5.3. Множественная регрессия в нелинейных моделях
  9. Модели линейного программирования
  10. ЛИНЕЙНАЯ И ЦИКЛИЧЕСКАЯ МОДЕЛИ В ПОЛИТИЧЕСКОМ ПРОГНОЗИРОВАНИИ
  11. 3.3. Свойства коэффициентов множественной регрессии
  12. § 16.8. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ В ЛИНЕЙНОМ РЕГРЕССИОННОМ АНАЛИЗЕ
  13. S 16.9. РЕГРЕССИЯ И Excel