<<
>>

2.1. Типы данных и регрессионная модель

С помощью регрессионного анализа мы можем получить оценки параметров зави­симости. Однако они являются лишь оценками. Поэтому возникают вопросы о том насколько они надежны и каковы их свойства.
Мы рассмотрим их в данной главе Способ рассмотрения этих вопросов и ответы на них зависит от предпосылок, кото­рые делаются относительно регрессионной модели, а эти предпосылки, в свок очередь, зависят от природы используемых данных.

Мы будем применять методы регрессионного анализа к данным трех ви­дов: перекрестным выборкам, временным рядам и панельным данным. Дан­ные перекрестной выборки относятся к наблюдаемым объектам в одну и ту же единицу времени. Наблюдаемыми объектами могут быть индивиды, домохо­зяйства, предприятия, страны и множество других элементов, достаточно од­нородных по своей природе, чтобы использовать их для изучения предполага­емых зависимостей. Данные временнбго ряда состоят из повторяющихся на­блюдений одного и того же объекта, обычно с постоянным интервалом межд% наблюдениями.

Примеры из области макроэкономики — квартальные дан­ные по валовому внутреннему продукту, потреблению, денежной массе, про­центным ставкам. Панельные данные, которые могут быть представлены как комбинация данных перекрестной выборки и временных рядов, состоят из повторяющихся наблюдений одних и тех же объектов во времени. Пример — данные Всеамериканского опроса молодежи {US National Longitudinal Survey oj Youth — NLSY), использованные для интерпретации регрессионной модели б разделе 1.6. Эти данные включают наблюдения над одними и теми же индиви­дами с 1979 г. до настоящего времени, которые до 1994 г. собирались ежегодно, а затем — раз в два года.

Следуя подходу Р. Давидсона (Davidson, 2000), мы будем рассматривать три вида регрессионной модели.

Модель А (для регрессий по данным перекрестных выборок): регрессоры (объясняющие переменные) являются нестохастическими, т.е.

их значения б наблюдениях выборки не содержат стохастических (случайных) составля­ющих. Они будут рассмотрены далее во Вставке 2.1.

2.1. Нестохастические регрессоры

В первой части этой книги, вплоть до гл. 8, мы полагаем, что регрессоры •объясняющие переменные) в модели не содержат стохастических составля­вших. Это делается для упрощения анализа. В действительности трудно себе зрел ставить реальные нестохастические переменные, кроме переменной вре­мени, и поэтому нижеследующий пример выглядит несколько искусственным. Предположим, что мы связываем размер заработка с продолжительностью обу­чения определяемой как число полных лет обучения. Предположим, что из £жных национальной переписи нам известно, что 1% населения имеет 5 = 8; 3% имеют 5 = 9; 5% имеют5= 10; 7% имеют5= 11; 43% имеют£= 12(что соответствует окончанию средней школы) и т.д. Предположим, что мы решили слелать выборку размером в 1000 наблюдений, желательно— как можно более эолно соответствующую генеральной совокупности. В этом случае мы можем слелать так называемую стратифицированную случайную выборку, включаю- ■ую 10 индивидов с ^ — 8; 30 индивидов — с 5 = 9 и т.д. Значения £ в такой аыборке были бы предопределенными и, следовательно, нестохастическими. В больших выборках, полученных таким образом, чтобы они представляли на­селение в целом, как, например, NLSY, вероятно, продолжительность обучения ■ другие демографические переменные достаточно полно соответствуют этому требованию. В гл. 8 мы признаем ограничивающий характер данной предпо­сылки и заменим ее на предпосылку о том, что значения регрессоров получены кз заданных распределений.

Модель В (также для регрессий по данным перекрестных выборок): значе­ния регрессоров получены случайным образом и независимо друг от друга из заданных генеральных совокупностей.

Модель С (для регрессий по данным временных рядов): значения регрессо­ров могут демонстрировать инерционность во времени. Смысл понятия «инерционный во времени» мы поясним в гл. 11 — 13 при рассмотрении рег­рессий по данным временных рядов.

Регрессии с панельными данными могут рассматриваться как расширение модели В.

Большая часть этой книги посвящена регрессиям по данным перекрест­ных выборок, т.е. моделям А и В. Причина этого заключается в том, что ре­грессии по данным временных рядов потенциально включают сложные тех­нические аспекты, которых вначале лучше избежать.

Начнем с модели А, исключительно для удобства анализа. Это позволит нам провести обсуждение регрессионного анализа в рамках довольно простой схемы, известной как классическая модель линейной регрессии. Мы заменим эту схему в гл. 8 более слабым и более реалистичным допущением, подходя­щим для регрессий по данным перекрестных выборок, о том, что переменные »формируются как случайные выборки из заданных генеральных совокупнос­тей.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 2.1. Типы данных и регрессионная модель:

  1. 14.2. Регрессионные модели с фиксированным эффектом
  2. 2.2. Предпосылки регрессионной модели с нестохастическими регрессорами
  3. 12.1. Допущения для регрессионных моделей с временными рядами
  4. 12.СВОЙСТВА РЕГРЕССИОННЫХ МОДЕЛЕЙ С ВРЕМЕННЫМИ РЯДАМИ
  5. 2.1.3. Концептуальные модели данных
  6. 6.5. Основные типы анализа данных
  7. 7.7.3. Типы закономерностей данных, используемые в Data Mining
  8. 2.1.4. Реляционная модель данных
  9. 5.5.1 Концептуальная модель данных
  10. 5.2.2. ОБЪЕКТНАЯ МОДЕЛЬ БАЗ ДАННЫХ
  11. 5.2.1. РЕЛЯЦИОННАЯ МОДЕЛЬ БАЗ ДАННЫХ
  12. Связи между моделью данных и административными бизнес-процессами
  13. 4.7.1. МОДЕЛИ ОТОБРАЖЕНИЯ ДАННЫХ
  14. 4.4 Результативность и эффективность файлов данных (картотек, массивов данных)
  15. 3.11. Взаимосвязи между критериями в парном регрессионном анализе
  16. Корреляционный и регрессионный анализ
  17. 2. ПАРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
  18. 5. МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ