<<
>>

10.7. Предсказание

Предположим, что вы оценили модель

у, = сс + рх, + и, (10.69)

на наблюдениях периода (t= 1,..., Т):

у),= a + bxr (10.70)

Имея некоторое послевыборочное значение переменной х, скажем, хт+р, вы можете предсказать соответствующее значение у:

$т+р =а+ Ьхт+р.

(10.71)

Такие предсказания могут быть важными по двум причинам. Во-первых, вы можете быть одним из тех эконометристов, чья работа — заглядывать в эконо­мическое будущее. Некоторые эконометристы изучают экономические законо­мерности с целью улучшить понимание того, как работает экономика, но для других это является лишь средством достижения более практичной цели — пред­видеть, что может случиться. Во многих странах макроэкономическое прогно­зирование имеет высокую репутацию, и коллективы эконометристов поддер­живаются министерством финансов или другими правительственными органа­ми, частными финансовыми учреждениями, университетами и исследователь­скими институтами, и их предсказания активно используются для формирова­ния и толкования государственной политики или в деловых целях.

Когда подоб­ные предсказания публикуются в печати, они, как правило, привлекают гораз­до больше внимания, чем большинство других видов экономического анализа, в основном благодаря своей сути и тому, что в отличие от большинства других

видов экономического анализа они легко могут быть поняты средним гражда­нином. Даже человек с совершенно нематематическим и нетехническим скла­дом ума в состоянии понять, что подразумевается под оценками будущего уровня безработицы, инфляции и т. д.

Есть, однако, и другое применение эконометрического предсказания, ко­торое делает его предметом заботы большинства эконометристов независимо от того, заняты они прогнозированием или нет. Оно дает метод оценки устойчи­вости регрессионной модели, который имеет большую исследовательскую на­правленность, чем диагностические статистики, использовавшиеся до сих пор.

Прежде чем продвигаться дальше, необходимо уточнить, что мы понимаем под предсказанием. К сожалению, в эконометрической литературе этот термин может иметь несколько различных значений в соответствии с пониманием хт+р в уравнении (10.71). Мы будем различать предсказания и прогнозы. Это разделе­ние сделано в соответствии с обычным использованием терминов (например, у Э. Харвея [Harvey, 1981]), но тем не менее используемая здесь терминология не вполне стандартна.

Предсказания

Мы опишем ут+р как предсказание, если значение хт+р известно. Как это возможно? В общем случае эконометристы хотят включить все имеющиеся дан­ные в выборку для максимизации ее размера и, как следствие, для минимиза­ции дисперсии оценок, поэтому хт является последним зафиксированным зна­чением х на момент оценки регрессии. Тем не менее возможны две ситуации, когда хг+/, известны: когда вы ждете р или больше периодов после оценки рег­рессии и когда вы заранее ограничили период выборки так, чтобы у вас оста­лись несколько последних наблюдений. Как мы увидим в следующем разделе, весомой причиной так поступать может стать возможность без задержки оце­нить прогнозную точность модели.

Так, например, обращаясь снова к уравнению (3.34) модели связи общей инфляции и инфляции заработной платы, предположим, что для всего перио­да выборки мы оценили уравнение

р = 1,0 + 0,8н>, (10.72)

где р и w — годовой уровень общей инфляции и инфляции заработной платы (в процентах) соответственно, и что мы знаем, что в один послевыборочный год уровень инфляции заработной платы составлял 6%. Тогда мы можем утвер­ждать, что предсказанный уровень общей инфляции равен 5,8%. Мы, конечно, должны иметь возможность сразу сравнить его с действительным уровнем инф­ляции в этом году и рассчитать ошибку предсказания, которая равна разности между предсказанным и действительным значениями. В общем случае еслирг+/, — предсказываемое значение, а ут+ — действительное, то ошибка предсказания fT+ определяется как

fT+p= У т+р~ ут+р.

(10.73)

Почему появляется ошибка предсказания? Это происходит по двум причи­нам. Во-первых, значение ут+ было рассчитано с помощью оценок парамет­ров а и Ь вместо их реальных значений. Во-вторых, у т+р не учитывает воздей­ствие случайного члена ит+р, являющегося составной частью у т+р. В дальнейшем мы будем предполагать, что данные включают (Т + т) наблюдений перемен­ных, из них первые Т наблюдений (период выборки) используются для пост­роения регрессии, а последние т (период, или интервал предсказания) при­меняются для анализа точности предсказания.

Пример

Предположим, что когда мы оценивали функцию спроса на продукты пита­ния с помощью данных из табл. Б.1 и Б.2, мы использовали лишь первые 21 наблюдение из выборки, т.е. данные за 1959—1979 гг., оставив последние 4 на­блюдения для анализа предсказаний. Полученное на выборке 1959—1979 гг. урав­нение выглядит следующим образом (в скобках приведены стандартные ошиб­ки):

\6gy = 2,78 + 0,61 log х-0,42 log/?; R[20] = 0,98. (10.74)

(0,42) (0,03) (0,12)

Значения у для периода 1980—1983 гг., предсказанные с помощью этого урав­нения, при использовании действительных значений личного располагаемого дохода и относительной цены на продукты питания в эти годы, показаны в табл. 10.1 вместе с фактическими значениями этой переменной и ошибками предсказания. Предсказания, как и исходные данные, приведены в логарифми­ческой шкале. Для удобства в табл. 10.1 показаны также абсолютные значения, выраженные в миллиардах долларов (в ценах 1972 г.), которые могут быть рас­считаны на основе значений логарифмов.

Таблица 10.1

Предсказанные и действительные значения спроса на продукты питания,

1980-1983 гг.

Год Логарифмы Абсолютные значения
logy logy Ошибка У У Ошибка
1980 4,995 5,031 -0,037 147,7 153,2 -5,5
1981 5,012 5,030 -0,019 150,2 153,0 -2,8
1982 5,024 5,041 -0,017 152,0 154,6 -2,6
1983 5,052 5,083 -0,031 156,4 161,2 -4,8

Прогнозы

Если вы хотите предсказать конкретное значение ут+р, не зная действитель­ное значение хт+р, то говорится, что вы делаете прогноз (по крайней мере, если использовать терминологию этого текста). Макроэкономические предвидения, публикуемые в прессе, обычно являются прогнозами в таком смысле.

Полити­ков, а в особенности широкую публику мало интересуют «двусторонние» эко­номисты, рассуждения которых имеют вид «с одной стороны... но если нет, то с другой стороны...». Обычно все желают точных однозначных оценок, допол­ненных, может быть, границами возможной ошибки, но часто даже и без это­го. Прогнозы менее точны, чем предсказания, поскольку они подвержены воз­действию дополнительного источника ошибки — предсказания значения хт+р. Очевидно, что делающий прогноз эконометрист пытается, как правило, ми­нимизировать эту дополнительную ошибку, моделируя как можно более точно поведение переменной х. Иногда для нее строят отдельную модель, иногда со­вмещают в одну модель уравнение для у и уравнение для х, дополняя их мно­жеством других соотношений и оценивая так называемую систему одновремен­ных уравнений (что рассматривается в главе 11).

Свойства предсказаний; полученных с помощью МНК

В последующих рассуждениях мы сосредоточимся в основном на предсказа­ниях, а не на прогнозах и рассмотрим свойства коэффициентов уравнения рег­рессии и свойства случайного члена, а не переменной х в случае, когда ее зна­чения неизвестны. И в этом есть положительные моменты. Если значение уг+р порождается тем же процессом, что и выборочные значения переменной у [то есть в соответствии с уравнением (10.69), где ит+р удовлетворяет условиям Га­усса—Маркова], и если мы строим предсказание ут+ с помощью уравнения (10.71), то ошибка предсказания fT+ будет иметь нулевое среднее значение и минимальную дисперсию.

Первое свойство можно продемонстрировать довольно просто:

E(fr+P) = Е(ут+р) - Е (ут+р) =

= E(a + Ьхт+р) - £(а + $хт+р + ит+р) =

= Е(а) + хт+рЕ (b) - а - $хт+р - E(uT+p) =

= а + $хт+р - а - $хт+р = 0, (10.75)

поскольку Е(а) = а, E{b) = р и Е(ит+р) = 0. Мы не будем доказывать свойство минимума дисперсии (доказательство можно найти у Дж. Джонстона [Johnston, 1984] или Дж. Томаса [Thomas, 1983]). Оба эти свойства сохраняются и для об­щего случая множественного регрессионного анализа.

В случае уравнения парной регрессии выборочная дисперсия fT+ определя­ется как

pop.var (fT+p) =
о» =
(10.76)
п 2>,-*)2

f > ~\2 '

. 1 (ХТ+ в - х)

1 + —+ —Vr----

/iVar(x)

где х и Уаг (х) — выборочное среднее значение и дисперсия переменной х. Из формулы следует, и это неудивительно, что чем больше значение х отклоняется от выборочного среднего, тем больше дисперсия ошибки предсказания. Из формулы также следует, и это вновь неудивительно, что чем больше объем выборки, тем меньше дисперсия ошибки предсказания с нижним пределом,

В уравнении множественной регрессии выражение, соответствующее (10.76), имеет гораздо более сложный вид, и оно лучше может быть представлено с

равным о2и . С ростом объема выборки оценки а и Ь стремятся к истинным зна­чениям соответствующих коэффициентов (в случае выполнения условий Гаус­са—Маркова), и единственным источником ошибки при предсказании будет слу­чайный член ит+, а он по определению имеет дисперсию о1 .

Доверительные интервалы для предсказаний

Мы можем получить значение стандартной ошибки предсказания, если заме­ним о2 в уравнении (10.76) на з* и извлечем квадратный корень. Тогда отно­шение величины (уТ+р ~ Ут+р) к стандартной ошибке при оценивании уравне­ния для периода выборки будет подчиняться г-распределению с соответствую­щим числом степеней свободы. Отсюда можно получить доверительный интер­вал для действительного значения ут+р:

$т+р - ^ х с. О. < ут+р < ?т+р + X с. о, (10.77)

где г т — критическое значение / при заданных уровне значимости и числе степеней свободы; с. о. — стандартная ошибка предсказания. На рис. 10.5 в об­щем виде показано соотношение между доверительным интервалом для пред­сказания и значением объясняющей переменной.

Рис. 10.5. Доверительный интервал для предсказания

помощью аппарата матричной алгебры. Однако имеется простой прием, кото­рый можно использовать для расчета значений стандартных ошибок с помощью компьютера. Вы оцениваете уравнение регрессии на выборке, совмещающей выборочный и прогнозный периоды, добавив (различные) фиктивные перемен­ные для каждого из наблюдений периода предсказания. Это означает включе­ние в модель набора фиктивных переменных DT+,, DT+2, ..., DT+m, где значение DT+ = 0 для всех наблюдений, кроме наблюдения Т+р, для которого оно рав­но единице. Как может быть показано, оценки коэффициентов при нефиктив­ных переменных и их стандартные отклонения будут в точности такими же, как и в уравнении регрессии, оцененном только на периоде выборки (см. работы Д. Салкевера [Salkever, 1976] и Ж.-М. Дюфора [Dufour, 1980]). Компьютер ис­пользует фиктивные переменные для получения точного значения каждого на­блюдения в период предсказания и делает это, приравнивая коэффициент при фиктивной переменной к значению ошибки предсказания, как она была опре­делена выше. Стандартная ошибка этого коэффициента равна стандартной ошиб­ке предсказания.

Пример

Стандартная ошибка предсказания в уравнении функции спроса на продук­ты питания для 1980 г. равна 0,019. При числе степеней свободы, равном 18, и уровне значимости в 5% критический уровень /-статистики равен 2,10, откуда можно получить следующий 95-процентный доверительный интервал для пред­сказания в этом году:

4,995 - 2,10 х 0,019 < logy < 4,995 + 2,10 х 0,019, (10.78)

т. е.

4,955 < log у < 5,035. (10.79)

Как мы видим, действительное значение переменной попадает в этот довери­тельный интервал, поэтому предсказание, по крайней мере в данном году, можно считать удовлетворительным. Это верно и для оставшихся лет периода предсказания.

Упражнение

10.13. Используйте косвенный метод Салкевера для расчета прогнозов и их стандартных ошибок для логарифмической функции спроса на выбранный вами товар. Добавьте фиктивные переменные для последних четырех наблюдений и рассчитайте ошибки предсказания для этих лет, базируясь на уравнении рег­рессии, полученном на первых 21 наблюдении. Добавьте это к реальным значе­ниям для получения прогноза. Рассчитайте доверительный интервал для про­гноза по крайней мере на год вперед.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 10.7. Предсказание:

  1. 11.5. Предсказани
  2. Предсказание поведения
  3. Другие виды предсказаний
  4. Глава 1Эволюция предсказаний и гаданий
  5. Точность предсказаний
  6. Предсказания по телефону
  7. Глава 4Сколько должны стоить предсказания
  8. «Клиент-наркоман»: одержимость предсказаниями
  9. Включенность в процесс предсказания
  10. Предсказания в любовной сфере
  11. Эффект хорошего сеанса предсказания
  12. Сопоставление предсказаний
  13. Предсказания в финансовой сфере
  14. Предсказания как бизнес