<<
>>

11.5. Предсказани

Предположим, что вы оценили модель

Г,= Р, + |Ы + и, на выборке из Г наблюдений временного ряда (/*= 1,..., 7):

У = Ь]+ЬЛГ

Имея некоторое послевыборочное значение переменной X, например Хт , вы можете предсказать соответствующее значение У:

YT+p = b\+b2XT+p>

Такие предсказания могут быть важными по двум причинам.

Во-первых, вы можете быть одним из тех эконометристов, чья работа — заглядывать в экономическое будущее. Некоторые эконометристы изучают экономиче­ские закономерности с целью улучшить наше понимание того, как работает экономика, но для других это является лишь средством достижения более практичной цели — предвидеть, что может случиться. Во многих странах макроэкономическое прогнозирование имеет высокую репутацию, и кол­лективы эконометристов поддерживаются министерствами финансов или другими правительственными органами, частными финансовыми учрежде­ниями, университетами и исследовательскими институтами, и их предска­зания активно используются для формирования и обсуждения государ­ственной политики или в деловых целях.
Когда подобные предсказания публикуются в печати, они, как правило, привлекают гораздо больше вни­мания, чем большинство других видов экономического анализа, в основ­ном благодаря своей сути и тому, что в отличие от большинства других ви­дов экономического анализа они легко могут быть поняты средним гражда­нином. Даже человек с совершенно нематематическим и нетехническим складом ума в состоянии понять, что подразумевается под оценками буду­щего уровня безработицы, инфляции и т.д.
(11.52)

Есть, однако, и другое применение эконометрического предсказания, которое делает его предметом заботы большинства эконометристов незави­симо от того, заняты они прогнозированием или нет.

Оно дает метод оцен­ки устойчивости регрессионной модели, который имеет ббльшую исследо­вательскую направленность, чем диагностические статистики, использо­вавшиеся до сих пор.

Прежде чем двигаться дальше, необходимо уточнить, что мы понимаем под предсказанием. К сожалению, в эконометрической литературе этот тер­мин может иметь несколько различных значений, в соответствии с понима­нием Хт в модели (11.52). Мы будем различать предсказания (ex post predictions) и прогнозы (forecasts). Это разделение сделано в соответствии с обычным использованием терминов, но, тем не менее, применяемая здесь терминология не вполне стандартная.

Мы используем для перевода термины «предсказание» и «прогноз» в соответствии с терми­нологией автора, которую он объясняет ниже (Прим. науч. ред.).

Предсказания

Мы опишем Ут+Р как предсказание, если значение Хт известно. Как это возможно? В общем случае эконометристы хотят включить все имеющиеся данные в свою выборку для максимизации ее размера и, как следствие, для минимизации дисперсии оценок, поэтому ^является последним зафикси­рованным значением Хна. момент оценки регрессии. Тем не менее, возмож­ны две ситуации, когда Хт+р известны: когда вы ждете р или больше перио­дов после оценки регрессии или когда вы заранее ограничили период вы­борки так, чтобы у вас остались несколько последних наблюдений. Как мы увидим в следующем подразделе, весомой причиной так поступать может стать возможность без задержки оценить прогнозную точность модели.

Так, например, обращаясь снова к уравнению (3.39) модели связи общей инфляции и инфляции зарплаты, предположим, что для всего периода вы­борки мы оценили уравнение

£=1,0 + 0,8(4 (11.53)

гдер и н' — годовой уровень общей инфляции и инфляции зарплаты (в про­центах) соответственно, и что мы знаем, что в один послевыборочный год уровень инфляции зарплаты составлял 6%. Тогда мы можем утверждать, что предсказанный уровень обшей инфляции равен 5,8%.

Мы, конечно, долж­ны иметь возможность сразу сравнить его с действительным уровнем ин­фляции в этом году и рассчитать ошибку предсказания, которая равна разно­сти между предсказанным и действительным значением. В общем случае, если Ут+р — действительное значение, а Ут+р — предсказываемое, то ошибка предсказания/т+р определяется как

=УТ-УТ- (11.54)

Почему появляется ошибка предсказания? Это происходит по двум при­чинам. Во-первых, значение Ут+р было рассчитано с помощью оценок пара­метров и Ь2, вместо их реальных значений. Во-вторых, Уг+р не учитывает воздействие случайного члена ит+р, являющегося составной частью Ут+р. В дальнейшем мы будем предполагать, что данные включают (74 р) наблю­дений переменных, из них первые /"наблюдений (период выборки) исполь­зуются для построения регрессии, а последние р (период, или интервал предсказания) используются для анализа точности предсказания.

Пример

Предположим, что, когда мы оценивали функцию спроса на жилье по набору данных для оценивания функций спроса, мы использовали лишь первое 41 наблюдение из выборки, т.е. данные за 1959—1999 гг., оставив по­следние четыре наблюдения для анализа предсказаний. Полученное на вы­борке 1959—1999 гг. уравнение выглядит следующим образом (в скобках приведены стандартные ошибки):

ШЮПЗ = -0,30+ 1,04 ЮВР! - 0,42 ЮРШЮЮ; Я2 = 0,998. (11 55) (0,19) (0,01) (0,05)

Значения ШНОШдля периода 2000—2003 гг., предсказанные с помощью этого уравнения, при использовании действительных значений личного располагаемого дохода и относительных цен жилья в эти годы, показаны в табл. 11.6 вместе с фактическими значениями этой переменной и ошибка­ми предсказания. Предсказания, как и исходные данные, приведены в ло­гарифмической шкале. Для удобства в табл. 11.6 показаны также абсолют­ные значения (в млрд долл.) в ценах 2000 г., которые могут быть рассчитаны на основе логарифмических значений.

Таблица 11.6. Предсказанные и фактические расходы на жилье в 2000-2003 гг.

Логарифмы Абсолютные значения

Год " 1.вноиз 1-Шэиз Ошибка ноиэ ноиэ Ошибка
2000 6,914 6,956 -0,042 1006 1049 -43
2001 6,941 6,968 -0,027 1034 1063 -29
2002 6,968 6,990 -0,022 1062 1086 -24
2003 6,981 7,012 -0,030 1076 1109 -33

Мы можем видеть, что в этом случае предсказанные значения расходов на жилье превосходят фактические значения на 2,2—4,2%. Может ли такое предсказание считаться удовлетворительным? Мы обсудим это в следу­ющем разделе.

Прогнозы

Если вы хотите предсказать конкретное значение Ут , не зная действи­тельное значение Хт+р, то считается, что вы делаете прогноз (по крайней мере, если использовать терминологию этого текста). Макроэкономичес­кие предвидения, публикуемые в прессе, обычно являются в этом смысле прогнозами. Политиков, а в особенности широкую публику, мало интере­суют «двусторонние» экономисты, рассуждения которых имеют вид «с од­ной стороны..., но если нет, то с другой стороны...». Обычно все желают точных однозначных оценок, дополненных, может быть, границами воз­можной ошибки, но часто даже и без этого. Прогнозы менее точны, чем предсказания, поскольку они подвержены воздействию дополнительного источника ошибки — предсказания значения Хт . Очевидно, что делаю­щий прогноз эконометрист пытается, как правило, минимизировать эту до­полнительную ошибку, моделируя как можно более точно поведение пере­менной X. Иногда для нее строят отдельную модель, иногда совмещают в одну модель уравнение для У и уравнение для X, дополняя их множеством других соотношений и оценивая получающуюся систему одновременных уравнений (что рассматривалось в гл. 9).

Свойства предсказаний, полученных с помощью МНК

В последующих рассуждениях мы сосредоточимся в основном на пред­сказаниях, а не на прогнозах, и обсудим свойства коэффициентов уравне­

ния регрессии и свойства случайного члена, а не переменной X в случае, когда ее значения неизвестны. И в этом есть положительные моменты. Если значение Ут+/) порождается тем же процессом, что и выборочные значения переменной К (т.е. в соответствии с уравнением (11.50), где ит+р удовлетво­ряет предпосылкам регрессионной модели, и если мы строим наше пред­сказание Ут+р с помощью уравнения (11.52), то ошибка предсказания/^ будет иметь нулевое математическое ожидание и минимальную дисперсию. Первое свойство легко продемонстрировать:

Е(/т+р) = Е(Ут+р)-Е(Ут+р) =

= £(р, 4- $2Хт+р + ит+р) - Е(Ь\ + Ь2Хт+р) = = Р, + Р2 + Е(ит+р) - Щ) - Хт+рЕ(Ь2) = = (11.56)

поскольку £(/>,) = Р,, Е(Ь2) = Р2 и Е(ит+р) = 0. Мы не будем доказывать свой­ство минимума дисперсии. Доказательство можно найти у Дж. Джонстона и Дж. Динардо (1одоЮп, Отагс1о,1997). Оба эти свойства сохраняются и для общего случая множественного регрессионного анализа.

а2
т т
/тч

В случае уравнения парной регрессии теоретическая дисперсия/т опре­деляется как

(П.57)

К^-л2

гдеХ и - X)2 — соответственно выборочное среднее значение и сумма квадратов отклонений переменной X. Из формулы следует, и это неудиви­тельно, что чем больше значение ^отклоняется от выборочного среднего, тем больше теоретическая дисперсия ошибки предсказания. Из формулы также следует, и это вновь неудивительно, что чем больше объем выборки, тем меньше теоретическая дисперсия ошибки предсказания с нижним пре­делом, равным сг2. С ростом объема выборки оценки и Ь2 стремятся к ис­тинным значениям соответствующих коэффициентов (в случае выполне­ния предпосылок модели), и единственным источником ошибки при пред­сказании будет случайный член ит+р, а он по определению имеет дисперсию а2.

Доверительные интервалы для предсказаний

Мы можем получить значение стандартного отклонения для ошибки предсказания, если заменим а2 в уравнении (11.57) на 52 и извлечем квад­ратный корень. Тогда отношение величины (Ут+р - Ут+р) к стандартной

ошибке при оценивании уравнения для периода выборки будет подчинять­ся /-распределению с числом степеней свободы (Т- к). Отсюда мы можем получить доверительный интервал для действительного значения Ут :

Ут+Р = 'крит X с.о. < Ут+Р < Ут+Р + Гкрит x с.о., (11.58)

где / п. — критическое значение Г при заданных уровне значимости и числе степеней свободе, а с.о. — стандартная ошибка предсказания. На рис. 11.3 в общем виде показано соотношение между доверительным интервалом для предсказания и значением объясняющей переменной.

В уравнении множественной регрессии выражение, соответствующее (11.57), имеет гораздо более сложный вид, и оно лучше может быть пред­ставлено с помощью аппарата матричной алгебры. К счастью, имеется простой прием, который можно использовать для расчета значений стан­дартных ошибок при помощи компьютера. Обозначим период выборки как 1,..., Т, а период предсказания как Т+ 1,..., 74 Р. Вы оцениваете уравнение регрессии на выборке, совмещающей выборочный и прогнозный периоды, добавив (различные) фиктивные переменные для каждого из наблюдений периода предсказания. Это означает включение в модель набора фиктив­ных переменных От+,, /)г+2,..., йт+р, где значение йт+р равно нулю для всех

наблюдений, кроме наблюдения Т + р, для которого оно равно единице. Как может быть показано, оценки коэффициентов при нефиктивных пере­менных и их стандартные отклонения будут в точности такими же, как и в уравнении регрессии, оцененном только на периоде выборки (см. работы Д. Салкевера (5а1кеуег, 1976) и Ж.-М. Дюфора (ОиГоиг, 1980)). Компьютер использует фиктивные переменные для получения точного соответствия в каждом наблюдении периода предсказания, и он делает это путем прирав­нивания коэффициента при фиктивной переменной к ошибке предсказа­ния, определенной выше. Стандартная ошибка этого коэффициента равна стандартной ошибке предсказания.

Пример

В табл. 11.7 представлены результаты оценивания логарифмической ре­грессии расходов на жилье на показатели дохода и относительных цен,

Dependent Variable: LGHOUS Method: Least Squares Sample: 1959 2003 Included observations: 45
Variable Coefficient Std. Error t-Statistic Prob.
C -0.298460 0.194922 -1.531173 0.1340
LGDPI 1.036576 0.006497 159.5366 0.0000
LGPRHOUS -0.423765 0.045451 -9.323628 0.0000
D00 -0.041629 0.017210 -2.418867 0.0205
D01 -0.027473 0.017436 -1.575655 0.1234
D02 -0.022256 0.017788 -1.251167 0.2185
D03 -0.030428 0.017893 -1.700556 0.0972
R-squared 0.998852 Mean dependent var 6.359334
Adjusted R-squared 0.998670 S.D. dependentvar 0.437527
S.E. of regression 0.015955 Akaike info criter -5.296084
Sum squared resid 0.009673 Schwarz criterion -5.015048
Log likelihood 126.1619 F-statistic 5508.485
Durbin-Watson stat 0.802456 Prob(F-statistic) 0.000000

с фиктивными переменными /ХЮ—/)03 для 2000—2003 гг. Коэффициенты при фиктивных переменных показывают ошибки предсказания, указанные в табл. 11.6. Предсказанный логарифм расходов на жилье в 2000 г. в табл. 11.6 равняется 6,956. Из распечатки регрессии видно, что стандартная ошибка предсказания для этого года составляет 0,017. Для 38 степеней свободы кри­тическое значение /-статистики при 5%-ном уровне значимости равно 2,024, и мы получаем следующий 95%-ный доверительный интервал пред­сказания для данного года:

6,956 - 2,024 х 0,017 < У< 6,956 + 2,024 х 0,017, (11.59)

то есть

6,922 < У< 6,990. (11.60)

Доверительный интервал не включает фактическое значение (6,914), и, таким образом, по крайней мере, для этого года предсказание оказалось не­удовлетворительным. Очевидное объяснение этому состоит в том, что мы использовали очень простую статическую модель для оценки расходов на жилье. Как мы убедимся в следующей главе, динамическая модель является более предпочтительной.

Упражнение

11.14. Воспользуйтесь косвенным методом Салкевера для расчета прогнозов и их стан­дартных ошибок для логарифмической функции спроса по вашей категории расходов. Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на ос­нове регрессии, оцененной по первому 41 наблюдению. Вычтите эти ошибки из фактических значений для получения прогнозов. Постройте доверительный ин­тервал для прогноза на 2003 г.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. — М.: ИНФРА-М, — XIV, 465 с. — (Университетский учебник).. 2009

Еще по теме 11.5. Предсказани:

  1. 10.7. Предсказание
  2. Предсказание поведения
  3. Другие виды предсказаний
  4. Глава 1Эволюция предсказаний и гаданий
  5. Точность предсказаний
  6. Предсказания по телефону
  7. Глава 4Сколько должны стоить предсказания
  8. «Клиент-наркоман»: одержимость предсказаниями
  9. Включенность в процесс предсказания
  10. Предсказания в любовной сфере
  11. Эффект хорошего сеанса предсказания
  12. Сопоставление предсказаний