<<
>>

1.1. Выборочная ковариация

В данной главе вводятся понятия ковариации и корреляции, которые подгото­вят почву для предстоящего изложения идей и понятий регрессионного анали­за. Второй, не менее важной целью является демонстрация правил расчета вы­борочных дисперсии и ковариации и их выражений.
Для закрепления практи­ческих навыков подробно разбирается несколько примеров. Они будут часто ис­пользоваться в последующих главах, и очень важно, чтобы вы хорошо их усво­или. Эти примеры существенно упрощают математические выкладки и значи­тельно облегчают проведение анализа.

Выборочная ковариация является мерой взаимосвязи между двумя перемен­ными. Данное понятие будет проиллюстрировано на простом примере. Со времен нефтяного кризиса 1973 г. реальная цена на бензин, т. е. цена бензина, отнесенная к уровню общей инфляции, значительно возросла, и это оказало заметное воздействие на потребительский спрос. Просматривая данные табл. Б.1, помещенной в приложении в конце книги, можно увидеть, что в период меж­ду 1963 и 1972 гг.

потребительский спрос на бензин устойчиво повышался. Эта тенденция прекратилась в 1973 г., а затем последовали нерегулярные колеба­ния спроса с незначительным его падением в целом. В табл. 1.1 приведены дан­ные о потребительском спросе и реальных ценах после нефтяного кризиса. (Ре­альная цена вычислялась путем деления индекса номинальной цены на бензин, приведенного в табл. Б.2, на общий индекс потребительских цен из той же таб­лицы и умножения результата на 100. Индексы в табл. Б.2 основаны на данных 1972 г.; таким образом, индекс реальной цены в табл. 1.1 показывает повыше­ние цены бензина относительно общей инфляции начиная с 1972 г.)

На рис. 1.1 эти данные показаны в виде диаграммы рассеяния. Можно видеть некоторую отрицательную связь между потребительским спросом на бензин и его реальной ценой.

Показатель выборочной ковариации позволяет выразить данную связь еди­ным числом. Для его вычисления мы сначала находим средние (для рассматри­ваемого выборочного периода) значения цены и спроса на бензин. Обозначив

цену через р и спрос — через у, мы, таким образом, определяем р и у, кото-

Таблица 1.1

Потребительские расходы на бензин и его реальная цена в США

Год Расходы (млдр. долл., цены 1972 г.) Индекс реальных цен (1972=100)
1973 26,2 103,5
1974 24,8 127,0
1975 25,6 126,0
1976 26,8 124,8
1977 27,7 124,7
1978 28,3 121,6
1979 27,4 149,7
1980 25,1 188,8
1981 25,2 193,6
1982 25,6 173,9

рые для этой выборки оказываются равными соответственно 143,36 и 26,27. За­тем для каждого года вычисляем отклонение величин р и у от средних и пере­множаем их. Для первого года (/?-/?) равно (103,5- 143,36), или -39,86, и (у-у)

равно (26,2 — 26,27), или —0,07, а произведение (р - р)(у-у) составит 2,79. Про­делаем это для всех годов выборки и возьмем среднюю величину, она и будет выборочной ковариацией (как видно, не очень сложно вычисляемой).

Определение

При наличии п наблюдений двух переменных (х и у) выборочная ковариа- ция между х и у задается формулой:

1 Л __ J __ _ _

Cov(x, у) = - X (*/ - *)0>/ - у) = - {(*! - *)(>>/ у) + .. • + (*„ - *)(>>„ - У)}. (1.1) П /=1 Л

Замечание 1. В разделе 1.4 мы определим также ковариацию генеральной со­вокупности. Для различения этих двух ковариаций мы используем обозначение Cov (х, у) с прописной буквы С применительно к выборочной ковариации и pop. cov (х, у) — для ковариации между х и у в генеральной совокупности. Иногда последнюю будет удобно обозначать как а . Аналогичные обозначения мы ис­пользуем и для дисперсии: Var(x) — применительно к выборочной дисперсии и pop. var (x) — к дисперсии для генеральной совокупности (теоретической).

Замечание 2. В некоторых учебниках выборочная ковариация по аналогии с выборочной дисперсией определяется путем деления на (п— 1) вместо п по

200 180 160 140 120 100

24 25 26 27 28 29 Спрос на бензин

(млрд. долл., цены 1972 г.)

Рис. 1.1. Спрос на бензин в США, 1973-1982 гг.

причинам, которые будут объяснены в разделе 1.5. В примере с бензином дета­ли проведенных вычислений для всей выборки приведены в табл. 1.2. Здесь в

столбцах 2 и 3 представлены исходные данные для р и у. В результирующих

строках вычисляютсяр и у. В столбцах 4 и 5рассчитываются (р-р) и (у-у) для каждого года, а в столбце 6 эти две величины перемножаются. В нижней клетке

Таблица 1.2
Наблюдение Р У СР'Р) (у-у) (р-р)(у-у)
1973 103,5 26,2 -39,86 -0,07 2,79
1974 127,0 24,8 -16,36 -1,47 24,05
1975 126,0 25,6 -17,36 -0,67 11,63
1976 124,8 26,8 -18,56 0,53 -9,84
1977 124,7 27,7 -18,66 1,43 -26,68
1978 121,6 28,3 -21,76 2,03 -44,17
1979 149,7 27,4 6,34 1.13 7,16
1980 188,8 25,1 45,44 -1,17 -53,16
1981 193,6 25,2 50,24 -1.07 -53,76
1982 173,9 25,6 30,54 -0,67 -20,46
Сумма Среднее 1433,6 143,36 262,7 26,27 -162,44 -16,24

Р
200 -
180 0 ##

А
160 -
140
120 • • • •
100 с

. i ■ 1 .

1
В

... —1- ^ —1-

24 25 26 27 28 29

Спрос на бензин (млрд. долл., цены 1972 г.)

Рис. 1.2

последнего столбца определяется средняя величина (—16,24), она и является зна­чением выборочной ковариации.

Вы должны заметить, что ковариация в данном случае отрицательна. Так это и должно быть. Отрицательная связь, как это имеет место в данном при­мере, выражается отрицательной ковариацией, а положительная связь — по­ложительной ковариацией.

Имеет смысл рассмотреть причину этого. Рисунок 1.2 точно такой же, как и рис. 1.1, но здесь диаграмма рассеяния наблюдений делится на четыре части

вертикальной и горизонтальной линиями, проведенными через риу соответ­ственно. Пересечение этих линий образует точку (р, у), которая показывает сред­нюю цену и средний спрос за период времени, соответствующий нашей вы­борке. Используя аналогию из физики, можно сказать, что эта точка является центром тяжести совокупности точек, представляющих наблюдения.

Для любого наблюдения, лежащего в квадранте А, значения реальной цены и спроса выше соответствующих средних значений. Для данных наблюдений как (р-р), так и (у-у) являются положительными, а поэтому должно быть поло­жительным и (р- р)(у-у). Наблюдение, таким образом, дает положительный вклад в ковариацию. Так, например, наблюдение за 1979 г. лежит в этом квад­ранте и (/>-/>) = 6,34, (у-у) = 1,13, а их произведение равно 7,16.

Далее рассмотрим квадрант В. Здесь наблюдения имеют реальную цену ниже средней и спрос выше среднего. Поэтому (р-р) отрицательно, (у-у) положи­тельно, произведение (р-р)(у-у) отрицательно, и наблюдение вносит отри­цательный вклад в ковариацию. Например, наблюдение за 1978 г. имеет (р-р) =

= -21,76, (у-у) =2,03 и (р-р)(у-у), таким образом, равно -44,17.

В квадранте С как реальная цена, так и спрос ниже своих средних значе­ний. Таким образом, (р-р) и (у-у) оба являются отрицательными, а

(р- р)(у- у) положительно. (В качестве примера см. наблюдение за 1974 г.)

Наконец, в квадранте D реальная цена выше средней, а спрос ниже средне­го. Таким образом, (р-р) положительно, (у-у) отрицательно, поэтому (р- р)(у-у) отрицательно, и в ковариацию, соответственно, вносится отрица­тельный вклад. (В качестве примера см. наблюдение за 1981 г.)

Поскольку выборочная ковариация является средней величиной произведе­ния (р- р)(у-у) для 20 наблюдений, она будет положительной, если положи­тельные вклады будут доминировать над отрицательными, и отрицательной, если будут доминировать отрицательные вклады. Положительные вклады исходят из квадрантов А и С, и ковариация будет, скорее всего, положительной, если основной разброс пойдет по наклонной вверх. Точно так же отрицательные вклады исходят из квадрантов В и D. Поэтому если основное рассеяние идет по наклонной вниз, как в данном примере, то ковариация будет, скорее всего, отрицательной.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 1.1. Выборочная ковариация:

  1. 1.3. Альтернативное выражение для выборочной ковариации
  2. 1.4. Теоретическая ковариация
  3. 1.9. Почему ковариация не является хорошей мерой связи?
  4. 1.2. Несколько основных правил расчета ковариации
  5. КОВАРИАЦИЯ, ДИСПЕРСИЯ И КОРРЕЛЯЦИЯ
  6. 6.6. Выборочное обследование
  7. 1.5. Выборочная дисперсия
  8. Выборочный метод получения аудиторских доказательств
  9. 1.7. Теоретическая дисперсия выборочного среднего
  10. § 4. Выборочный метод в социологических исследованиях
  11. 1.3. Выборочный метод в прикладной социологии
  12. 80. Выборочный и сплошной методы анализа расчетов с дебиторами
  13. ВЫБОРОЧНАЯ СОВОКУПНОСТЬ
  14. ВЫБОРОЧНАЯ БИБЛИОГРАФИЯ
  15. Определение ожидаемой ошибки при применении выборочных содержательных процедур
  16. Оценка аудиторского риска при применении выборочных вероятностно-статистических процедур
  17. Выборочная вероятностно-статистическая процедура, основанная на нормальном распределении размера ошибок
  18. Глава 12 . ВЫБОРОЧНЫЙ МЕТОД ПОЛУЧЕНИЯ АУДИТОРСКИХ ДОКАЗАТЕЛЬСТВ