<<
>>

2.7. Качество оценки: коэффициент R

Цель регрессионного анализа состоит в объяснении поведения зависимой переменной у. В любой данной выборке у оказывается сравнительно низким в одних наблюдениях и сравнительно высоким — в других.
Мы хотим знать, по­чему это так. Разброс значений у в любой выборке можно суммарно описать с помощью выборочной дисперсии Var (у). Мы должны уметь рассчитывать вели­чину этой дисперсии.

В парном регрессионном анализе мы пытаемся объяснить поведение >> путем определения регрессионной зависимости у от соответственно выбранной не­зависимой переменной х. После построения уравнения регрессии мы можем разбить значение у. в каждом наблюдении на две составляющих — у. и е.:

* = (2.43)

Величина — расчетное значение у в наблюдении / — это то значение, кото­рое имел бы у при условии, что уравнение регрессии было правильным, и от­сутствии случайного фактора. Это, иными словами, величина у, спрогнозиро­ванная по значению х в данном наблюдении. Тогда остаток ei есть расхождение между фактическим и спрогнозированным значениями величины^.

Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.

Используя (2.43), разложим дисперсию у:

VarOO = Var(p + е) = Var (у) + Var(e) + 2Cov(y, е). (2.44)

Далее, оказывается, что Cov (р., е) должна быть равна нулю (см. упражнение 2.12). Следовательно, мы получаем:

Var (у) = Var(y) + Var(e). (2.45)

Это означает, что мы можем разложить Var (у) на две части: Var (j>) — часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть[10].

Согласно (2.45), Var (y)/Var (у) — это часть дисперсии >>, объясненная урав­нением регрессии. Это отношение известно как коэффициент детерминации, и его обычно обозначают R2:

2 _ Уаг(у)

R

что равносильно

„2 , Уаг(е)

Л =1"УаЮО- (2-47)

Максимальное значение коэффициента/?2 равно единице.

Это происходит в том случае, когда линия регрессии точно соответствует всем наблюдениям, так что у( = у1 для всех / и все остатки равны нулю. Тогда Уаг (у) = Уаг (у), Уаг (е) = О и Л2= 1.

Если в выборке отсутствует видимая связь между .у и х, то коэффициент К2 будет близок к нулю.

При прочих равных условиях желательно, чтобы коэффициент 2 был как можно больше. В частности, мы заинтересованы в таком выборе коэффициен­тов а и чтобы максимизировать Л2. Не противоречит ли это нашему крите­рию, в соответствии с которым а и Ъ должны быть выбраны таким образом, чтобы минимизировать сумму квадратов остатков? Нет, легко показать, что эти кри­терии эквивалентны, если (2.47) используется как определение коэффици­ента Л2. Отметим сначала, что

*1=У-91 = У,-а-Ьх* (2.48)

откуда, беря среднее значение е( по выборке и используя уравнение (2.25), получим:

ё = у-а-Ьх = у-\у-Ьх]-Ьх = 0. (2.49)

Следовательно,

Уаг(е) = IX (*,■ - *)2 = ± I(2.50)

Отсюда следует, что принцип минимизации суммы квадратов остатков эк­вивалентен минимизации дисперсии остатков при условии выполнения (2.25). Однако если мы минимизируем Уаг(е), то при этом в соответствии с (2.47) автоматически максимизируется коэффициент Я2.

Альтернативное представление коэффициента В2

На интуитивном уровне представляется очевидным, что чем больше соот­ветствие, обеспечиваемое уравнением регрессии, тем больше должен быть ко­эффициент корреляции для фактических и прогнозных значений^, и наоборот. Покажем, что Л2 фактически равен квадрату такого коэффициента корреля­ции между у и $1, который мы обозначим . (заметим, что Соу (е, у) = 0; см. упражнение 2.12):

г Соу (у, у) = Соу ({у + е},у) = Со\($,у) + Соу(е,у) =

у'у 7Уаг(>;)Уаг(5)) ^/Уаг^Уаг^) ^/Уаг^Уаг^)

Пример вычисления коэффициента Я2

Вычисление коэффициента Я2 выполняется на компьютере в рамках про­граммы оценивания регрессии, поэтому данный пример приведен лишь в целях иллюстрации.

Будем использовать простейший пример с тремя наблюдения­ми, описанный в разделе 2.3, где уравнение регрессии

1,6667 + 1,5000* (2.52)

построено по наблюдениям* и у, приведенным в табл. 2.3. В таблице также даны У;Н е1 для каждого наблюдения, вычисленные с помощью уравнения (2.52), и все остальные данные, необходимые для вычисления Уаг (у), Уаг (з>) и Уаг (е).

(Заметим, что е должно быть равно нулю, так что величина Уаг (е) = (1 /п) Це} •)

Таблица 2.3

Наблюдения х у у е У ~ У У ~ У (У ~ У)2 (У - У)2 е2

1 1 3 3,1667 -0,1667 -1,6667 -1,5 2,7778 2,25 0,0278

2 2 5 4,6667 0,3333 0,3333 0,0 0,1111 0,00 0,1111

3 3 6 6,1667 -0,1667 1,3333 1,5 1,7778 2,25 0,0278

Сумма 6 14 14 0 4,6667 4,50 0,1667

Среднее 2 4,6667 4,6667 0 1,5556 1,50 0,0556

Из табл. 2.3 можно видеть, что Уаг (у) = 1,5556, Уаг (у) = 1,5000 и Уаг (е) = 0,0556. Заметим, что Уаг (у) = Уаг (у) + Уаг (е), как это и должно быть. На основании этих значений мы можем вычислить коэффициент Я2, исполь­зуя уравнение (2.46) или (2.47):

2 _ Уаг(р) _ 1,5000

* " УагОО " 1^5556 ~

2 Уаг(е) 0>0556 „ ...

* -^Хад-1"^-0'96' (2.54)

Упражнения

2.12. Докажите, что Соё) должна быть равна нулю, используя равен­ства у = а + Ьх, е=у — а— Ьх и ковариационные правила.

2.13. Используя данные, приведенные в табл. 2.3, вычислите коэффициент корреляции между у и у и убедитесь, что значение коэффициента Я2, получен­ное путем возведения его в квадрат, является таким же, как в нашем примере.

2.14. Значения коэффициента Я2 для регрессионных зависимостей (1) рас­ходов на продукты питания и (2) расходов на жилье от располагаемого лич­ного дохода [см. уравнение (2.42) и упражнение 2.2] составили, соответствен­но, 0,98 и 0,99. Какой вывод можно сделать на основании этих значений (если какой-либо вывод здесь возможен)?

2.15. Каково значение коэффициента Л2 в регрессии между характеристика­ми выбранного вами товара и располагаемым личным доходом? Прокомменти­руйте это.

2.

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 2.7. Качество оценки: коэффициент R:

  1. 3.5. Качество оценивания: коэффициент R 2
  2. 5.6. Качество оценивания: коэффициент R
  3. Коэффициенты качества активов
  4. § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
  5. Качество оценивания: коэффициент Я
  6. 2.1.2. Оценка качества заемщиков по методике 1 — "Рейтинговой системе оценки рисков по кредитам юридических лиц"
  7. 2.1.4. Оценка качества заемщиков по методике 3 – «Рейтинговой системе оценки кредитоспособности заемщиков».
  8. 9.4. ОЦЕНКА АКЦИЙ С ПОМОЩЬЮ КОЭФФИЦИЕНТА Р/Е: ПОВТОРНЫЙ ПОДХОД
  9. 39. РАСЧЕТ, ОЦЕНКА И АНАЛИЗ ФИНАНСОВЫХ КОЭФФИЦИЕНТОВ БИЗНЕС‑ПЛАНА
  10. 1.4.2. Методики оценки качества заемщиков.
  11. 12. Взаимосвязь между Г-критерием общего качества регрессии и критерием для коэффициента наклона в парном регрессионном анализе
  12. Оценка нравственных качеств работников
  13. Методы оценки качеств аттестуемых
  14. 2.2. Сравнительная характеристика методик оценки качества заемщиков
  15. Оценка физических качеств работников
  16. Оценка качества найма
  17. Оценка деловых и профессиональных качеств работников в квалиметрическом измерении
  18. ОЦЕНКА ЛИЧНЫХ КАЧЕСТВ СПЕЦИАЛЬНЫМИ СЛУЖБАМИ
  19. § 3. Оценка качества строительно-монтажных работ и объектов