2.7. Качество оценки: коэффициент R
В парном регрессионном анализе мы пытаемся объяснить поведение >> путем определения регрессионной зависимости у от соответственно выбранной независимой переменной х. После построения уравнения регрессии мы можем разбить значение у. в каждом наблюдении на две составляющих — у. и е.:
* = (2.43)
Величина — расчетное значение у в наблюдении / — это то значение, которое имел бы у при условии, что уравнение регрессии было правильным, и отсутствии случайного фактора. Это, иными словами, величина у, спрогнозированная по значению х в данном наблюдении. Тогда остаток ei есть расхождение между фактическим и спрогнозированным значениями величины^.
Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.Используя (2.43), разложим дисперсию у:
VarOO = Var(p + е) = Var (у) + Var(e) + 2Cov(y, е). (2.44)
Далее, оказывается, что Cov (р., е) должна быть равна нулю (см. упражнение 2.12). Следовательно, мы получаем:
Var (у) = Var(y) + Var(e). (2.45)
Это означает, что мы можем разложить Var (у) на две части: Var (j>) — часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть[10].
Согласно (2.45), Var (y)/Var (у) — это часть дисперсии >>, объясненная уравнением регрессии. Это отношение известно как коэффициент детерминации, и его обычно обозначают R2:
2 _ Уаг(у)
R
что равносильно
„2 , Уаг(е)
Л =1"УаЮО- (2-47)
Максимальное значение коэффициента/?2 равно единице.
Это происходит в том случае, когда линия регрессии точно соответствует всем наблюдениям, так что у( = у1 для всех / и все остатки равны нулю. Тогда Уаг (у) = Уаг (у), Уаг (е) = О и Л2= 1.Если в выборке отсутствует видимая связь между .у и х, то коэффициент К2 будет близок к нулю.
При прочих равных условиях желательно, чтобы коэффициент 2 был как можно больше. В частности, мы заинтересованы в таком выборе коэффициентов а и чтобы максимизировать Л2. Не противоречит ли это нашему критерию, в соответствии с которым а и Ъ должны быть выбраны таким образом, чтобы минимизировать сумму квадратов остатков? Нет, легко показать, что эти критерии эквивалентны, если (2.47) используется как определение коэффициента Л2. Отметим сначала, что
*1=У-91 = У,-а-Ьх* (2.48)
откуда, беря среднее значение е( по выборке и используя уравнение (2.25), получим:
ё = у-а-Ьх = у-\у-Ьх]-Ьх = 0. (2.49)
Следовательно,
Уаг(е) = IX (*,■ - *)2 = ± I(2.50)
Отсюда следует, что принцип минимизации суммы квадратов остатков эквивалентен минимизации дисперсии остатков при условии выполнения (2.25). Однако если мы минимизируем Уаг(е), то при этом в соответствии с (2.47) автоматически максимизируется коэффициент Я2.
Альтернативное представление коэффициента В2
На интуитивном уровне представляется очевидным, что чем больше соответствие, обеспечиваемое уравнением регрессии, тем больше должен быть коэффициент корреляции для фактических и прогнозных значений^, и наоборот. Покажем, что Л2 фактически равен квадрату такого коэффициента корреляции между у и $1, который мы обозначим . (заметим, что Соу (е, у) = 0; см. упражнение 2.12):
г Соу (у, у) = Соу ({у + е},у) = Со\($,у) + Соу(е,у) =
у'у 7Уаг(>;)Уаг(5)) ^/Уаг^Уаг^) ^/Уаг^Уаг^)
Пример вычисления коэффициента Я2
Вычисление коэффициента Я2 выполняется на компьютере в рамках программы оценивания регрессии, поэтому данный пример приведен лишь в целях иллюстрации.
Будем использовать простейший пример с тремя наблюдениями, описанный в разделе 2.3, где уравнение регрессии1,6667 + 1,5000* (2.52)
построено по наблюдениям* и у, приведенным в табл. 2.3. В таблице также даны У;Н е1 для каждого наблюдения, вычисленные с помощью уравнения (2.52), и все остальные данные, необходимые для вычисления Уаг (у), Уаг (з>) и Уаг (е).
(Заметим, что е должно быть равно нулю, так что величина Уаг (е) = (1 /п) Це} •)
Таблица 2.3
Наблюдения х у у е У ~ У У ~ У (У ~ У)2 (У - У)2 е2
1 1 3 3,1667 -0,1667 -1,6667 -1,5 2,7778 2,25 0,0278
2 2 5 4,6667 0,3333 0,3333 0,0 0,1111 0,00 0,1111
3 3 6 6,1667 -0,1667 1,3333 1,5 1,7778 2,25 0,0278
Сумма 6 14 14 0 4,6667 4,50 0,1667
Среднее 2 4,6667 4,6667 0 1,5556 1,50 0,0556
Из табл. 2.3 можно видеть, что Уаг (у) = 1,5556, Уаг (у) = 1,5000 и Уаг (е) = 0,0556. Заметим, что Уаг (у) = Уаг (у) + Уаг (е), как это и должно быть. На основании этих значений мы можем вычислить коэффициент Я2, используя уравнение (2.46) или (2.47):
2 _ Уаг(р) _ 1,5000
* " УагОО " 1^5556 ~
2 Уаг(е) 0>0556 „ ...
* -^Хад-1"^-0'96' (2.54)
Упражнения
2.12. Докажите, что Соё) должна быть равна нулю, используя равенства у = а + Ьх, е=у — а— Ьх и ковариационные правила.
2.13. Используя данные, приведенные в табл. 2.3, вычислите коэффициент корреляции между у и у и убедитесь, что значение коэффициента Я2, полученное путем возведения его в квадрат, является таким же, как в нашем примере.
2.14. Значения коэффициента Я2 для регрессионных зависимостей (1) расходов на продукты питания и (2) расходов на жилье от располагаемого личного дохода [см. уравнение (2.42) и упражнение 2.2] составили, соответственно, 0,98 и 0,99. Какой вывод можно сделать на основании этих значений (если какой-либо вывод здесь возможен)?
2.15. Каково значение коэффициента Л2 в регрессии между характеристиками выбранного вами товара и располагаемым личным доходом? Прокомментируйте это.
2.
Еще по теме 2.7. Качество оценки: коэффициент R:
- 3.5. Качество оценивания: коэффициент R 2
- 5.6. Качество оценивания: коэффициент R
- Коэффициенты качества активов
- § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- Качество оценивания: коэффициент Я
- 2.1.2. Оценка качества заемщиков по методике 1 — "Рейтинговой системе оценки рисков по кредитам юридических лиц"
- 2.1.4. Оценка качества заемщиков по методике 3 – «Рейтинговой системе оценки кредитоспособности заемщиков».
- 9.4. ОЦЕНКА АКЦИЙ С ПОМОЩЬЮ КОЭФФИЦИЕНТА Р/Е: ПОВТОРНЫЙ ПОДХОД
- 39. РАСЧЕТ, ОЦЕНКА И АНАЛИЗ ФИНАНСОВЫХ КОЭФФИЦИЕНТОВ БИЗНЕС‑ПЛАНА
- 1.4.2. Методики оценки качества заемщиков.
- 12. Взаимосвязь между Г-критерием общего качества регрессии и критерием для коэффициента наклона в парном регрессионном анализе
- Оценка нравственных качеств работников
- Методы оценки качеств аттестуемых
- 2.2. Сравнительная характеристика методик оценки качества заемщиков
- Оценка физических качеств работников
- Оценка качества найма
- Оценка деловых и профессиональных качеств работников в квалиметрическом измерении
- ОЦЕНКА ЛИЧНЫХ КАЧЕСТВ СПЕЦИАЛЬНЫМИ СЛУЖБАМИ
- § 3. Оценка качества строительно-монтажных работ и объектов