<<
>>

3.7. Проверка гипотез, относящихся к коэффициентам регрессии

С чего начинается статистическое исследование — с теоретического постро­ения гипотез или с эмпирического анализа? В действительности, теория и прак­тика взаимно обогащают друг друга, и подобные вопросы не задаются.
Поэтому вопрос о проверке гипотез мы будем рассматривать с двух точек зрения. С од­ной стороны, мы можем предположить, что сначала формулируется гипотеза, и цель эксперимента заключается в выяснении ее применимости. Это приведет к проверке гипотезы о значимости. С другой стороны, мы можем сначала про­вести эксперимент и затем определить, какие из теоретических гипотез соот­ветствуют результатам эксперимента. Это приводит к построению доверитель­ных интервалов.

Вам уже известна логика, лежащая в основе построения критериев значи­мости и доверительных интервалов и описанная в вводном курсе статистики. Поэтому вы уже знакомы с большинством понятий, используемых в регрес­сионном анализе. Однако один вопрос может оказаться для вас новым — это использование односторонних критериев. Такие критерии применяются в рег­рессионном анализе очень часто. В самом деле, они являются, или должны быть, более обычными здесь, чем двусторонние критерии, традиционно использу­емые в учебниках. Поэтому важно, чтобы вы поняли целесообразность их при­менения, и путь к этому лежит через последовательный ряд небольших ана­литических шагов. Ни один из них не должен представлять трудности, но следует иметь в виду, что если вы попытаетесь сократить путь или, еще хуже, сделаете попытку свести всю процедуру к механическому использованию нескольких формул, вы столкнетесь с большими трудностями.

Формулирование нулевой гипотезы

Начнем с допущения о том, что формулирование гипотезы предшествует эк­сперименту и что вы уже имеете в виду некоторую гипотетическую связь или зависимость. Например, можно считать, что темпы общей инфляции в эко­номике (/5, в процентах) зависят от темпов инфляции, вызванной ростом за­работной платы (и>, в процентах), и что эта зависимость описывается линей­ным уравнением:

р=сх + № + и, (3.34)

где аир — параметры, а и — случайный член. Далее можно построить гипотезу о том, что без учета эффектов, вносимых случайным членом, общая инфляция равна инфляции, вызванной ростом заработной платы. В этих условиях можно сказать, что гипотеза, которую вы собираетесь проверить, считается нулевой, обозначается Я0 и состоит в том, что р = 1. Мы также определяем альтернатив­ную гипотезу, которая обозначается Нх и представляет собой заключение, дава­емое в том случае, если экспериментальная проверка указала на ложность #0. В данном случае эта гипотеза состоит в том, что р * 1. Две гипотезы сформулиро­ваны с использованием следующих обозначений:

#0:Р=1;

В этом конкретном случае, если действительно считать, что общая инфляция равна инфляции, вызванной ростом заработной платы, мы делаем попытку защитить нулевую гипотезу #0, подвергнув ее максимально строгой проверке и надеясь, что она не будет опровергнута. Однако на практике более обычным яв­ляется построение нулевой гипотезы, которая затем будет проверяться с помо­щью альтернативной гипотезы, которая предполагается верной. Например, рас­смотрим простую функцию спроса:

у = а + $х + и, (3.35)

где у — величина спроса, скажем, на продукты питания, ах — доход.

Исходя из вполне разумных теоретических оснований, вы предполагаете, что спрос на продукты питания зависит от дохода, но ваша гипотеза недостаточно «силь­на», чтобы можно было определить конкретное значение для р. Тем не менее вы можете установить наличие зависимости величины у от х, используя для этого обратную процедуру, когда в качестве нулевой гипотезы принимается утверждение о том, что величина у не зависит от х, т. е. что Р = 0. Альтернатив­ная гипотеза заключается в том, что р ф 0, иными словами, что значение х вли­яет на величину у. Если можно отвергнуть нулевую гипотезу, вы таким обра­зом устанавливаете наличие зависимости, по крайней мере в общих чертах. С использованием введенной системы обозначений нулевая и альтернативная гипотезы соответственно примут вид:

#0:р = 0 и #,:р*0.

Последующее рассмотрение касается модели парной регрессии (3.1). Оно будет относиться только к коэффициенту наклона р, но точно такие же про­цедуры применимы и к постоянному члену а. Возьмем общий случай, в ко­тором в нулевой гипотезе утверждается, что р равно некоторому конкретно­му значению, скажем, Р0, и альтернативная гипотеза состоит в том, что р не равно этому значению (Я0: р = Р0; Н{: Р ф Р0). Вы можете предпринять попыт­ку отклонить или подтвердить нулевую гипотезу в зависимости от того, что вам необходимо в данном случае. Будем предполагать, что четыре условия Гаусса—Маркова выполняются.

Вывод следствий гипотезы

Если гипотеза #0 верна, то оценки р, полученные в ходе регрессионного анализа, будут иметь распределение с математическим ожиданием ро и диспер­сией а2/[л Уаг (х)] [см. уравнение (3.25)]. Теперь мы вводим допущение, что ос­таточный член и имеет нормальное распределение. Если это так, то величина Ь будет также нормально распределена, как показано на рис. 3.4. Сокращение

Функция плотности вероятности для Ь

Рис. 3.4. Структура нормального распределения оценки Ь% выраженной через стандартные отклонения от математического ожидания


«б. с1.» на рисунке соответствует величине стандартного отклонения оценки Ь,

т. е. у пУат(х)' ^читывая структуру нормального распределения, большинство

оценок параметра р будет находиться в пределах двух стандартных отклоне­ний от Р0 (если верна гипотеза Н0 : р = ро).

Сначала мы допустим, что знаем значение стандартного отклонения вели­чины Ь. Это наиболее неправдоподобное допущение, и мы позднее отбросим его. На практике же значение этого отклонения (так же как и неизвестные зна­чения параметров а и Р) подлежит оценке. Можно, тем не менее, упростить рассмотрение, предположив, что точное значение отклонения известно, и, сле­довательно, имея возможность построить график (рис. 3.4).

Проиллюстрируем это на примере модели общей инфляции (3.34). Предпо­ложим, что некоторым образом мы знаем, что стандартное отклонение вели­чины Ь составляет 0,1. Тогда если нулевая гипотеза Я0: Р = 1 верна, то оценки коэффициентов регрессии будут распределены так, как это показано на рис. 3.5. Из этого рисунка можно видеть, что при справедливости нулевой гипотезы оценки будут находиться приблизительно между 0,8 и 1,2.

Сопоставимость, случайность и уровень значимости

Теперь приступим к главному. Предположим, что мы взяли фактическую выборку из наблюдений общей инфляции и инфляции, вызванной ростом за­работной платы, и построили оценку р, используя для этого регрессионный анализ. Если оценка близка 1,0, мы должны быть полностью удовлетворены нулевой гипотезой, так как она и результат оценивания для выборки совмести­мы друг с другом. Но с другой стороны, предположим, что оценка значительно отличается от 1,0. Допустим, например, что она равна 0,7. Это составит три стан­дартных отклонения вниз от 1,0. Вероятность того, что отличие от среднего до-

Функция плотности вероятности для Ь

Рис. 3.5. Пример распределения величины Ь (модель связи общей инфляции и инфляции, вызванной ростом заработной платы)



стигнет трех стандартных отклонений в положительную или отрицательную сторону, составляет лишь 0,0027, т. е. очень низка. Исходя из этого вызываю­щего беспокойство результата, вы можете прийти к одному из двух выводов.

1. Вы можете продолжать считать, что нулевая гипотеза Р = 1,0 верна и что эксперимент дал случайный результат. Вы допускаете, что вероятность получе­ния такого низкого значения для р является очень небольшой, но, тем не ме­нее, она имеет место в 0,27% случаев, и вы допускаете, что это именно тот случай.

2. Вы можете сделать вывод о том, что гипотеза противоречит результату оценивания регрессии. Вы не удовлетворяетесь объяснением, данным в пун­кте 7, так как вероятность очень мала, и понимаете, что наиболее правдопо­добным объяснением является то, что величина р вовсе не равняется 1,0. Другими словами, вы принимаете альтернативную гипотезу Я,: Р * Р0.

Каким образом вы определите, когда необходимо выбрать первый вывод, а когда — второй? Очевидно, что чем меньше вероятность построения регрессии, подобной той, которую вы получили при условии правильности гипотезы, тем больше вероятность отказа от гипотезы и выбор второго вывода. Насколько малой должна быть указанная вероятность для выбора второго вывода?

На этот вопрос нет и не может быть определенного ответа. В большинстве работ по экономике за критический уровень берется 5 или 1%. Если выбирается уровень 5%, то переключение на второй вывод происходит в том случае, когда при истинности нулевой гипотезы вероятность получения столь экстремально­го значения Ь составляет менее 5%. В этом случае говорят, что нулевая гипотеза должна быть отвергнута при 5-процентном уровне значимости.

Это происходит в том случае, когда величина Ь отстоит от Р0 более чем на 1,96 стандартного отклонения. Если вы посмотрите на таблицу нормального распределения (табл. А.1 в конце книги), то увидите, что вероятность того, что величина Ь будет превосходить среднее значение на более чем 1,96 стандартно­го отклонения, составляет 2,5% и, аналогичным образом, вероятность того, что эта величина будет более чем на 1,96 стандартного отклонения ниже среднего значения, также будет 2,5%. Общая вероятность того, что данная величина от­стоит от математического ожидания более чем на 1,96 стандартного отклоне­ния, составляет, таким образом, 5%.

(3.36)

Можно обобщить это решающее правило в математической форме, сказав, что нулевая гипотеза отвергается, если

г> 1,96 или Z< -1,96,

где Z — число стандартных отклонений между регрессионной оценкой и ги­потетическим значением р.*



Разница между оценкой регрессии

(3.37)
2 =

и гипотетическим значением _ Ь- Рр

Стандартное отклонение величины Ь



Нулевая гипотеза не будет отвергнута, если

(3.38)

-1,96 < 2< 1,96.

Это условие можно записать с помощью величин b и ß0, подставив выраже­ние для Z из уравнения (3.37):

~1'%

<< | >>
Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — M.: ИНФРА-М, — XIV, 402 с.. 1999

Еще по теме 3.7. Проверка гипотез, относящихся к коэффициентам регрессии:

  1. 2.8. Проверка гипотез, относящихся к коэффициентам регрессии
  2. 2.СВОЙСТВА КОЭФФИЦИЕНТОВ РЕГРЕССИИ И ПРОВЕРКА ГИПОТЕЗ
  3. 3. СВОЙСТВА КОЭФФИЦИЕНТОВ РЕГРЕССИИ И ПРОВЕРКА ГИПОТЕ
  4. 3.1. Случайные составляющие коэффициентов регрессии
  5. § 16.7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
  6. 3.3. Свойства коэффициентов множественной регрессии
  7. 5.4. Свойства коэффициентов множественной регрессии
  8. 2.3. Случайные составляющие коэффициентов регрессии
  9. Несмещенность коэффициентов регрессии
  10. 3.5. Точность коэффициентов регрессии
  11. 3.2. Вывод и интерпретация коэффициентов множественной регрессии
  12. 2.6. Точность коэффициентов регрессии
  13. 5.2. Вывод и интерпретация коэффициентов множественной регрессии
  14. 8.2. Свойства оценок коэффициентов регрессии по МНК в случае конечной выборки
  15. 3.4. Несмещенность коэффициентов регрессии
  16. Выдвижение и проверка гипотез.
  17. § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности