Приложение 9.1
Может случиться так, что переменная, детерминанты которой требуется исследовать, является качественной по своему характеру. Например, в нашем исследовании в области акушерства можно рассмотреть вопрос оценки факторов, приводящих в критических обстоятельствах к необходимости родоразреше- ния путем кесарева сечения.
Наша цель заключается в уменьшении частоты проведения такой операции, что важно само по себе и для снижения расходов на специальное оборудование для ухода за младенцами и т. д.Упрощенный способ рассмотрения этой проблемы заключается в определении зависимой переменной emsec как фиктивной переменной и в оценивании регрессии обычным способом. Например, мы можем считать emsec равной единице, если родоразрешение проводилось путем кесарева сечения, и равной нулю, когда роды были нормальными. Используя данные о 964 родах, мы получаем следующий результат:
emsèc = 0,08 - 0,08/) + 0,01 old + 0,07short + 0,05heavy - - 0,02class + 0,01 MVf + 0,0018 x, (9.48)
где D — фиктивная переменная числа родов в прошлом (значение 1 — если мать рожала раньше, значение 0 — в других случаях); old — фиктивная переменная возраста (1 — когда матери 36 или более лет, 0 — в других случаях); short — фиктивная переменная роста матери (1 — если мать находится в низшем квинтиле по росту, т.
е. имеет рост 157 см или меньше, 0 — в других случаях); heavy — фиктивная переменная веса матери (1 — если мать относится к верхнему квинтилю по весу, т. е. имеет вес 68 кг или больше, 0 — в других случаях); class — фиктивная переменная посещения занятий по предродовой подготовке (1 — если мать регулярно посещала эти занятия, 0 — в других случаях); UM — фиктивная переменная семейного положения (1 — если мать является одинокой, 0 — в противном случае); х — количество сигарет, выкуриваемых в день в период беременности.Последние три переменные представляют интерес для социальной политики; остальные включены в уравнение, потому что, как известно, они имеют отношение к частоте проведения операции кесарева сечения, и если они не будут включены, это может привести к смещению оценок коэффициентов регрессии.
Прогнозируемое значение emsec для любого наблюдения показывает вероятность родоразрешения путем кесарева сечения, если даны значения параметров в правой части уравнения. Коэффициент при каждой переменной увеличивает вероятность кесарева сечения для матери с соответствующим параметром. Например, эта вероятность на 8% ниже для матерей, которые рожали ранее, по сравнению с матерями, которые ранее не рожали.
Недостатки линейной вероятностной модели, как известно, связаны с тем, что ее случайный член не удовлетворяет обычным предположениям. В частности, он не распределен нормально, поэтому нельзя выполнить обычную проверку значимости. Кроме того, он может привести к появлению прогнозируемых значений зависимой переменной больше единицы или меньше нуля, что невозможно.
Для преодоления этих трудностей разработано несколько статистических методов, аналогичных методам построения линейной вероятностной модели, но основанных на других принципах. Возможно, наиболее широко известным из них является логит-анализ, основанный на методе максимального правдоподобия. Рассмотрение этого метода выходит за рамки данной книги, и достаточно отметить, что его возможное использование на практике во многом Совпадает с практическим применением регрессионного анализа.
В рассматриваемом примере логит-анализ дает следующий результат (в скобках приведены ^-статистики):
етв'ёс = Константа - 0,1 \П + 0,1 \оШ + 0,05еНоК + 0,05Нему - (0 (-4,61) (3,46) (2,45) (2,27)
- 0,02с/
Еще по теме Приложение 9.1:
- Приложение 4
- Приложение N 4 к Листу 02
- ПРИЛОЖЕНИЯ
- Приложения
- Приложение
- Приложение N 3 к Листу 02
- Приложения
- Приложения
- ПРИЛОЖЕНИЯ
- Приложения к главе 6
- Приложения