<<
>>

9.3. ВЕРОЯТНОСТНЫЕ И НЕВЕРОЯТНОСТНЫЕ СПОСОБЫ ПОСТРОЕНИЯ ВЫБОРКИ

Как уже отмечалось, самой важной классификацией спосо бов построения выборки является их классификация с разде лением на вероятностные и невероятностные способы. Неве роятностные способы базируются скорее на личном суждении исследователя, чем на вероятности для того или иного элемента попасть в выборку.
Исследователь осознанно или произвольно решает, какие элементы надо включить в выборку. Опыт пока зывает, что иногда невероятностные методы дают хорошие оценки характеристик исследуемой совокупности. В то же время, нельзя объективно оценить точность этих оценок. Поэ тому получаемые результаты, строго говоря, нельзя распростра нять на всю исследуемую совокупность. Наиболее часто ис пользуются следующие четыре невероятностных способа построения выборки:
выборка согласных (convenience sampling) — включение в выборку тех, кто согласен дать интервью;
выборка по усмотрению (judgmental sampling) — формиро вание выборки из элементов, которые исследователь считает нужным в нее включить;
метод квот (quota sampling) — формирование выборки из согласных или по усмотрению, но так, чтобы по интересующим исследователя показателям (например, по полу и возрасту) пропорции выборки соответствовали пропорциям исследуемой совокупности;
метод снежного кома (snowball sampling) — отбор первой порции респондентов случайным образом с последующим включением в выборку тех, кого укажут опрошенные ранее респонденты.
При использовании вероятностных способов построения выборки элементы, включаемые в нее, отбираются случайным образом. Можно заранее определить все потенциально воз можные выборки требуемого размера, которые могут быть извлечены из исследуемой совокупности. Соответственно, можно рассчитать вероятность того, что из исследуемой сово купности будет извлечена какая-либо определенная выборка. (Вовсе не обязательно, чтобы вероятность извлечения каждой была одной и той же). Для расчета вероятности нужно точное определение не только исследуемой совокупности, но и ис пользуемой основы выборки. Поскольку элементы ее отбира ются случайным образом, можно определить точность оценки интересующих исследователя характеристик. Можно рассчи тать доверительные (confidence) интервалы, внутри которых с определенной степенью достоверности содержится значение интересующей исследователя статистики, рассчитанное не по выборке, а по всей исследуемой совокупности. А это уже позволяет исследователю делать выводы относительно иссле дуемой совокупности.
Существует пять оснований для классификации вероятност ных способов построения выборки:
отбираются элементы или кластеры;
все единицы отбора имеют равную вероятность быть включенными в выборку или эти вероятности различны;
применяется или не применяется стратификация;
используется простой или систематический случайный отбор;
процесс отбора включает одну или несколько стадий.
Из перечисленных выше вариантов можно скомбинировать,
по крайней мере, 32 разных способа случайного построения выборки. Часть из них мы рассмотрим подробно, а некоторые другие — лишь наметим. Но прежде остановимся подробнее на невероятностных способах построения выборки.
НЕВЕРОЯТНОСТНЫЕ СПОСОБЫ ПОСТРОЕНИЯ ВЫБОРКИ
Выборка согласных (convenience sampling)
При использовании этого метода отбор и включение в выборку респондентов возлагается почти исключительно на интервьюеров.
Часто респондент выбирается потому, что в нужное время он оказался в нужном месте. Примерами тут могут служить: 1) опрос студентов, религиозных групп, членов общественных организаций; 2) опрос в магазинах всех респон дентов, согласившихся отвечать; 3) выборка магазинов, осу ществляющих продажи в кредит; 4) опрос, получаемый путем публикации отрывных анкет в журнале; 5) опрос типа «люди на улице».
Это самый дешевый и быстрый способ построения выбор ки. Отобранные таким образом респонденты наиболее просто достижимы и готовы к сотрудничеству. Несмотря на такое преимущество, возможности применения этого способа огра ничены из-за больших смещений. Исследуемую совокупность невозможно определить так, чтобы ее репрезентировала вы борка, построенная таким способом, и, следовательно, полу ченные на выборке результаты нельзя обобщать. Поэтому данный способ неприменим для описательных и причинных маркетинговых исследований, предполагающих такие обобще ния. Его допустимо применять в поисковых исследованиях: для генерации идей, догадок, гипотез. Его также можно ис пользовать для подбора участников фокус-групп, для тестиро вания анкеты или на пилотных стадиях исследования. Но даже в этих случаях при интерпретации полученных результатов следует проявлять осторожность. Тем не менее, как видно из следующего примера, этот способ иногда применяют и в больших исследованиях.
Пример. Деньги падают в цене.
Был проведен опрос 1300 согласившихся дать интервью из числа 1700 американских студенческих лидеров, собравшихся на 51-ю ежегодную национальную конференцию студенческих советов. Анкета из 39 вопросов на самые различные темы выявила, в частности, что жизненные ценности у студентов распределяются в следующем порядке: успешная карьера; удач ный первый брак; быть хорошими родителями; принести поль зу обществу. Такая ценность, как «делать большие деньги» заняла лишь пятое место.
Выборка по усмотрению (judgmental sampling)
Этот способ можно считать разновидностью предыдущего с той лишь разницей, что исследователь просит об интервью не у всех, а лишь у тех, кого он считает нужным включить в выборку. При этом исследователь полагает, что эти респонден ты лучше представляют исследуемую совокупность, или что они ему хорошо подходят по каким-либо другим причинам. Типичные примеры использования такого способа следующие:
1) тестовые продовольственные магазины, отобранные для оп робования нового продукта; 2) инженеры по закупкам, выбран ные в промышленном маркетинговом исследовании на том основании, что они репрезентируют компанию; 3) «лидеры мнений», опрашиваемые при изучении электорального поведе ния; 4) супермаркеты, отбираемые для тестирования новой системы наблюдения. Проиллюстрируем использование этого способа построения выборки примером из серии исследований для сети универмагов.
Пример. Исследования для сети универмагов
По усмотрению исследователя было отобрано 20 маршрутов переписи (Malhotra, 1996, р. 367). Выбирались наиболее типич ные, по мнению исследователя, многоквартирные дома. Дома, где живут очень бедные люди, и дома, в которых велики шансы встретить представителя криминальной среды, были исключе ны. Интервьюерам давалась следующая инструкция.
«Начинайте с юго-восточного угла дома. Обходите квартиры по часовой стрелке. После завершения интервью пропускайте 10 квартир и выбирайте одиннадцатую. Если подходящего респондента нет дома или он отказывается от интервью, пере ходите к следующей квартире. После того, как обход дома завершен, переходите к следующему дому. Продолжайте эту процедуру до тех пор, пока не выполните квотное задание».
В приведенном примере по усмотрению исследователя от бирались определенные маршруты, дома и домохозяйства. Такая выборка относительно дешева, строить ее удобно и быстро. Однако результаты нельзя обобщать на исследуемую совокупность хотя бы уже потому, что нельзя точно сформули ровать ее определение. Этот способ построения выборки очень субъективен; здесь многое зависит от мастерства исследователя. Тем не менее, метод широко используется в тех коммерческих маркетинговых исследованиях, в которых широкие обобщения не нужны.
Метод квот (quota sampling)
Метод квот можно рассматривать как двустадийный выбор по усмотрению, но с ограничениями. На первой стадии разра батываются контрольные ограничения или квоты, накладывае мые на отбираемые элементы. Для разработки квот исследова тель просматривает подходящие для контроля характеристики и выясняет, как они распределены в исследуемой совокупнос ти. Вопрос о том, какие именно характеристики выборки должны совпадать с соответствующими характеристиками ис-следуемой совокупности, решается по усмотрению исследова теля. Обычно это пол и возраст, а в США — еще и раса. При опросах в нашей стране ограничение обычно накладывается также и на долю лиц с высшим образованием. Это делается потому, что образованные люди чаще бывают контактными, а это приводит при отсутствии контроля к смещению выборки.
На второй стадии из числа согласных или по усмотрению интервьюера отбираются элементы исследуемой совокупнос ти. Здесь имеет место значительная свобода. Единственное условие — чтобы соблюдались квоты, то есть, например, чтобы доля мужчин в возрасте от 18 до 30 лет в выборке совпадала с их долей в исследуемой совокупности. Таким образом, метод квот гарантирует, что выборка будет отражать пропорции исследуемой совокупности по интересующим нас характеристикам.
Иногда квоты намеренно выбираются так, чтобы пропор ции выборки определенным образом отличались от пропор ций исследуемой совокупности. Например, иногда бывает полезно увеличить по сравнению с населением долю «тяжелых пользователей» продукта, поскольку их потребительское по ведение имеет существенную специфику. Такая выборка, ко нечно, нерепрезентативна, но временами оказывается весьма полезной.
Даже если такого рода «флюсы» не создаются и пропорции выборки по интересующим исследователя параметрам совпада ют с пропорциями исследуемой совокупности, нет увереннос ти, что выборка репрезентативна. Во-первых, выборка не будет репрезентативной, если остались не замеченными и не были квотированы параметры, важные для решения стоящих перед исследованием проблем. Во-вторых, если квот слишком много, интервьюерам иногда не удается их выдержать из-за практичес ких сложностей. В-третьих, интервьюеры нередко пользуются предоставленной им свободой выбора таким образом, что вы борка становится нерепрезентативной. Например, для соблю дения квот они отправляются в такой район, где выше вероят ность встретить нужного респондента, или для облегчения работы избегают заговаривать с плохо одетым или внешне недружелюбным человеком. В результате метод квот, как и прочие невероятностные способы построения выборки, тоже не позволяет статистически оценивать точность результатов исследования.
Метод квот представляет собой попытку за относительно низкую цену получить выборку, сходную по своим параметрам с исследуемой совокупностью. При наличии точной инструк ции и строгого контроля над работой интервьюеров этот метод дает результаты, близкие к тем, которые получаются при ис пользовании вероятностных выборок.
Метод снежного кома (snowball sampling)
При использовании этого метода первая порция респон дентов, как правило, отыскивается случайным образом. После окончания каждого интервью респондента просят назвать других представителей исследуемой совокупности. Каждую следующую порцию респондентов составляют те, кого указали предыдущие респонденты. В результате возникновения «эф фекта снежного кома» выборка быстро растет. Надо отметить, что, хотя первая порция респондентов отбирается случайным образом, полученные таким способом выборки не репрезен тативны. Смещение происходит оттого, что лица, которых указывает респондент, по своим социально-демографическим характеристикам более схожи с ним, чем это было бы при случайном отборе. Поэтому данный метод используется лишь по необходимости: когда нужно опросить представителей редко встречающейся группы людей и когда есть основание полагать, что многие из представителей этой группы знакомы с другими ее представителями. В частности, в промышленных исследованиях именно так отыскиваются пары «продавец-по купатель». Приведем другой пример использования этого ме-тода.
Пример. Поиск опытных интервьюеров методом снежного кома
Стояла задача изучить демографический профиль людей, работающих интервьюерами в штате Огайо. Для этого в газете было дано объявление, в котором опытных интервьюеров, работавших в области маркетинговых исследований, просили ответить на 25 вопросов о своей работе и прислать ответы автору. Число респондентов было многократно увеличено ме тодом снежного кома: каждого интервьюера просили указать имена и адреса своих коллег. В результате лишь 27% интервью пришли по почте благодаря объявлению в газете, а остальные — благодаря рекомендациям.
В приведенном примере на первой стадии случайный отбор не использовался. Процедура более эффективна, когда она начинается со случайного отбора.
ВЕРОЯТНОСТНЫЕ СПОСОБЫ ПОСТРОЕНИЯ ВЫБОРКИ
Вероятностные методы построения выборок характеризуют ся таким показателем, как эффективность. Концепция эффек тивности метода отражает компромисс между затратами и точностью. Точность характеризует степень неопределенности относительно значений измеряемых характеристик. Чем выше точность, тем выше затраты. Исследователь должен постараться выбрать наиболее эффективный план построения выборки, исходя из размера отпущенных средств. Эффективность веро ятностных методов можно оценивать, сравнивая точность их работы с точностью простой случайной выборки.
Простая случайная выборка (simple random sampling или SRS)
При построении простой случайной выборки (SRS) каждый элемент исследуемой совокупности имеет известную, причем одинаковую, вероятность попасть в выборку. Более того, из вестна и одинакова вероятность того, что в результате отбора будет получен любой конкретный вариант выборки данного размера (л). Отсюда следует, что элементы извлекаются из основы выборки случайным образом, причем независимо друг от друга. Этот метод можно представить как лотерею, в которой имена всех возможных респондентов помещаются в барабан и перемешиваются, после чего без всяких смещений извлекаются имена «победителей».
Для выбора элементов исследуемой совокупности раньше применяли таблицы случайных чисел, а сейчас — компьютер ные программы, генерирующие случайные последовательности чисел.


Метод SRS обладает рядом достоинств: он прост и легко объясним, выборочные оценки могут быть обобщены на всю исследуемую совокупность. Большинство статистических вы водов базируются на предположении, что выборка получена именно с его помощью.
Но этот метод имеет и очень серьезные недостатки, ограни-чивающие его применение. Во-первых, часто бывает очень труд но сконструировать основу выборки так, чтобы можно было извлечь из нее простую случайную выборку. Например, не существует собранных воедино компьютеризированных списков всех жителей России. И даже если бы такие списки существова ли, они ежесекундно бы устаревали. Во-вторых, выборка, полу ченная данным методом, часто оказывается настолько разбро санной географически, что исследование становится неприемлемым как по стоимости, так и по срокам. (Так, может «выпасть» по одному респонденту в сотнях дальних деревень, что потребует чрезвычайно высоких командировочных расходов). В-третьих, при небольшом размере выборки рассматриваемый метод может и не обеспечивать репрезентативности. Хотя в среднем такие выборки хорошо приближают население; каждая конкретная выборка может содержать сильные диспропорции.
Систематическая случайная выборка (systematic sampling)
При использовании этого метода случайным образом выби рается начальная точка, а затем извлекается каждый z'-й элемент в последовательно пронумерованной основе выборки. Шаг отбора (sampling interval) і определяется путем деления размера исследуемой совокупности N на размер выборки п. Например, если в исследуемой совокупности 100000 элементов и требуется извлечь выборку объемом 1000 элементов, то шаг отбора равен 100. В интервале от 1 до 100 выбирается случайное число. Пусть, например, выпало число 23. Тогда в выборку включают элемен ты с номерами 23, 123, 223, 323 и т.д.
Данный метод схож с методом построения простой случай ной выборки в том, что все элементы исследуемой совокупнос ти имеют одинаковую вероятность попасть в выборку. Различие же между ними состоит в том, что существует не С», а лишь п различных возможных выборок размера п. Вероятности по явления каждой из них одинаковы и равны 1/п\ вероятности же появления остальных выборок равны нулю.
Как уже говорилось, для построения систематической слу чайной выборки нужно, чтобы элементы, образующие иссле дуемую совокупность, были упорядочены по какому-либо при знаку. Иногда этот признак не имеет отношения к интересующим исследователя характеристикам (например, ал фавитный порядок фамилий в телефонной книге). В таких случаях методы систематического отбора и простого случайно го отбора дают очень близкие результаты.
Иногда же существует тесная связь между принципом упорядочения и исследуемыми характеристиками. Например, владельцы кредитных карт могут быть упорядочены по сумме неоплаченного кредита, а фирмы, относящиеся к определен ной отрасли — по сумме годовых продаж. В таких случаях систематический случайный отбор повышает репрезентатив ность выборок. Так, в первом из приведенных выше примеров выборка будет содержать соответствующие действительности доли владельцев кредитных карт с низкими, средними и высокими размерами неоплаченного кредита, а во втором примере — вполне определенное число малых, средних и больших фирм. Что же касается простой случайной выборки, то при небольших ее размерах существует довольно большая вероятность, что будут отобраны, например, только малые фирмы.
Однако бывают и случаи, когда систематическую выборку строить опасно. Если, скажем, элементы упорядочены по при знаку, имеющему циклический характер, выборка может быть менее репрезентативной, чем случайная. Рассмотрим пример, не имеющий практического значения, но зато наглядный. Пусть мы хотим провести интервью с покупателями в магазине и решаем проводить работу в течение четырех недель, но не во все дни, а только в те четыре дня, которые мы выбераем методом систематического случайного отбора. Предположим, первый день, который был случайным образом отобран для первой из четырех недель, оказался воскресеньем. Тогда вос кресеньями окажутся и остальные три дня проведения опроса. Понятно, что такой отбор не может привести к построению репрезентативной выборки.
Метод систематического отбора проще и дешевле, чем SRS, поскольку случайный выбор производится лишь однажды. Более того, при использовании этого метода вовсе не обяза тельно устанавливать взаимно однозначное соответствие между случайными числами и всеми элементами исследуемой совокупности. Это экономит много времени и, соответствен но, средств, поскольку такие списки нередко содержат мил лионы элементов. Вообще, метод систематического отбора можно применять даже тогда, когда мы совсем не знаем состав элементов, образующих исследуемую совокупность. Напри мер, можно опрашивать каждого /-го человека, выходящего из магазина. Благодаря этому преимуществу систематическая случайная выборка часто используется в почтовых, телефон ных опросах потребителей и в опросах в местах торговли, о чем свидетельствует следующий пример.
Желая лучше понять свой рынок, теннисный журнал про вел почтовый опрос своих подписчиков. Использовалась систематическая выборка размером 1472 респондента из имевшегося у журнала списка подписчиков. Для простоты предположим, что в этом списке содержалось 1472 тысячи адресов. Тогда шаг отбора равнялся тысяче (1472000/1472=1000). Число от 1 до 1000 выбиралось случай ным образом. Пусть, например, выпало число 738. Тогда из списка отбирались адреса с номерами 738, 1738, 2738 и т.д. Всего 1472 адреса.
В качестве стимула вместе с анкетой респондентам рассы-лались счета на один доллар. Письма были отправлены респон дентам. Через десять дней по всем адресам были разосланы письма с напоминаниями и дополнительными экземплярами анкет (follow-up). 76 писем из первой рассылки было возвраще но почтой. Через шесть недель после первой рассылки было получено 778 заполненных анкет; таким образом, их доля составила 56% от числа респондентов, получивших письма (778/(1472-76)* 100).
Метод стратификации (stratified sampling)
Построение стратифицированной выборки представляет собой двустадийный процесс, в ходе которого множество элементов, образующих исследуемую совокупность, разделя ется на подмножества или страты так, что каждый ее элемент входит в одну и только одну страту. Затем в каждой страте отбирается нужное число элементов. Формально для отбора в стратах должна использоваться процедура простого случайно го отбора (SRS). Практически же иногда применяют система тический отбор или другие вероятностные процедуры. Таким образом, в отличие от метода квот, здесь отбор осуществля ется не по усмотрению или исходя из согласия респондентов, а вероятностными методами. Основная цель стратифика ции — повысить точность без увеличения цены.
Первое решение, которое принимает исследователь при использовании данного метода, касается параметров стратифи кации. то есть переменных, на основе которых исследуемая совокупность делится на страты.
При отборе этих параметров исходят из следующих сообра жений. Во-первых, элементы, составляющие каждую страту, должны быть как можно более сходными между собой. Во-вто рых, элементы, входящие в разные страты, должны быть как можно более разными. В-третьих, параметры стратификации должны быть как можно теснее связаны с интересующими исследователя характеристиками: чем теснее эта связь, тем точнее получаемые оценки. Наконец, в-четвертых, переменные стратификации должны быть такими, чтобы процесс стратифи кации был простым и удобным в работе, и, следовательно — дешевым.
Обычно для стратификации, как и для квотирования, используют демографические характеристики, тип потребите ля (например, владельцы кредитных пластиковых карт и плас тиковых карт, не дающих права кредитования), размер фирмы или отрасль. Вообще, можно выбирать две и более перемен ных стратификации одновременно, но более двух — крайне редко, так как это сложно и дорого. Хотя число страт уста-навливается по усмотрению исследователя, обычно их бывает не более шести. Если их больше, то выигрыш в точности оценок обычно оказывается меньше, чем рост затрат на стра тификацию и построение выборки.
Проиллюстрируем выбор параметров стратификации при мером. В ряду еженедельных телефонных опросов был прове ден опрос 1030 респондентов (525 женщин и 505 мужчин), посвященный туризму (Malhotra, 1996, р. 372). Для стратифи кации использовались четыре переменные: пол, возраст, доход и место жительства. Исследование показало, что разли чия в отношении к путешествиям наблюдаются только между людьми разного возраста. Так, в возрасте 25-49 лет, когда с наибольшей вероятностью в семье есть дети, люди отдают предпочтение поездкам в город Орландо или в штат Флорида. У тех, кому 65 лет и более, наиболее популярны поездки в штат Вашингтон или центральный район (D. С.) Наиболее важным приоритетом путешествия являются для лиц в воз расте от 18 до 34 лет. Таким образом, полезным параметром стратификации оказался только возраст. Если бы это было известно заранее, стоимость исследования можно было бы снизить, не уменьшая точности.
Вторым важным решением, которое надо принять при построении стратифицированной выборки — это выбор между пропорциональным и непропорциональным отбором. При пропорциональном отборе число элементов, извлекае мых из каждой страты, пропорционально ее размеру. При непропорциональном отборе из каждой страты извлекается число элементов, пропорциональное произведению относи тельного размера страты на стандартное отклонение распре деления интересующей исследователя характеристики на всех элементах страты. Идея, лежащая в основе непропорци онального выбора, проста. С одной стороны, чем больше относительный размер страты, тем сильнее она влияет на общее среднее значение интересующей исследователя харак теристики и для отражения ее роли из нее надо извлечь больше элементов. С другой стороны, чтобы повысить точ ность, нужно извлечь больше элементов из тех страт, где сильнее колебания интересующей исследователя характерис тики, и меньше — из страт, где эти колебания малы. Напри мер, если значения исследуемой характеристики на всех элементах какой-либо страты в точности одинаковы, из нее достаточно включить в выборку лишь один элемент. Таким образом, пропорциональный отбор можно считать частным случаем непропорционального отбора для случая, когда стан дартные отклонения во всех стратах априори считаются рав ными.
Как мы видим, непропорциональный отбор возможен, когда можно заранее хотя бы приблизительно оценить стандартные отклонения изучаемого параметра в каждой страте. Если такой информации нет, то при определении доли выборки, приходя щейся на каждую страту, исследователь может полагаться на логику и интуицию. Например, можно предположить, что крупные магазины больше различаются в плане объема продаж какого-либо товара, чем мелкие.
Есть еще один важный частный случай: если исследователя интересуют главным образом различия между стратами, то число элементов, извлекаемых из каждой страты, должно быть одинаковым.
При использовании стратифицированной выборки можно быть уверенным, что все важные подгруппы респондентов присутствуют в выборке. Это особенно важно, когда распреде ление измеряемой характеристики в существенной степени асимметрично. Так, поскольку годовой доход большинства американских семей составляет менее 50 тыс. долларов в год, распределение дохода асимметрично. Очень мало семей имеют доход 125 тыс. долларов или выше. При построении простой случайной выборки вполне вероятно, что эта категория семей не будет адекватно представлена в выборке. Стратифицирован ная же выборка гарантирует пропорциональное представитель ство высокодоходных семей. Таким образом, стратифициро-ванная выборка соединяет в себе простоту построения, свойственную простой случайной выборке, и потенциальный выигрыш в точности. Этим и объясняется популярность дан ного метода.
Метод кластеризации (cluster sampling)
При использовании метода кластеризации, как и при ис-пользовании метода стратификации, множество элементов, об разующих исследуемую совокупность, разделяется на опреде ленное число непересекающихся подмножеств, называемых уже не стратами, а кластерами. При использовании метода стратификации в выборку обязательно попадают представители всех страт. Здесь же, наоборот, производится случайный (ме-тодом SRS) выбор кластеров, чьи элементы затем будут вклю чаться в выборку. Если в выборку включаются все элементы отобранных кластеров, процедура называется одностадийной. Если из каждого кластера случайным образом извлекаются и включаются в выборку некоторые элементы, процедура назы вается двустадийной. Если перед отбором отдельных элементов внутри выбранных на первой стадии кластеров сначала выде-ляются более мелкие кластеры, определенное число которых вновь отбирается случайными методами, процедура называется трех- или более стадийной.
Кластеры можно отбирать либо с равной вероятностью с помощью простого случайного отбора (simple two-stage cluster sampling), либо с вероятностью, пропорциональной размеру кластеров (PPS — probability proportionate to size sampling).
Кластеризация направлена на экономию затрат без сущест венного снижения точности, а не на повышение точности без увеличения затрат.
В отношении же гомогенности и гетерогенности требова ния к кластерам диаметрально противоположны тем, которые предъявляются к стратам. Элементы внутри кластера должны быть как можно более разнообразными, гетерогенными, а сами кластеры — как можно более похожими между собой. В идеале каждый кластер — уменьшенная копия всей иссле дуемой совокупности.
Важным преимуществом метода является то, что строить основу выборки необходимо не для всей исследуемой совокуп ности, а только для отобранных путем случайной процедуры кластеров.
Кластеры чаще всего выделяются по территориальному при знаку, то есть представляют собой районы, улицы, многоквар тирные дома и т.д. Такой метод построения выборки естествен но назвать территориальным (area sampling).
Приведем пример использования метода кластеризации с последующим отбором одинакового числа респондентов из каждого кластера. Целью маркетингового исследования было изучить поведение состоятельных людей. Для этого на первом шаге из микрорайонов, средний доход жителей которых по данным переписи превышает 50 тыс. долларов в год, была извлечена простая случайная выборка из 800 микрорайонов. Затем в коммерческой организации были приобретены списки фамилий и адресов примерно 95% семей, проживающих в этих 800 микрорайонах. Эти домохозяйства были пронумерованы от 1 до 213000; 9000 из них были отобраны с помощью простого случайного отбора (SRS).
Такой механизм отбора пригоден, если все кластеры при мерно одинакового размера. Если это не так, могут возникать смещения оценок. Поэтому иногда размеры кластеров пыта ются сделать приблизительно равными путем слияния или разделения некоторых из них. Если это невозможно, необхо димо применять не простой случайный отбор (SRS), а отбор, пропорциональный размеру кластеров (PPS), причем размер кластера измеряется числом содержащихся в нем единиц отбора.
Итак, на первом шаге вероятность того, что кластер будет отобран, прямо пропорциональна его размеру. На втором шаге из каждого выбранного кластера извлекается примерно одина ковое число единиц отбора. Поэтому вероятность того, что на втором шаге будет выбрана единица отбора, входящая в один из отобранных ранее кластеров, обратно пропорциональна размеру последнего. Благодаря такой процедуре каждый эле мент исследуемой совокупности может попасть в выборку с равной вероятностью.
Метод кластеризации имеет два важных преимущества: гиб кость и невысокая стоимость. Часто единственная доступная основа выборки — это перечень кластеров, а не элементов целевой совокупности. Например, нельзя за разумное время и в пределах имеющихся средств составить список всех квартир в городе. Считая же кластерами избирательные участки города и зная численность их населения, можно случайным образом отобрать несколько участков и составить список находящихся там квартир. Метод кластеризации — самый дешевый и пото му — самый эффективный из всех вероятностных методов построения выборки.
Есть у метода кластеризации и два серьезных недостатка. Во-первых, нередко выборка получается относительно неточ ной, поскольку на практике очень сложно сформировать гетерогенные кластеры. Например, люди, живущие в одном доме, скорее похожи, чем не похожи друг на друга. Во-вторых, при использовании метода кластеризации бывает затрудни-тельным построение статистик для оценки точности резуль татов.
Другие вероятностные методы построения выборки
Наряду с описанными четырьмя основными методами по строения выборки, существуют и другие, большинство которых представляют собой модификации основных методов, разрабо танные специально для решения каких-либо специфических проблем. Рассмотрим лишь две из этих модификаций, имею щие определенное отношение к маркетинговым исследовани ям: последовательное построение выборки (sequential sampling) и двойное или двустадийное построение выборки (double sam pling, two-phase sampling).
При последовательном построении выборки ее размер зара нее не определяется. Определяется лишь правило, на основа нии которого принимается решение о необходимом размере выборки. Данные собираются поэтапно. По окончании каждо го этапа отбора данные анализируются, и принимается решение о необходимости продолжения отбора.
Такой метод построения выборки удобен, например, когда возникает альтернатива. На каждой стадии респондентов спра шивают, какой из двух возможных товаров они бы предпочли. Когда их предпочтения становятся ясны с достаточно высокой степенью достоверности, процесс сбора новых данных прекра щается.
При двойном (двухстадийном) построении выборки на первой стадии строится большая по объему выборка и про водится краткий опрос. На основе этой информации строит ся небольшая выборка из элементов, охваченных первым опросом, и собирается дополнительная, углубленная инфор мация.
Такой метод полезен, когда невозможно получить основу для построения требуемой выборки, но известно, что она составляет часть основы для более широкой выборки. Тогда на первой стадии выясняется, например, кто из респондентов пьет яблочный сок и в каком примерно объеме, а на второй стадии строится выборка, стратифицированная по объему потребле ния сока, и собирается информация, например, о тонкостях выбора. Если стратификация не проводится, стадии могут проводиться одновременно.
СРАВНИТЕЛЬНЫЕ ХАРАКТЕРИСТИКИ И КРАТКАЯ СХЕМА ИСПОЛЬЗОВАНИЯ ОСНОВНЫХ МЕТОДОВ ПОСТРОЕНИЯ ВЫБОРКИ
Завершая рассмотрение методов построения выборки, при ведем результаты их краткого сопоставительного анализа (табл. 22).
Табл. 22.
Сравнительные характеристики разных методов построения выборки Методы Преимущества метода Недостатки метода Невероятностные Выборка согласных (convenience sampling) Требует наименьших за-трат времени и средств, наиболее удобен в работе Смещение отбора, выбор ка не репрезентативна. Не рекомендуется использо-вать для описательных и причинных исследований Выборка по усмотре нию (jud&nental sampling) Требует небольших за трат времени и средств, удобен в работе Не позволять обобщать полученные результаты Метод квот (quota sampling) Позволяет проконтроли-ровать определенные ха-рактеристики Смещение отбора, нет уверенности в репрезента-тивности Метод снежного кома (snowball sampling) Позволяет оценивать ха-рактеристики редко встречающихся катего рий лиц Требует больших затрат времени Вероятностные Простая случайная вы-борка (simple random samp ling или SRS) Легко объясняем, можно обобщать результаты Трудно сконструировать основу выборки, высокая стоимость, незначитель ная точность, при неболь ших выборках возможна нерепрезентативность Систематическая слу-чайная выборка (systematic sampling) Может повысить репре-зентативность, проще применять, чем SRS, не требует построения осно-вы выборки Может уменьшить репре-зентативность в случае пе-риодичности Метод стратификации (stratified sampling) Высокая точность, в вы-борку включаются все важные категории объек-тов целевой совокупности Трудно подобрать соот-ветствующие задаче пара-метры стратификации, трудно стратифицировать по многим переменным сразу, высокие затраты Метод кластеризации (cluster sampling) Невысокая стоимость, простота Невысокая точность, труд-но оценивать точность ре-зультатов

Простая случайная выборка (simple random sampling или SRS)
Подбирается подходящая основа выборки.
Элементы нумеруются от 1 до N (размера выборки).
Генерируется на компьютере или находится в таблице п (размер выборки) различных случайных чисел в интервале от 1 до N.
В выборку включаются единицы отбора с соответствую щими номерами.
Систематическая случайная выборка (systematic sampling)
Подбирается подходящая основа выборки.
Элементы нумеруются от 1 до N (размера выборки).
Определяется шаг выборки: / = N/n.
Выбирается случайное число г на интервале от 1 до /.
В выборку включаются элементы с номерами г, r+i, r+2i, r+3i, ..., (n-l)i. Если это дроби, они округляются до ближайшего целого числа.
Метод стратификации (stratified sampling)
Подбирается подходящая основа выборки
Подбирается одна или несколько переменных стратифи кации и выбирается число страт Н.
Исследуемая совокупность разделяется на Я страт так, что каждый элемент входит в одну и только одну страту в зависимости от значений параметров стратификации.
Элементы, входящие в каждую страту, нумеруются от 1 до Nh, где Л/, — число элементов исследуемой совокупности в страте.
На основе пропорционального или непропорционального
отбора определяется размер выборки, извлекаемой из каж-
н
дой страты nh, где = п .
h=I
В каждой страте извлекается простая случайная выборка размером nh.
Метод кластеризации (cluster sampling)
Опишем процедуру двустадийного пропорционального от бора, т.к. чаще всего используется именно она.
Исследуемая совокупность разделяется на С кластеров, из которых с будут включены в выборку.
Элементы исследуемой совокупности нумеруются от 1 до N так, что сначала перенумеровываются элементы первого кластера, затем — второго и т.д.
Рассчитывается шаг отбора, /, i=N/c. Если это дробь, она округляется до ближайшего целого числа.
Как при построении систематической случайной выборки в интервале от 1 до і выбирается случайное число г.
Выявляются элементы с номерами г, r+i, r+2i, r+3i, ..., r+(c-l)i. Если это дроби, они округляются до ближайшего целого числа.
Отбираются кластеры, содержащие выявленные элементы.
В каждом кластере путем простого или систематического отбора выбираются единицы отбора. Число единиц отбора из каждого кластера примерно одинаково и равно я/с.
Если число элементов в каком-либо кластере превышает шаг отбора, этот кластер будет отбираться вне зависимос ти от того, какое случайное число выпало на четвертом шаге алгоритма. Такой кластер включается в выборку и исключается из дальнейшего рассмотрения. Рассчитыва ется новый размер исследуемой совокупности N*, новое число кластеров, которые должны отбираться случайным образом с* (равное с-Г) и новый шаг отбора /*. Такая процедура повторяется до тех пор, пока число элементов во всех кластеров не станет меньше шага отбора. Если b кластеров отбираются с определенностью, то остальные с-Ь кластеров отбираются в соответствии с процедурой, описанной в пунктах 1-7. На одну единицу отбора, кото рая должна попасть в выборку, приходится в среднем n/N единиц отбора в исследуемой совокупности. Поэтому из b кластеров, с определенностью представленных в выбор ке, отбирается ns~~jj'(N,+N2+... + Nb) единиц отбора. Соответственно, на кластеры, выбираемые случайным об разом, приходятся остальные n*=n-ns единиц отбора.
<< | >>
Источник: Галицкий Е.Б.. Методы маркетинговых исследований. 2004

Еще по теме 9.3. ВЕРОЯТНОСТНЫЕ И НЕВЕРОЯТНОСТНЫЕ СПОСОБЫ ПОСТРОЕНИЯ ВЫБОРКИ:

  1. 9.4. ВЫБОР МЕЖДУ ВЕРОЯТНОСТНЫМИ И НЕВЕРОЯТНОСТНЫМИ МЕТОДАМИ ПОСТРОЕНИЯ ВЫБОРКИ
  2. 9.2. ПРОЦЕСС ПОСТРОЕНИЯ ВЫБОРКИ
  3. 9. ПОСТРОЕНИЕ ВЫБОРКИ
  4. 10.5. Смещение при построении выборки
  5. 9.5. УЧЕТ МЕСТНЫХ ОСОБЕННОСТЕЙ ПРИ ВЫБОРЕ МЕТОДА ПОСТРОЕНИЯ ВЫБОРКИ
  6. § 3. Методический раздел программы. Построение выборкиПонятие выборки
  7. Способы построения организации.
  8. Способы построения сети банкоматов
  9. Способы построения адекватной характеристики.
  10. Вычет по НДС по объектам строительства, построенным хозяйственным способом
  11. 44. СПОСОБЫ ВЫРАЖЕНИЯ ПОБУЖДЕНИЯ В СОВРЕМЕННОМ РУССКОМ ЯЗЫКЕ, СПЕЦИАЛЬНЫЕ ПРИЕМЫ ПОСТРОЕНИЯ И РЕЧЕВЫЕ НОРМЫ ПОБУДИТЕЛЬНЫХ ЖАНРОВ
  12. Оценка аудиторского риска при применении выборочных вероятностно-статистических процедур
  13. 10.1. Линейная вероятностная модель