Выборка опроса - Survey sampling

В статистика, выборка обследования описывает процесс выбора выборки элементов из целевой численность населения провести опрос. Период, термин "опрос "может относиться ко многим различным типам или методам наблюдения. В выборке обследования чаще всего используется вопросник, используемый для измерения характеристик и / или отношения людей. Различные способы связи с членами выборки после того, как они были отобраны, являются предметом сбор данных обследования. Цель отбор проб заключается в снижении стоимости и / или объема работы, которая потребуется для опроса всей целевой группы. Обследование, которое измеряет всю целевую совокупность, называется перепись. Образец относится к группе или разделу численность населения откуда следует получить информацию

Выборки опросов можно условно разделить на два типа: вероятностные и супервыборки. Выборки на основе вероятностей реализуют план выборочного контроля с заданными вероятностями (возможно, адаптированными вероятностями, определенными адаптивной процедурой). Выборка на основе вероятности позволяет сделать вывод о целевой группе населения на основе дизайна. Выводы основаны на известном объективном распределении вероятностей, которое было указано в протоколе исследования. Выводы, сделанные на основе вероятностных обследований, могут по-прежнему страдать от многих типов систематической ошибки.

Обследованиям, которые не основаны на вероятностной выборке, труднее измерить их смещение или ошибка выборки.[1] Опросы, основанные на маловероятных выборках, часто не отражают людей в целевой группе.[2]

В академических и правительственных исследованиях вероятностная выборка является стандартной процедурой. В Соединенных Штатах Управление управления и бюджета В «Перечне стандартов статистических обследований» говорится, что обследования, финансируемые из федерального бюджета, должны проводиться:

отбор образцов с использованием общепринятых статистических методов (например, вероятностных методов, которые могут предоставить оценки ошибки выборки). Любое использование не вероятностных методов выборки (например, отсечение или выборка на основе модели) должно быть статистически обосновано и иметь возможность измерить ошибку оценки.[3]

Случайная выборка и вывод на основе дизайна дополняются другими статистическими методами, такими как выборка на основе моделей и выборка на основе моделей.[4][5]

Например, многие опросы не получают ответов. Несмотря на то, что изначально единицы выбираются с известной вероятностью, механизмы отсутствия ответа неизвестны. Для опросов со значительным отсутствием ответов статистики предложили статистические модели, с помощью которых анализируются наборы данных.

Вопросы, связанные с выборкой для обследований, обсуждаются в нескольких источниках, в том числе в Salant and Dillman (1994).[6]

Вероятностная выборка

В вероятностной выборке (также называемой «научной» или «случайной» выборкой) каждый член целевой совокупности имеет известную и ненулевую вероятность включения в выборку.[7] Обследование, основанное на вероятностной выборке, теоретически может дать статистические измерения целевой группы, которые:

Выборка вероятностного обследования создается путем составления списка целевой группы, называемого основа выборки, рандомизированный процесс выбора единиц из совокупности выборки, называемый процедурой выбора, и метод связи с выбранными единицами, чтобы дать им возможность завершить опрос, называемый методом или режимом сбора данных.[10] Для некоторых целевых групп населения этот процесс может быть простым; например, выборка сотрудников компании с использованием списков заработной платы. Однако в больших, неорганизованных популяциях простое построение подходящей основы выборки часто является сложной и дорогостоящей задачей.

Распространенными методами проведения вероятностной выборки населения домохозяйств в США являются территориальная вероятностная выборка, выборка по телефону со случайным набором цифр и, в последнее время, выборка на основе адреса.[11]

В рамках вероятностной выборки существуют специальные методы, такие как стратифицированная выборка и выборочное обследование которые повышают точность или эффективность процесса выборки без изменения фундаментальных принципов вероятностной выборки.

Стратификация - это процесс разделения членов генеральной совокупности на однородные подгруппы перед выборкой на основе вспомогательной информации о каждой единице выборки. Страты должны быть взаимоисключающими: каждый элемент в совокупности должен быть отнесен только к одной страте. Страты также должны быть исчерпывающими в совокупности: нельзя исключать ни один элемент населения. Тогда такие методы, как простая случайная выборка или же систематический отбор проб может применяться в каждом слое. Стратификация часто улучшает репрезентативность выборки за счет уменьшения ошибки выборки.

Смещение в вероятностной выборке

Предвзятость в опросах нежелательна, но часто неизбежна. Основные типы систематической ошибки, которые могут возникнуть в процессе выборки:

  • Предвзятость, связанная с отсутствием ответа: Когда отдельные лица или домохозяйства, выбранные в выборке для обследования, не могут или не будут завершать обследование, существует вероятность систематической ошибки в результате этого отсутствия ответа. Смещение отсутствия ответов возникает, когда наблюдаемое значение отклоняется от параметра совокупности из-за различий между респондентами и не респондентами.[12]
  • Предвзятость ответа: Это не противоположность предвзятости, связанной с отсутствием ответов, а скорее связано с возможной тенденцией респондентов давать неточные или неправдивые ответы по разным причинам.
  • Смещение выбора: смещение выбора возникает, когда некоторые единицы имеют разную вероятность выбора, которая не учитывается исследователем. Например, некоторые домохозяйства имеют несколько телефонных номеров, поэтому вероятность их выбора при телефонном обследовании выше, чем у домохозяйств, имеющих только один номер телефона. Это смещение выбора можно исправить, применив вес опроса равное [1 / (количество телефонных номеров)] для каждой семьи.
  • Предвзятость самостоятельного выбора: Тип предвзятости, при котором люди добровольно выбирают себя в группу, тем самым потенциально искажая реакцию этой группы.
  • Предвзятость участия: Предвзятость, возникающая из-за характеристик тех, кто решил участвовать в опросе или опросе.
  • Систематическая ошибка охвата: систематическая ошибка охвата может иметь место, когда члены совокупности не фигурируют в структуре выборки (неполный охват). Смещение охвата возникает, когда наблюдаемое значение отклоняется от параметра совокупности из-за различий между охваченными и не охваченными единицами. Телефонные опросы страдают от хорошо известного источника систематической ошибки охвата, поскольку они не могут включать домохозяйства без телефонов.

Невероятностная выборка

Многие опросы основаны не на вероятностных выборках, а на поиске подходящей группы респондентов для завершения опроса. Вот несколько распространенных примеров маловероятной выборки:[13]

  • Образцы суждений: исследователь решает, какие члены популяции включить в выборку, основываясь на своем суждении. Исследователь может предоставить альтернативное обоснование репрезентативности выборки. Основное предположение состоит в том, что исследователь выберет единицы, характерные для популяции. Этот метод может быть подвержен предубеждениям и восприятию исследователя.[14]
  • Образцы снежного кома: часто используются, когда целевая популяция редка. Члены целевой группы населения набирают других членов населения для исследования.
  • Образцы квот: Выборка предназначена для включения определенного количества людей с определенными заданными характеристиками. Например, 100 любителей кофе. Этот тип выборки широко используется в не вероятностных исследованиях рынка.
  • Удобные образцы: Выборка состоит из лиц, к которым будет проще всего получить доступ для заполнения анкеты.

В не вероятностных выборках взаимосвязь между целевой группой и выборкой обследования неизмерима, а потенциальная систематическая ошибка неизвестна. Искушенные пользователи маловероятных выборок обследований склонны рассматривать обследование как экспериментальное условие, а не как инструмент измерения численности населения, и проверять результаты на предмет внутренне согласованных взаимосвязей.

Смотрите также

Рекомендации

  1. ^ «Невероятностный отбор проб - ААПОР». www.aapor.org. Получено 2020-05-24.
  2. ^ Вайсберг, Герберт Ф. (2005), Подход с общей погрешностью опроса, Издательство Чикагского университета: Чикаго. стр.231.
  3. ^ «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2009-06-12. Получено 2009-06-17.CS1 maint: заархивированная копия как заголовок (связь)
  4. ^ Лор. Брюэр. Шведы
  5. ^ Ричард Валлиант, Алан Х. Дорфман и Ричард М. Ройалл (2000), Конечная выборка населения и вывод: подход к прогнозированию, Wiley, New York, p. 19
  6. ^ Салант, Присцилла, И. Диллман и А. Дон. Как провести собственный опрос. № 300.723 S3. 1994 г.
  7. ^ Киш, Л. (1965), Обзорная выборка, Нью-Йорк: Wiley. п. 20
  8. ^ Киш, Л. (1965), Обзорная выборка, Нью-Йорк: Wiley. стр.59
  9. ^ http://www.aapor.org/Education-Resources/For-Researchers/Poll-Survey-FAQ/Why-Sampling-Works.aspx
  10. ^ Groves et al., Survey Methodology, Wiley: New York.
  11. ^ Майкл В. Линк, Майкл П. Батталья, Мартин Р. Франкель, Ларри Осборн и Али Х. Мокдад, Сравнение адресной выборки (ABS) и случайного набора номера (RDD) для общих обследований населения; Общественное мнение Q, весна 2008 г .; 72: 6 - 27.
  12. ^ «Глоссарий - Статистические стандарты NCES». nces.ed.gov.
  13. ^ «Методы выборочного обследования». www.statpac.com.
  14. ^ Правительство Канады, Статистическое управление Канады; Правительство Канады, Статистическое управление Канады (28 января 2009 г.). «Учебные ресурсы: Статистика: сила данных! Невероятностная выборка». www150.statcan.gc.ca.

дальнейшее чтение

В учебнике Groves et alia дается обзор методологии обследования, включая недавнюю литературу по разработке вопросников (предоставлено когнитивная психология ) :

  • Роберт Гровс, и др. Методология исследования (2010) Второе издание первого издания (2004 г.) ISBN  0-471-48348-6.

Другие книги посвящены статистическая теория выборки обследования и требуют некоторых знаний базовой статистики, как это обсуждается в следующих учебниках:

В базовой книге Шеаффера и других используются квадратные уравнения из школьной алгебры:

  • Шеффер, Ричард Л., Уильям Менденхал и Р. Лайман Отт. Выборка элементарного обследования, Издание пятое. Бельмонт: Duxbury Press, 1996.

Больше математической статистики требуется для Лора, Сэрндала и др. И Кохрана (классический):

Исторически важные книги Деминга и Киша по-прежнему ценны для понимания социологов (особенно о переписи населения США и Институт социальных исследований на университет Мичигана ):

внешняя ссылка