Психология от а до я: словарь-справочник — выборка
Типы выборок
Выборки делятся на два типа:
- вероятностные
- невероятностные
Вероятностные выборки
- Простая вероятностная выборка:
Процедура построения простой случайной выборки включает в себя следующие шаги:
1) необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;
2) определить предполагаемый объём выборки, то есть ожидаемое число опрошенных;
3) извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.
4) выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам
Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:
1) нередко сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.
2) результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.
3) результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.
4) в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объёме выборки.
Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.
- Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.
- Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.
- Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.
- «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки — с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.
Типы выборок
Выборки делятся на два типа:
- вероятностные
- невероятностные
Вероятностные выборки
-
Простая вероятностная выборка:
Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.
Процедура построения простой случайной выборки включает в себя следующие шаги:
1) необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;
2) определить предполагаемый объём выборки, то есть ожидаемое число опрошенных;
3) извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.
4) выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам
Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:
1) нередко сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.
2) результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.
3) результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.
4) в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объёме выборки.
Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.
- Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.
- Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.
- Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.
- «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки — с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.
Репрезентативность
Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.
Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы.
Пример нерепрезентативной выборки
В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году. Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, а также людям, выбранным по телефонным книгам всей страны и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:
- 57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону
- 40 % выбрали действующего в то время президента-демократа Франклина Рузвельта
На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов.
Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, — так как им было известно, что большинство их подписчиков считают себя республиканцами, — они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и высшего класса (то есть большинство республиканцев, а не демократов).
Зависимые и независимые выборки
При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок:
- пары близнецов,
- два измерения какого-либо признака до и после экспериментального воздействия,
- мужья и жёны
- и т. п.
В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например:
- мужчины и женщины,
- психологи и математики.
Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.
Сравнение выборок производится с помощью различных статистических критериев:
- Критерий Пирсона (χ2)
- Критерий Стьюдента (t)
- Критерий Вилкоксона (T)
- Критерий Манна — Уитни (U)
- Критерий знаков (G)
- и др.
Данные и их разновидности
Данные
в статистике — это основные элементы, подлежащие анализу. Данными
могут быть какие-то количественные результаты, свойства, присущие определенным
членам популяции, место в той или иной последовательности — в общем любая
информация, которая может быть классифицирована или разбита на категории с целью
обработки.
Не следует смешивать «данные» с теми «значениями», которые эти данные
могут принимать. Для того чтобы всегда различать их, Шатийон (Chatillon, 1977)
рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же
значения» (так, если мы возьмем, например, шесть данных — 8, 13, 10, 8, 10 и 5, то
они принимают лишь четыре разных значения — 5, 8, 10 и 13). Построение распределения — это разделение первичных данных, полученных
на выборке, на классы или категории с целью получить обобщенную упорядоченную
картину, позволяющую их анализировать.
Существуют три типа данных:
1. Количественные данные, получаемые при измерениях (например, данные
о весе, размерах, температуре, времени, результатах тестирования и т. п.). Их
можно распределить по шкале с равными интервалами.
2. Порядковые данные, соответствующие местам этих элементов в
последовательности, полученной при их расположении в возрастающем порядке (1-й,
…, 7-й, …, 100-й, …; А, Б, В. …).
3. Качественные данные, представляющие собой какие-то свойства
элементов выборки или популяции. Их нельзя измерить, и единственной их
количественной оценкой служит частота встречаемости (число лиц с голубыми или с
зелеными глазами, курильщиков и не курильщиков, утомленных и отдохнувших,
сильных и слабых и т.п.).
Из всех этих типов данных только количественные данные можно анализировать с
помощью методов, в основе которых лежат параметры (такие, например, как
средняя арифметическая). Но даже к количественным данным такие методы можно
применить лишь в том случае, если число этих данных достаточно, чтобы проявилось
нормальное распределение. Итак, для использования параметрических методов в
принципе необходимы три условия: данные должны быть количественными, их число
должно быть достаточным, а их распределение — нормальным. Во всех остальных
случаях всегда рекомендуется использовать непараметрические методы.
Начало Вперед »»»