Генеральная и выборочная совокупности. Метод выборки 5 генеральной совокупности

Раздел 2. Выборочная и генеральная совокупность

Генеральная и выборочная совокупности.

Статистическая совокупность

Генеральная (включает все единицы наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования.) Генеральная совокупность может рассматриваться не только в пределах конкретных производств или территориальных границ, но также и ограничиваться другими признаками (пол, возраст) и их сочетанием.

Таким образом, в зависимости от цели исследования и его задач изменяются границы генеральной совокупности, для этого используют основные признаки, ее ограничивающие.

Выборочная (часть генеральной совокупности, которая должна быть репрезентативной по отношению к генеральной и наиболее полно отражать ее свойства). На основе анализа выборочной совокупности можно получить достаточно полное представление о закономерностях, присущих всей генеральной совокупности.

Выборочная совокупность должна быть репрезентативной, т. е. в отобранной части должны быть представлены все элементы и в таком же соотношении, как в генеральной совокупности. Иными словами, выборочная совокупность должна отражать свойства генеральной совокупности, т. е. правильно ее представлять. Репрезентативность должна быть количественной и качественной.

Количественная - основана на законе больших чисел и означает достаточную численность элементов выборочной совокупности, расчитываемую по специальным формулам и таблицам.

Качественная - основана на законе вероятности и означает соотвестиве (однотипность) призщнаков, характеризующих элементы выборочной совокупности по отношению к генеральной.

Методы формирования выборки:

-случайная выборка - отбор единиц наблюдния наугад.

-Механическая выборка - арифметический подход к отбору едниц наблдения типологическая выборка - при формировании генеральная совокупность предварительно делится на типы с послед. отбором единиц наблюдения из каждой типичесской группы. При этом число единиц можно отобрать пропорционально численности типической группы и непропорционально- Серийная выборка (гнездовой выбор) - формируется с помощью отбора не отдельных единиц наблюдения, а целых групп, серий, или гнезд, в состав которых входят организованные отдельным образом единицы наблюдения

Метод многоступенчатого отбора - по количеству этапов различают отдноступенчатый, двуступенчатый, терхступенчатый и т.д. метод направленного выбора - позволяет выявить влияние неизвестных факторов при устанавлении влияния известных

Алгоритмы параметрических критериев.

Параметрические критерии применяются для выборок с нормальным законом распределения. Формула расчета этих критериев содержат параметры выборки: среднее, дисперсии и др. Поэтому они называются параметрическими. Нормальность закона распределения должна быть статистически доказана с помощью одного из критериев согласия: критерий Пирсона, F-критерия Фишера, -критерия Колмогорова и др.


В ряде случаев параметрические критерии мощнее непараметрических критериев. У последних выше вероятность возникновения ошибки второго рода – принятия ложной нулевой гипотезы.


К параметрическим методам относятся следующие:

– Критерий Стьюдента

– Критерий Фишера

– Методы однофакторного анализа

– Методы двухфакторного анализа

Критерий Стьюдента


Назначение.
Критерий позволяет оценивать различия средних значений выборок, имеющих нормальное распределение.

Описание критерия.

Критерий применим для сравнения средних значений двух выборок полученных до и после воздействия некоторого фактора.

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

Зависимые(связанные) и независимые (несвязанные) выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установитьгомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называютсязависимыми . Примеры зависимых выборок:

  • пары близнецов,
  • два измерения какого-либо признака до и после экспериментального воздействия,
  • мужья и жёны
  • и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаютсянезависимыми , например:

  • мужчины иженщины ,
  • психологи иматематики .

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Двухвыборочный t-критерий для независимых выборок


Для двух несвязанных выборок(наблюдения не относятся к одной и той же группе объектов) возможны два варианта расчета:

    • когда дисперсии известны
    • когда дисперсии неизвестны, но равны друг другу.

Где

квадратичного отклонения. Здесь и – оценки дисперсий.


Рассмотрим сначала равночисленные выборки. В этом случае

В случае наравночисленных выборок , выражение

В обоих случаев подсчет числа степеней свободы осуществляется по формулам

Понятно, что при численном равенстве выборок

Эмпирическое значениекритерия Стьюдента сравнивается с критическим значением(по таблице 1 приложения) для данного числа степеней свободы.


Нулевая гипотеза .

Пример рассчитаем на лабораторной работе.


Пример.

Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальных группах. В экспериментальную группу (Х) входило 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог приверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем та же величина у людей, не занимающихся спортом.



Группы


Отклонения от среднего


Квадраты отклонений

X

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56

-

3136

-

Сумма

4734

5104

0

0

28632

18174

Среднее

526

638

Cредне арифметические значенияXи У:, в контрольной группе.

Тогда

^ Число степеней свободы k=9+8-2=15

По таблице приложения для данного числа степеней находим

Строим ось значимости






Т.о. обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне или иначе говоря средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше чем в группе людей активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза Н1 – о различии между экспериментальной и контрольной группой.

Двухвыборочный t-критерий для зависимых(связанных) выборок

Под связанными выборками понимаются наблюдения для одной группы объектов, причем все наблюдения попарно связаны с каждый объектом исследования и характеризуют его состояние до воздействия и после воздействия некоторого фактора.

Гипотезы

: среднее значение в выборке не отличается от нуля.

: среднее значение в выборке отличается от нуля.

1. Предварительно проверяется нормальность закона распределения по одному из критериев согласия.

2. Рассчитывается(i=1..n) – попарные разности вариант,ирезультаты измерений дляi- го объекта до и после воздействия некоторого фактора. Величинубудем считать независимой для разных объектов и нормально распределенной

3. Рассчитываются (лучше в табличной форме): сумма попарных разностейи вспомогательные параметрыи.

4. Рассчитывается- эмпирическое значение критериястепенями свободы по формуле

Где n – численность выборки.

5.Найденное эмпирическое значение критерия Стьюдента сравнивается с критическим значением (по таблице 1 приложения) для данного числа степеней свободы.
Нулевая гипотеза при заданном уровне значимости принимается, если эмпирическое значение .

Критическое значение для выбранной вероятности и заданного числа степеней свободы можно найти по встроенной в Excel функции СТЬЮДРАСПОБР.


Пример.

Психолог предположил, что в результате тренировки, время решения эквивалентных задач (т.е. имеющих один и тот же алгоритм решения) будет значительно уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задачи.


Решение задачи представим в таблице.


Номер испытуемого


1 задача


3 задача

Лекция 6. Элементы математической статистики

Вопросы для контроля знаний и подведения итога прочитанной лекции

1. Дайте определение случайной величины.

2.Напишите формулы для математического ожидания и дисперсии дискретной и непрерывной случайных величин.

3. Дайте определение локальной интегральной предельная теорем Лапласа

4. Напишите формулы, задающие биномиальное распределение, гипергеометрическое распределение, распределение Пуассона, равномерное распределение и нормальное распределение.

Цель: Изучить основные понятия математической статистики

1. Генеральная совокупность и выборка

2. Статистическое распределение выборки. Полигон. Гистограмма.

3. Оценки параметров генеральной совокупности по ее выборке

4. Генеральная и выборочная средние. Методы их расчета.

5. Генеральная и выборочная дисперсии.

6. Вопросы для контроля знаний и подведения итога прочитанной лекции

Мы приступаем к изучению элементов математической статистики, в которой разрабатываются научно обоснованные методы сбора статистических данных и их обработки.

1. Генеральная совокупность и выборка. Пусть требуется изучить множество однородных объектов (это множество называется статистической совокупностью) относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным - контролируемый размер детали.

Лучше всего произвести сплошное обследование, т.е. изучить каждый объект. Однако в большинстве случаев по разным причинам это сделать невозможно. Препятствовать сплошному обследованию может большое число объектов, недоступность их. Если, например, нужно знать среднюю глубину воронки при взрыве снаряда из опытной партии, то, производя сплошное обследование, мы уничтожим всю партию.

Если сплошное обследование невозможно, то из всей совокупности выбирают для изучения часть объектов.

Статистическая совокупность, из которой отбирают часть объектов, называется генеральной совокупностью. Множество объектов, случайно отобранных из генеральной совокупности, называют выборкой.

Число объектов генеральной совокупности и выборки называют соответственно объемом генеральной совокупности и объемом выборки.

Пример 10.1. Плоды одного дерева (200 шт.) обследуют на наличие специфического для данного сорта вкуса. Для этого отбирают 10 шт. Здесь 200 - объем генеральной совокупности, а 10 - объем выборки.

Если выборку отбирают по одному объекту, который обследуют и снова возвращают в генеральную совокупность, то выборка называется повторной. Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной.



На практике чаще используется бесповторная выборка. Если объем выборки составляет небольшую долю объема генеральной совокупности, то разница между повторной и бесповторной выборками незначительна.

Свойства объектов выборки должны правильно отражать свойства объектов генеральной совокупности, или, как говорят, выборка должна быть репрезентативной (представительной). Считается, что выборка репрезентативна, если все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку, т. е. выбор производится случайно. Например, для того чтобы оценить будущий урожай, можно сделать выборку из генеральной совокупности еще не созревших плодов и исследовать их характеристики (массу, качество и пр.). Если вся выборка будет сделана с одного дерева, то она не будет репрезентативной. Репрезентативная выборка должна состоять из случайно выбранных плодов со случайно выбранных деревьев.

2. Статистическое распределение выборки. Полигон. Гистограмма. Пусть из генеральной совокупности извлечена выборка, причем х 1 наблюдалось n 1 , раз, х 2 - п 2 раз, ..., х k - n k раз и n 1 +n 2 +…+ п k = п - объем выборки. Наблюдаемые значения x 1 , x 2 , …, x k называют вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом. Числа наблюдений n 1 , n 2 , …, n k называют частотами, а их отношения к объему выборки , , …, - относительными частотами. Отметим, что сумма относительных частот равна единице: .

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (непрерывное распределение). В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал. Для графического изображения статистического распределения используют полигоны и гистограммы.

Для построения полигона на оси Ох откладывают значения вариант х i , на оси Оу - значения частот п i (относительных частот ).

Пример 10.2. На рис. 10.1 показан полигон следующего распределения

Полигоном обычно пользуются в случае небольшого числа вариант. В случае большого числа вариант и в случае непрерывного распределения признака чаще строят гистограммы. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала п i , - сумму частот вариант, попавших в i -интервал. Затем на этих интервалах, как на основаниях, строят прямоугольники с высотами (или , где п - объем выборки).

Площадь i частичного прямоугольника равна , (или ).

Следовательно, площадь гистограммы равна сумме всех частот (или относительных частот), т.е. объему выборки (или единице).

Пример 10.3. На рис. 10.2 показана гистограмма непрерывного распределения объема n = 100, приведенного в следующей таблице.

Множество социальных объектов, явлений, процессов, которые являются предметом изучения социологического исследования, образуют генеральную совокупность . Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет.

Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью .

Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. Выборочная совокупность конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.

Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.

Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются исследованию.

Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора). Единицами отбора могут выступать как отдельные индивиды, так и целые коллективы или целые группы (например, при проведении сплошного опроса).

При совпадении единицы наблюдения с единицей отбора применяется одноступенчатая (простая) выборка, при несовпадении – многоступенчатая (сложная) выборка.

Объем выборки зависит от ряда факторов:

· от цели и задач исследования,

· от степени однородности генеральной совокупности,

· от величины доверительной вероятности,

· от точности результатов (величины допускаемой ошибки репрезентативности).

В таблице 4 приведено соотношение генеральной совокупности и объема выборки.

Таблица 4. Соотношение объемов генеральной и выборочной совокупностей.

Представленная таблица отражает многолетний опыт работы социологов, нередко используется при отсутствии данных о генеральной совокупности, что делает невозможным применение формулы.

Определения объема выборочной совокупности недостаточно для ее изучения. Необходимо определиться с видом выборки.

Различаются выборки вероятностные и целенаправленные .

Модель вероятностной (случайной ) выборки связана с понятием вероятности, широко используемым во многих социальных науках. В самом общем случае вероятность некоторого ожидаемого события есть отношение числа всех возможных событий к числу ожидаемых. При этом общее число событий должно быть достаточно большим (статистически значимым). Кроме этого, необходимо создать условия равновероятности отбора единиц. Условие равновероятности должно гарантировать для каждого элемента генеральной совокупности попасть в выборочную. Такая ситуация возможна при равномерном распределении элементов генеральной совокупности.

Существуют различные методы вероятностной (случайной) выборки:

· метод собственно-случайного отбора,

· случайно-бесповторный метод,

· случайно-повторный,

· метод механической выборки (например, каждый десятый элемент генеральной совокупности включается в выборочную).

Нередко используется довольно точный метод отбора выборочной совокупности - метод серийной выборки. Суть этого метода заключается в расчленении генеральной совокупности на однородные части (серии) по заданному признаку. После этого отбор респондентов осуществляетсяв каждой серии по заданному признаку.

Кроме этого, существует метод гнездовой выборки . «Гнездо» представляет собой группу каких-либо объектов, состоящих из ряда элементов. В качестве единиц исследования используют не отдельных респондентов, а группы, коллективы.

Наряду с вероятностной выборкой в социологических исследованиях применяется также и целенаправленная выборка. Целенаправленная выборка осуществляется не с помощью теории вероятности, а при использовании ряда методов:

· стихийной выборки,

· основного массива,

· квотной выборки.

Стихийная выборка чаще всего применяется в журналистике. Примером стихийной выборки может служить почтовый опрос. Достоверность и качество полученной при этом информации очень низкие и распространяются только на опрошенную совокупность.

Метод основного массива применяется как «зондаж» при проведении пилотажного исследования, при этом изучается 60-70% генеральной совокупности.

Наиболее точным из методов целенаправленных выборок можно считать метод квотной выборки . Однако, применение этого метода возможно при наличии статистических данных о генеральной совокупности. Все данные о признаках генеральной совокупности выступают в качестве квот, а отдельные числовые значения – в качестве параметров квот. При квотной выборке респонденты отбираются целенаправленно с соблюдением параметров квот. В качестве квоты могут выступать не более четырех признаков. Например, пол, возраст, стаж работы, уровень образования и т.д.

Определение объема и вида выборки - недостаточное условие правомерности распространения выводов исследования на всю генеральную совокупность. Из всего многообразия возможных выборочных совокупностей необходимо отобрать одну, наиболее точную. Способность выборки отражать, моделировать значимые свойства генеральной совокупности – есть репрезентативность выборки.

Отклонение результатов выборочного исследования от существенных характеристик генеральной совокупности называется ошибкой репрезентативности .

Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки репрезентативности носят вероятностный характер и при повторном измерении изменяются по вероятностным законам. Систематическими ошибками репрезентативности называют ошибки смещения, нарушающие точность выборочной совокупности. Систематические ошибки возникают при просчетах на стадии проектирования выборки, при отсутствии информации о социальном объекте, при неправильном выборочном отборе. Систематические ошибки репрезентативности могут быть также непреднамеренными (например, просчет на стадии проектирования выборки) и преднамеренными (обусловленными идеологическими, экономическими и т.д. факторами).

При исследовании генеральной совокупности выборочный метод значительно облегчает задачу исследователя, однако необходимо помнить о возможных трудностях связанных с методом выборочного исследования.

Весь массив особей определенной категории называется генеральной совокупностью. Объем генеральной совокупности определяется задачами исследования.

Если изучается какой-нибудь вид диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большой и при расчетах он принимается за бесконечно большую величину.

Если изучается действие какого-нибудь агента на растения и животных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйственного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения.

Не всегда объем генеральной совокупности недоступен для сплошного исследования. Иногда изучаются небольшие совокупности, например, определяется средний удой или средний настриг шерсти у группы животных, закрепленных за определенным работником. В таких случаях генеральной совокупностью будет совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность встречается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной группы в данной коллекции.

Характеристики групповых свойств ( и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами.

Выборка – группа объектов, отличающихся тремя особенностями:

1 это часть генеральной совокупности;

2 отобранная в случайном порядке, определенным образом;

3 исследуемая для характеристики всей генеральной совокупности.

Для того чтобы по выборке можно было получить достаточно точную характеристику всей генеральной совокупности, необходимо организовать правильный отбор объектов из генеральной совокупности.

Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной совокупности. Тенденциозность, предвзятость при отборе объектов для выборочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказательными для всей генеральной совокупности, т. е. нерепрезентативными.

Для получения правильной, неискаженной характеристики всей генеральной совокупности необходимо стремиться обеспечить возможность отбора в выборку любого объекта из любой части генеральной совокупности. Это основное требование должно выполняться тем строже, чем более изменчив изучаемый признак. Вполне понятно, что при разнообразии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репрезентативные результаты.

В различных исследованиях применяются следующие способы отбора объектов в выборку.

4 Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для данного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой генеральной совокупности, для которого разработаны основные показатели взаимоотношений между выборочными и генеральными величинами.

5 Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются в генеральную совокупность и не могут повторно попасть в выборку. Это наиболее распространенный способ организации выборки; он равносилен отбору из большой, но ограниченной генеральной совокупности, что учитывается при определении генеральных показателей по выборочным.

6 Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного поля, по случайным группам животных, взятых из разных ареалов популяции и т. д. Обычно намечается столько таких частей, сколько предполагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей популяции.

8 Серийный (гнездовой) отбор, при котором генеральная совокупность разбивается на части – серии, некоторые из них исследуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в определенном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микроорганизмами берут пробы, которые подвергаются сплошному исследованию. В некоторых случаях гнездовым способом могут быть обследованы также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомбината. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего поголовья кур.

Характеристики групповых свойств (μ, s и т. д.), полученные для выборки, называются выборочными показателями.

Репрезентативность

Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.

Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.

То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.

Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.

Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.

Генеральная совокупность - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы. Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность — это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, женщины 18-29 лет, использующие крем для рук определённых марок не реже раза в неделю, и имеющие доход не ниже $150 на одного члена семьи.

Выборка - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

  1. Объём выборки;
  2. Зависимые и независимые выборки;
  3. Репрезентативность:
    1. Пример нерепрезентативной выборки;
  4. Виды плана построения групп из выборок;
  5. Стратегии построения групп:
    1. Рандомизация;
    2. Попарный отбор;
    3. Стратометрический отбор;
    4. Приближённое моделирование.

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30-35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X сооветствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок: пары близнецов, два измерения какого-либо признака до и после экспериментального воздействия, мужья и жёны и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например: мужчины и женщины, психологи и математики.

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

  • t-критерий Стьюдента;
  • T-критерий Вилкоксона;
  • U-критерий Манна-Уитни;
  • Критерий знаков и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, людям, выбранным по телефонным книгам всей страны, и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:

57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону

40 % выбрали действующего в то время президента-демократа Франклина Рузвельта

На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, - так как им было известно, что большинство их подписчиков считают себя республиканцами, - они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и верхнего класса (то есть большинство республиканцев, а не демократов).

Виды плана построения групп из выборок

Выделяют несколько основных видов плана построения групп:

  1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия;
  2. Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора;
  3. Исследование с использованием только одной группы - экспериментальной;
  4. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности:

  1. Рандомизация (случайный отбор);
  2. Попарный отбор;
  3. Стратометрический отбор;
  4. Приближённое моделирование;
  5. Привлечение реальных групп.

Рандомизация

Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором

Попарный отбор

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать.

Стратометрический отбор

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Понравилась статья? Поделиться с друзьями: