Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Exp_psy_short.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
956.42 Кб
Скачать

IV.2.6. Генеральная совокупность, выборка

Генеральная совокупность - множество однородных по какому-либо свойству объектов. Для психологии как единой дисциплины наиболее обобщенной генеральной совокупностью является множество объектов, к которым могут быть применены объяснительные принципы (гл. II). Эти объекты обладают специализированными структурами, фиксирующими модели совершенных взаимодействий с миром. Совокупность моделей обладает свойствами субъектности, целостности, активности и пр. (см. разд. II.8). Заметим, что генеральная совокупность, потенциально соответствующая предмету психологического исследования, объединяет (обобщает) субъекты индивидуальные и групповые, социально-психологические. Различные области психологии, парадигмы и конкретные исследования рассматривают как актуальные генеральные совокупности более ограниченные множества объектов, например, включающие людей конкретной возрастной группы (детей дошкольного возраста, подростков, взрослых и т.д.), животных определенного вида, малые группы и т.п.

Объем генеральной совокупности и многообразие включенных в нее объектов таковы, что реальное исследование в силу ограниченности методов и исследовательских ресурсов способно рассмотреть лишь подмножество, выделенное из этого множества по определенному правилу, которое называется выборкой. Иногда термином “выборка” обозначают не множество объектов, а совокупность результатов наблюдений, оценок и т.п. При небольших объемах генеральной совокупности, т.е. в случае возможности полного совпадения выборки и генеральной совокупности само понятие выборки становится излишним. Природа объектов, содержащихся в конечных совокупностях, может рассматриваться как неслучайная, задача исследования в этом случае состоит в точной оценке некоторой константной величины. Суть использования выборок состоит именно в замене потенциально бесконечной генеральной совокупности объектов конечным их набором для того, чтобы дать наиболее правдоподобную оценку свойств генеральной совокупности на основе изучения характеристик объектов включенных в выборку.

Заметим, что проведение комплексных исследований требует формирования нескольких выборок из генеральной совокупности, включающих объекты разных типов, которые характеризуют различные аспекты предмета психологического исследования.

Характеристики выборки для исследования в конкретной области психологии определяется спецификой парадигмы, целями, задачами, гипотезами исследования, а также правилами, которые обеспечивают репрезентативность выборки, представленность в выборке свойств генеральной совокупности, важных для исследования. Репрезентативность выборки оценивает представленность в отобранном для исследования множестве объектов характеристик объектов генеральной совокупности. Установление соответствия выборки и генеральной совокупности представляет сложную проблему, поскольку свойства генеральной совокупности по характеристикам, представляющим предмет исследования, как правило, неизвестны. Строго говоря, для валидного решения задач исследования необходима не бесконечная генеральная совокупность, а точность применения правила включения объектов в выборку и характеристики распределения признака, по которому отбираются объекты. Поэтому для оценки репрезентативности выборки либо эмпирически определяют закон распределения соответствующих характеристик в генеральной совокупности, либо используют априорные, теоретические представления об этом, например, исходя из предположения о нормальности распределения какой-либо индивидуальной характеристики в популяции. Полагают, что если в выборке этот показатель распределен нормально, то выборка репрезентативна. Нерепрезентативные выборки называют смещенными [Кимбл, 1982, с. 146].

Выборки формируются отбором не определенных значений показателей, а объектов. Неадекватное представление о составе генеральной совокупности может привести к включению в выборку объектов, которые к ней не относятся, или не включению в нее объектов, которые входят в ее состав. И та и другая ошибка приводит к смещению состава выборки. Поскольку объекты целостны, то многие их характеристики связаны между собой. Отбирая объект по какому либо показателю, исследователь ограничивает диапазон значений других показателей, и тем самым нарушает репрезентативность выборки.

Репрезентативность выборок обеспечивается способом их формирования. Наиболее точно отражают свойства генеральной совокупности выборки, построенные случайным выбором (рандомизацией), так, что любая из возможных выборок объема n из совокупности N имеет одинаковую вероятность p быть выбранной:

p = 1/(N!/n! (N — n)!).

Такой отбор может быть основан на жеребьевке или использовании таблиц случайных чисел.

Рандомизация - случайный отбор, следует отличать его от беспорядочного отбора. Случайный отбор осуществляется по строгим правилам, а беспорядочный - по неопределенным признакам. Так, случайный отбор учеников в классе предполагает их нумерацию, а затем, используя таблицу случайных чисел по заранее определенному правилу, разделяют класс на две группы, одна из которых включается в выборку. Беспорядочный отбор - произвольное указывание необходимого количества учеников с высокой вероятностью приведет к смещению характеристик выборки - будут отобраны наиболее “заметные”, успевающие или активные ученики. В этом случае возможно приписывание выборке априорных представлений исследователя о ее свойствах. Важно заметить, что репрезентативность выборки определяют по соответствию эмпирического распределения какой-либо характеристики и теоретического представления о ее распределении в генеральной совокупности, но ни в коем случае не подгоняют эмпирическое распределение под теоретическое, произвольно включая объекты в выборку или исключая их.

Важное значение при формировании выборки имеет мотивация испытуемых. Например, если к участию в исследовании привлекаются не случайно отобранные испытуемые, а специально мотивированные — “добровольцы” или “заложники” (т.е. принужденные к участию по каким-либо причинам), группы не будут ни репрезентативными, ни эквивалентными, а произведенные оценки окажутся неизбежно смещенными. Отбор испытуемых по их готовности принять участие в исследовании или по их “доступности” для исследователя - один из наиболее распространенных источников смещения свойств выборки относительно генеральной совокупности. Надо иметь ввиду, что смещения существенно более опасны для исследований, построенных по планам истинных экспериментов, чем по квазиэкспериментальным планам [Кэмпбелл, 1980, с. 147].

Адекватность определения генеральной совокупности цели и задачам исследования, точность следования правилам отбора объектов в выборку (рандомизации) обеспечивает однородность выборки. Если выборка неоднородна, к объектам ее составляющим нельзя применить одни и те же приемы и инструменты измерения, их свойства не могут быть описаны единой закономерностью, получить единую интерпретацию [Толстова, 2000].

Применение рандомизации

(1) позволяет построить однородную выборку, избежать смещений в составе выборки;

(2) снижает влияние побочных переменных;

(3) обеспечивает возможность правильного применения статистики, поскольку статистические критерии требуют именно случайной, однородной выборки, распределения побочных влияний и ошибок по случайному закону;

(4) снижает влияние предубеждений исследователя.

Кроме собственно случайного выбора применяют упрощенные квазислучайные способы отбора - “механический”, “районированный”, “стратифицированный”, “серийный” и др. при которых объекты отбираются не из всей совокупности в целом, а из выделенных по определенным правилам частей совокупности. Для проведения механического отбора всё доступное для отбора множество объектов, разделяется на n равных частей и из каждой части в выборку вводится одна единица, таким образом в выборку входит n объектов. При районированном или стратифицированном отборе группы выделяют в соответствии с “естественными” структурами генеральной совокупности. Это могут быть какие-либо предприятия, социальные группы, популяции и т.д. Эти группы выделяют на основе предположения, что исследуемые показатели более однородны в группах, чем в генеральной совокупности в целом. Эмпирическое подтверждение этого предположения может служить обоснованием применения таких способов отбора. Из каждой группы в выборку включают определенную долю объектов. Например, если предполагается обследовать 10% объектов из всей совокупности, то и из каждой группы отбирают 10% объектов. Важно, что при применении упрощенных способов отбора должен соблюдаться принцип равной вероятности для каждого объекта попасть в выборку.

Наиболее уязвимый способ формирования выборки - использование “естественных”, реальных групп, например, учеников определенного класса [Готтсданкер, 1982, с. 170]. Эти группы, как правило, не случайны по подбору, смещены по многим характеристикам. Исследования, проведенные на таких выборках, обладают низкой внешней и внутренней валидностью (см. подразд. Валидн.), создают угрозу артефактных выводов [Готтсданкер, 1982, с 178].

Репрезентативность и объем выборки. Репрезентативность выборки характеризует не только ее состав, но и объем. Для решения некоторых задач минимальные объемы выборки установлены опытным путем. Так, для оценки ретестовой надежности (см. подразд. Надежн), такой минимум принят за 200 испытуемых [Клайн, 1994]. Очевидно, что необходимый объем выборки зависит от ее однородности: чем выше дисперсия, или какая либо иная оценка разнообразия характеристик объектов, тем больше должен быть объем выборки (см. например, [Пэнто, Гравитц, 1972, с. 405; Ядов, 1999, с. 116]).

Для определения объема выборки, достаточного для получения определенного уровня достоверности статистических оценок характеристик распределений переменных, связей между ними и т.п., можно пользовать статистические таблицы. Например, для проверки гипотезы H0 при p  0.05 о равенстве коэффициентов корреляции, рассчитанных для двух выборок, составляющих величины порядка 0.5 и 0.6, с применением z-преобразования Фишера и t-критерия, объем каждой выборки должен превышать 50 объектов [Мюллер и др, 1982, с. 170-175]. Исходя из планируемых объемов выборок, можно определить достижимую точность статистических оценок, см. например, таблицу зависимости существенности различий подвыборок от их объема [Ядов, 1999, с. 117].

Существует эмпирически установленное правило, что количество объектов (объем выборки) должен превосходить количество переменных, описывающих эти объекты, как минимум на порядок: если измерения даны в 10 переменных, минимальный объем выборки составит 100 объектов [Дрейпер, Смит, 1987, с. 144] (см. подразд. Данные). Для линейной зависимости между двумя переменными вида

y = b + kx (полная запись: y = bx0 + kx1)

минимальный объем выборки составит 30 объектов, поскольку уравнение включает три переменные (у, x0, x1). Заметим, что для квадратической и кубической зависимостей минимальное количество объектов составит соответственно 40 (у, x0, x1, x2) и 50 (у, x0, x1, x2, x3).

Следует учитывать, что увеличение объема смещенной выборки не предотвращает получение артефактных результатов, напротив, чем больше объем такой выборки, тем больше вероятность того, внешняя валидность исследования пострадает, а выводы быдут ошибочными [Кимбл, 1982, с. 146].

Репрезентативность и состав выборки. Для районированных и стратифицированных выборок репрезентативность обеспечивается пропорциональным представительством районов и страт только в случае однородности генеральной совокупности. Пропорциональность нарушается, если свойства районов существенно различны. Так, общенациональная выборка ФРГ, используемая для социологических опросов, включала 2000 респондентов, а после присоединения пяти земель Восточной Германии (22% населения), весьма отличающихся от 10 западных земель, выборка была увеличена до 3500 респондентов (т.е. не на 22%, а на 75%). Важно, что для выборок, построенных этими способами, репрезентативность всей выборки достигается адекватностью объема каждой группы. Занижение или завышение представительства какой-либо одной группы может нарушить репрезентативность всей выборки и привести к артефактным результатам иследования. Если предполагается, что тест, должен быть применим к испытуемых трех различающихся групп, то репрезентативная выборка должна включать по 100 представителей от каждой из этих групп, а 300 представителей одной из них не будет репрезентативной выборкой [Клайн, 1994, с. 170].

В длительных исследованиях с многократными оценками (тестированием) групп может происходить изменение состава выборки за счет выбывания испытуемых (“experimental mortality” [Кэмбелл, 1980, с. 46]). В зависимости от причин выбывания, оно может приводить к серьезным артефактам. Например, при исследовании развития мотивационной сферы у студентов результаты могут существенно переоценивать темп такого развития, поскольку все слабо мотивированные студенты либо оставят учебу, либо будут отчислены (ср. [Кэмпбелл, 1980, с. 62]). Сокращение объема может приводить к существенному смещению выборки, которое не всегда можно компенсировать просто удалением выбывших испытуемых из обработки на всех этапах исследования, включая самые ранние, так как в результате такой компенсации выборка уже в исходном состоянии будет смещенной. Неравномерность выбывания испытуемых в контрольных и экспериментальной группах может приводить к их существенной неэквивалентности.

Подбор контрольных групп. Планирование эксперимента или квазиэксперимента с высокой степенью контроля требует формирования нескольких групп исследуемых субъектов. Такие группы должны быть однородными и уравненными по всем переменным, кроме одной - составляющей предмет сопоставления. Так, для изучения соотношения генетических и средовых факторов при формировании индивидуальности могут быть отобраны однородные группы испытуемых, различающихся по одной переменной, оценивающей степень генетической общности: (1) монозиготных, (2) дизиготных близнецов, (3) сиблингов*, (4) полусиблингов, (5) испытуемых, находящихся в двоюродном родстве (кузенов), (6) их родителей, (7) лиц, гарантированно не являющихся родственниками между собой и с испытуемыми, включенными в перечисленные группы. Это деление должно быть дополнено разделением на группы по общности средовых характеристик (близнецовой, сиблинговой, родительско-детской, расширенной семейной — см. подробно в работе [Григоренко, 1998]). Заметим, что объектами изучения, включенными в состав этих выборок не обязательно должны быть люди. У животных значительно легче контролировать степень родства и формировать из них эквивалентные группы. Использование “чистых линий” животных может уравнять группы по генетическим и поведенческим характеристикам, хотя в этом случае невозможно применение стандартных психологических тестов.

Все сопоставляемые выборки должны быть репрезентативны (по отношению к генеральной совокупности) и уравнены, эквивалентны по всем характеристикам, кроме воздействия независимой переменной. Эквивалентность групп может быть достигнута различными способами:

(1) рандомизацией, т.е. случайным подбором; строго говоря, только группы, отобранные способом рандомизации могут быть эквивалентными;

(2) подбором пар, члены которых контрастны по значениям переменной, определяющим сравниваемые группы; полагают, что этот способ достижения эквивалентных групп “применяется лишь в силу устойчивой и дезориентирующей традиции”, он пригоден лишь как дополнение к рандомизации, но замена им рандомизации недопустима даже в квазиэкспериментальных планах [Кэмпбелл,1980, с. 68, 135];

(3) различными комбинациями рандомизации и подбора пар; Кэмпбелл считает эффективным прием “образование блоков”: испытуемых подбирают по парам, “тщательно уравненные по показателям предварительного тестирования или по связанным переменным”, а затем в случайном порядке одного из них включают в экспериментальную, а другого - в контрольную группу [Кэмпбелл, 1980, с. 68, 135]. Готтсданкер предлагает использовать случайный отбор групп с выделением слоев. (выделение слоев - вариант стратифицированного, серийного отбора, см. выше): всю популяцию разделяют на “слои” по какой-либо характеристике, и из каждого слоя случайно отбирают равное число представителей. По оценке Готтсданкера этот прием обеспечивает очень хорошую внешнюю и внутреннюю валидность [Готтсданкер, 1982, с. 176, 178].

Формирование групп по какому-либо контрастному признаку, например, групп, различающихся по полу, неизбежно приводит к систематическому смешению независимой переменной (пол) с сопряженными индивидуальными характеристиками [Готтсданкер, 1982, с. 164]. К артефактным результатам (нарушению внутренней валидности) приводит формирование групп по признаку предельно больших и малых значений какой-либо характеристики, так, что в одну группу входят испытуемые с низкой, а в другую - с большой выраженностью признака. В этом случае весьма вероятно, что влияние независимой переменной (условий) будет неэквивалентным в экспериментальной и контрольной группе, что называют “эффектом статистической регрессии” [Кэмпбелл, 1980, с. 134]. Заметим, что такой отбор испытуемых в группы является формальным препятствием применения регрессионого анализа, поскольку нарушено требование нормального распределения признака в выборке.

В квазиэкспериментальных исследованиях, когда уравнять группы случайным отбором или манипулируя составом невозможно, прибегают к “сбалансированным” планам исследования. Это в некоторой степени компенсирует неэквивалентность групп [Кэмпбелл, 1980, с. 139-140].

Важно, чтобы свойства сформированной выборки и групп находились в соответствии с типом выполняемого исследования, и не были ниже необходимого уровня требований. Для исследований, проводимых по плану истинного эксперимента необходимо построение полностью рандомизированной, репрезентаттивной выборки, несмещенных эквивалентных групп. Это весьма трудоемкая система процедур, но любое отклонение от правил формирования выборки может привести к нарушению валидности эксперимента и к ошибочным выводам. Точное выделение оснований эквивалентности и контраста групп и подгрупп — необходимое условие выявления закономерной связи независимой и зависимых переменных. В то же время любой отбор может быть источником нарушения репрезентативности выборки, т.е. ее соответствия генеральной совокупности. Если обеспечить рандомизацию выборки и эквивалентность групп не удается, то, независимо от строгости выполнения всех остальных процедур планирования, исследование может быть лишь квазиэкспериментальным или доэкспериментальным. Если исследование может быть проведено только на естественных группах, или невозможно формирование контрольной группы, оно не может выйти за рамки доэксперимента. Важно заметить, что построение выборки в соответствии со всеми основными требованиями повышает валидность исследования, снижает вероятность артефактных выводов, независимо от того, проводится это исследование по плану истинного эксперимента, квазиэксперимента или доэксперимента (см. подразд. Типы исслед).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]