
4. Конструирование тестов, оценка надежности и валидности
Тест – стандартизованная методика психологического измерения, предназначенная для диагностики выраженности у индивида псих. Свойста или состояний при решении практических задач.
психологический тест может быть охарактеризован как эффективный в том случае, если он удовлетворяет следующим основным условиям:
1) использование шкалы интервалов;
2) надежность;
3) валидность;
4) дискриминативность;
5) наличие нормативных данных.
Обычно выделяются три главные стратегии в конструировании личностных опросников: дедуктивная, индуктивная и экстернальная (Burisch, 1984).
Дедуктивная или содержательная стратегия базируется на теоретических представлениях о личности, ее структуре и функционировании. Разработчик теста конструирует задания, с помощью которых, как предполагается, будет оцениваться определенный психологический конструкт.
индуктивная, предполагает использование факторного анализа или других статистических процедур, основанных на корреляционных связях. Главная особенность индуктивной стратегии состоит в том, что исследователь как бы позволяет данным говорить самим за себя.
Экстернальная стратегия эмпирична по своей сути и основывается на сравнении контрастных групп. Ни одна из названных стратегий не может быть рассмотрена как предпочтительная. Вполне естественно, что многие разработчики личностных опросников комбинируют эти стратегии, стремясь, например, сочетать возможности оценки личности, достигаемые дедуктивной стратегией, с широким использованием разнообразных процедур анализа заданий (индуктивная стратегия).
ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА ЗАДАНИЙ (СПЕЦИФИКАЦИЯ ТЕСТА)
1.формулирование цели будущего теста.
После этого следует обратиться к разработке спецификации будущего теста. Наиболее удобно сделать это в виде таблицы, в которой по горизонтали будут располагаться содержательные области (после общения с парами: «доверие - недоверие», «верб – неверб К» в опроснике супруж. Статуса Руста), которые предполагается измерять, а по вертикали — их манифестации («установки и чувства, проявляющиеся в отношениях»), или пути, по которым содержательные области могут проявляться. При спецификации манифестаций важно обеспечить выделение различных форм их реализации.
Из практических соображений обычно по каждой оси разрабатывается от 4 до 7 категорий. В итоге получается своего рода решетка, количество ячеек в которой будет равно количеству планируемых для изучения параметров, умноженному на количество их поведенческих манифестаций.
При разработке опросников обычно считают, что решетка размером от 16 до25 ячеек (например, 4x4,4x5,5x4 или 5x5) считается идеальной для той длины теста, который вполне реально сконструировать, предъявить и обработать.
Далее необходимо определить, сколько заданий, например вопросов, должно
быть создано для каждой из ячеек.
При решении этой задачи следует руководствоваться тем, насколько важным представляется исследователю измерение одного из параметров сравнительно с другим или другими (содержательным областям, обозначенным как А и В, следует приписать 40-%-ный вес, а С и D — 10-%-ный..). в целом процентный вес всех содержательных областей (по горизонтали) и всех манифестаций (по вертикали) должен составлять 100 %. Такое расположение процентных весов подскажет, какую часть от всех заданий следует создать для каждой ячейки.
решить, какое количество заданий должно быть включено в тест (ВСЕГО).
необходимо учитывать такие факторы, как размер решетки и время, предполагаемое для выполнения заданий. Хорошо известно, что в определении количества заданий перед исследователем возникает дилемма: обеспечение, с одной стороны, надежности теста, что требует увеличения заданий, а с другой стороны — минимизация количества заданий для обеспечения эффективной работы испытуемого с ними, подразумевающей прежде всего поддержание концентрации внимания в ходе обследования (для достижения удовлетворительной надежности опросника требуется не менее 20 заданий, выполнение которых обычно занимает не более 10 минут. важную роль в определении количества заданий теста играют особенности того контингента, который предполагается обследовать.При проводимом разработчиками пилотажном исследовании количество заданий предварительного варианта теста должно быть по крайней мере на 50 % больше числа тех, которые будут включены в окончательную версию.
После того как определен процентный вес каждой из ячеек решетки и установлено общее количество заданий для пилотажной версии теста - сколько заданий должно быть разработано для каждой ячейки. Для того чтобы подсчитать количество заданий для каждой ячейки, умножают общее число заданий, предназначенных для измерения некоторого свойства личности, на процентный вес его поведенческих проявлений. Например, количество заданий равно отношению 25 % к 32 заданиям, что составляет 8 заданий — 25/100x32 = 8. Если не получается целое число заданий для каждой ячейки, следует его округлить.
2. Разработка заданий
- в каждом задании может быть задан только один вопрос или сформулировано одно утверждение.
-Каждое задание (вопрос) должны быть сформулированы предельно ясно и просто. Необходимо избегать двусмысленных формулировок и придерживаться, насколько это возможно, наиболее простых вариантов ответов. В то же время необходимо стремиться к тому, чтобы обследуемые не могли догадаться о том, для измерения какой черты предназначено то или иное задание.
- Задания должны отражать конкретные, а не общие аспекты изучаемой области поведения.
- Везде, где только возможно, следует избегать употребления таких слов, как «часто», «редко» и т. п. Иначе говоря, в формулировке заданий нужно очень осторожно прибегать к словам, указывающим на частоту действий. То, что одним испытуемым интерпретируется как «часто», для другого совсем не так.
- Также следует избегать терминов, выражающих чувства. Лучше представить задание в контексте поведения. Например, задание «Нравится ли вам чтение художественной литературы» лучше заменить на «Читаете ли вы художественную литературу постоянно?».
- Очень важно, чтобы любой из предлагаемых вариантов ответа воспринимался испытуемым как возможный, вероятный. Ответ, воспринимаемый обследуемым как неправильный, будет иметь малую вероятность выбора.
- После разработки всех заданий к ним следует вернуться через некоторое время и попытаться еще раз оценить их формулировки, еще раз убедиться в том, что все они легко понимаются и не содержат двусмысленностей. Для этого рекомендуется привлечь хотя бы двух-трех экспертов.
В личностных опросниках, как правило, используют три типа заданий 1. Дихотомические. Весьма популярны задания с альтернативным выбором (дихотомические), которые просты для понимания, легки и удобны для обработки. Эти задания требуют наименьшего времени для ответа. К их недостатком относится то, что обследуемые часто не удовлетворены предлагаемой альтернативой, хотели бы видеть больше вариантов ответа.
2. Задания трихотомические (три варианта ответа, например «да», «не знаю», «нет») также распространены в опросниках, и их преимуществом является то, что обследуемые могут более точно выразить себя, нежели в случае альтернативы. Недостаток применения более двух вариантов ответов заключается в том, что могут актуализироваться установки на выбор крайних вариантов ответа и выбор среднего варианта, чаще всего это такие ответы, как «не знаю», «иногда» и т. п.
3. Какие-либо правила, определяющие количество вариантов выбора ответа, отсутствуют. Обычно не рекомендуется использование более семи в опросниках, использующих рейтинговые шкалы. Важно обеспечить достаточное количество градаций ответа, с тем чтобы обследуемые были в состоянии адекватно выразить самих себя.
Следует помнить и о том, что в разрабатываемом опроснике желательно использовать только один тип заданий.
Основные проблемы, возникающие при разработке заданий личностных опросников, касаются актуализации факторов, имеющих установочную природу.
- Установка на согласие может быть преодолена с помощью введения так называемых обратных заданий, причем их количество должно быть равно или почти равно числу прямых. Например, утверждение «Я удовлетворен отношениями с моей матерью» может быть дополнено обратным — «Я не удовлетворен отношениями с моей матерью»1. При введении обратных заданий необходимо тщательно выверить их смысл и убедиться в том, что они имеют то же самое значение, что и
те, из которых были образованы. Также следует избегать двойных отрицаний.
Установка на социально одобряемый ответ может быть минимизирована с помощью исключения из опроника тех заданий, ответы на которые оцениваются обследуемым с точки зрения их социальной желательности—нежелательности (сформулировать косвенный вопрос: «Люди постоянно интригуют против меня» может быть сформулировано в виде: «Имеются некоторые люди, которым я полностью доверяю».
Установка на неопределенные ответы (так называемые ответы средней категории), когда нельзя отказаться от присутствия таковых в опроснике, в известной мере преодолевается инструкцией, требующей от испытуемого как можно реже прибегать к таким ответам.задания должны быть сформулированы таким образом, чтобы выбор ответа средней категории не был притягателен.
Установка на крайние ответы обычно проявляется в заданиях с рейтинговыми шкалами.Поэтому лучше избегать задания типа рейтинговых.