Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПД (учебное пособие).doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.11 Mб
Скачать

1. Прочитайте

  1. Анастази А., Урбина С. Психологическое тестирование. – СПб.: Питер, 2001.

  2. Бодалев А.А., Столин В.В. Общая психодиагностика. – М.: Речь, 2000.

  3. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике – СПб.: Питер-Ком, 1999.

  4. Гусев А.Н., Измайлов Ч.А., Михалевская М.Б. Измерение в психологии. - 2-е изд. - М.: Смысл, 1998.

  5. Психологическая психодиагностика: Учебное пособие / Под ред. К.М.Гуревича, Е.М.Борисовой. - М.:УРАО, 2000.

2. Познакомьтесь с понятиями репрезентативности и достоверности в психологических исследованиях.

3. Объясните значение следующих терминов факторы достоверности исследования, социальная желательность.

4 .Дайте ответы на вопросы:

Проблема объективности психологического исследования.

Влияние диагностического опыта психолога на результаты исследования

5. Темы рефератов

Прогностичность и репрезентативность тестовых норм в психологии

Тема 9. Основные правила создания и адаптации психодиагностических методик.

Принципы конструирования тестов. Критериально-ключевой принцип Факторно-аналитический принцип. Требования к конструированию психодиагностических методик

Рассматривая порядок проверки валидности, мы вплотную подошли к вопросу о целостной стратегии конструирования, эмпирической апробации и внедрения методики в практику. В реальности конструирование оригинальной методики или адаптация зарубежной методики не могут сводиться к проверке (или перепроверке) отдельных психометрических свойств — репрезентативности, надежности, валидности, достоверности — в произвольной последовательности. В одних случаях целесообразно начинать с одного, в других — с другого этапа работы.

В действительности любая реальная ситуация использования теста не является ситуацией только «конструирования» или только «применения». Можно без преувеличения сказать, что существует континуум между крайними полюсами

(«конструирование» <---------------> «применение»)

и каждая ситуация до определенной ступени удалена от обоих полюсов. Трудно назвать такой случай, когда бы конструирование совершенно нового теста начиналось «с нуля», «на пустом месте». Также трудно найти и такие случаи, когда все аспекты тестирования были бы полностью неизменными и воспроизводили бы уже совершенно исследованную нормативную ситуацию применения готового теста.

Но все это многообразие ситуаций, всю комбинаторику независимых параметров психологи-практики, как правило, пытаются редуцировать, свести к двум-трем типовым ситуациям.

  1. Ситуация применения: тест кем-то разработан (возможно, в других социокультурных условиях), известны тестовые нормы, подученные на представителях данной языковой культуры (несоответствие выборки стандартизации и выборки применения по половозрастной структуре и профессионально-культурным признакам признается несущественным).

  2. Ситуация адаптации. Тест кем-то разработан, проверены надежность и валидность, но отсутствуют тестовые нормы (как правило, отсутствуют вообще для любых представителей данной языковой культуры). Задача адаптации сводится, таким образом, к построению тестовых норм.

  3. Ситуация конструирования. Существует концепция психического свойства, но нет «подходящей» процедуры его измерения, удовлетворяющей требованиям места, времени, возможностям количественного анализа и ограничениям прочих ресурсов. Надо «придумать» измерительную процедуру, проверить ее надежность, валидность, построить тестовые нормы.

Прежде всего, остановимся на вопросах адаптации так называемых переводных тестов. Путь быстрого пополнения репертуара методик за счет множества «готовых» зарубежных методик кажется многим психологам наиболее экономичным, кратчайшим к надежной и валидной психодиагностике. Но если при этом адаптация сводится только к построению нормативного распределения тестовых баллов, то это означает, что валидность и надежность адаптированной методики в новых условиях принимаются на веру, а теоретическая концепция автора теста и содержание использованных им критериев валидности просто переносятся в наши условия без изменений. Подобный перенос дает пренебрежимые погрешности только для тестирования относительно элементарных психических свойств (таких, как свойства нервной системы, функциональные состояния, сенсомоторные параметры, элементарные когнитивные функции, т.е. структурно-динамические характеристики психической деятельности), причем с использованием объективных процедур (психофизиологическая регистрация, тесты с «физическими» критериями успеха и т.п.). При тестировании интегральных психических свойств личности и индивидуального сознания (черты, мотивы, установки, самооценка, общие способности, стиль общения, ценностные ориентации, интересы и т.п.), а также при употреблении любых лингвистических средств в самой процедуре тестирования (включая не только формулировки задач, вопросов, но и исходную формулировку инструкции к тесту) и при использовании культурно-специфических критериев оценки правильности результата — во всех этих случаях ограничиваться только сбором тестовых норм при адаптации недопустимо!

Требуется серьезная эмпирическая работа по проверке надежности и валидности в новых социокультурных условиях, работа, фактически соответствующая по своему объему конструированию оригинальной методики. С этой точки зрения заимствование зарубежных общедиагностических тестов способностей, черт характера, интересов и т.п. вовсе не оказывается кратчайшим путем к психодиагностике. Этот путь кажется короче только тем, кто сознательно или по неведению пренебрегает принципами психометрики.

Укажем здесь в качестве образца необходимые этапы эмпирико-статистической работы при адаптации многомерного переводного тест-опросника.

1. Анализ внутренней валидности, внутренней согласованности пунктов, из которых состоит тест-опросник. Этот анализ совершенно необходим, если в зарубежной методике он применялся в качестве средства самого конструирования методики. Этот анализ призван показать, что некое общее диагностическое свойство, лежащее на пересечении всех эмпирических индикаторов, существует. Такой анализ обязателен по отношению ко всем тестовым шкалам, полученным с помощью факторного анализа, например, к тест-опросникам Айзенка и Р. Кэттелла. А вот к опроснику «локус контроля» или ко многим основным клиническим шкалам MMPI требование внутренней согласованности применять необязательно, так как пункты в эти шкалы подбирались по внешнему критерию и не связаны в один фактор-пучок. Анализ внутренней согласованности может быть применен и к одномерным, и к многомерным тестам. В первом случае достаточно располагать настольным калькулятором. Для многомерных тестов необходимо использование специальной программы «анализ пунктов» на ЭВМ. По отношению к негомогенным шкалам анализ внутренней согласованности позволяет осуществить необходимую проверку информативности пунктов (процент правильных или подтверждающих ответов должен соответствовать оригинальной авторской версии).

2. Проверка устойчивости к перетестированию. Совершенно необходима при диагностике свойств, по отношению к которым теоретически ожидается инвариантность во времени.

Анализ ретестовой надежности может быть совмещен с исследованием информативности отдельных пунктов теста, а также, возможно, и устойчивости отдельных пунктов. Без сведений о ретестовой надежности психолог не имеет права использовать тест для построения любого элементарного прогноза.

3. Анализ корреляций с релевантным внешним критерием. Этот этап адаптации совершенно необходим, если тест разрабатывался изначально как критериально-ориентированный, т.е. отбор пунктов производился на основании их корреляций с каким-то критерием валидности. Например, подобная работа проделана для сокращенной модифицированной версии MMPI коллективом Ф.Б. Березина.

4. Проверка или рестандартизация тестовых норм.

5. Специфичный этап для многомерных тестов — проверка воспроизводимости структуры отношений между шкалами. Например, для теста Айзенка принципиальна ортогональность, статистическая независимость факторов «экстраверсия — интроверсия» и «нейротизм — эмоциональная стабильность».

Таким образом, адаптация зарубежных тестов мало чем уступает по объему эмпирико-статистической работы конструированию оригинальных методик.

Существуют различные принципы конструирования тестов

Принцип конструирования тестов на основе эмпирического обнаружения психологических признаков, позволяющих дифференцировать релевантное критериальные группы от контрольных.

Этот принцип реализован, например в Минессотском многоаспектном личностном опроснике. Так при разработке MMPI из первоначального банка утверждений в основании клинической шкалы включались только те, которые хорошо дифференцировали испытуемых с тем или иным клиническим диапазонам от контрольной группы здоровых людей. Эта способность отдельных пунктов (заданий) теста дифференцировать обследуемых относительно «максимального» или «минимального» результата теста называется дискриминативностью заданий теста.

Иногда задания, объединенные общей шкалой в силу эмпиричности конструирования не имеют не только теоретического, но даже интуитивного, гипотетического объяснения.

В тех случаях, когда необходимо дискриминировать группы, например в профотборе, критериально-ключевой принцип является достаточно эффективным.

В тестах, созданных в соответствии с критериально-ключевым принципом основное значение придается дискриминативности. Важен тот факт, что тест является дискриминативным, а не причина, по которой это происходит.

В связи с использованием критериально-ключевого принципа конструирования тестов возникает ряд проблем, которые должен решать разработчик:

  1. Трудность в отборе критериальных групп (например MMPI разрабатывался путем сопоставления больных и здоровых, однако разработка шкалы шизофрении (Sс) или паранойи (Ра) с большим успехом могла бы опираться на сопоставление группы больных с выраженными шизоидными или паранойяльными тенденциями с группой пациентов, у которых отличаются противоположные патологические особенности, но это практически нереально. Комплектование критериальной группы больных опирались на врачебный диагноз, который разными специалистами может восприниматься по-разному. Сложность в отборе «чистых» групп для сравнения ведет в конечном итоге к снижению надежности и валидности теста.

Таким образом методические затруднения связаны с тем, что практически невозможно формирование выборок испытуемых, строго отличающихся друг от друга наличием или отсутствием только определенных, контролируемых в эксперименте группы факторов.

  1. Значительные трудности, а иногда и невозможность психологической интерпретации показателей тестов. Наиболее вероятным является то, что одна критериальная группа отличается от релевантной ей не одной, а несколькими (иногда многими) переменными. Полученные шкалы являются, таким образом, не однозначными, а мультивариантными. Следовательно, два идентичных показателя могут иметь различную интерпретацию, и не существует определенного способа установить по виду показателя, что измеряет данная шкала.

Факт, что тест может дискриминировать группу Х от группы У, не говорит ничего о природе переменной, измеряемой тестом, если только мы не располагаем доказательством что группы отличаются одна от другой лишь одной переменной.

  1. Результатам тестов присуща известная специфичность, что также является серьезным ограничением.

Например, если такой тест используется для отбора сборщиков электронной аппаратуры, он будет разрабатываться на основе конкретного критерия, связанного с выполнением работы определенного характера. Если содержание работы изменится, разработанный на основе неадекватных критериальных признаков тест станет бесполезным. В противовес этому тесты, ориентированные на базовые способности, по прежнему могут быть использованы.

Факторный тест, относительно «чистый» по исследуемым переменным и опирающийся на теорию измеряемого конструкта, как можно ожидать, будет предпочтительней страдающих эмпиричностью тестов, созданных в соответствии с критериально-ключевым принципом. Однако разработка факторно-аналитического теста является технически более сложной трудоемкой задачей.

Не надо противопоставлять критериально-ключевой принцип факторно-аналитическому принципу; следует помнить, что при подборе первичного банка заданий разработчики исходят, как правило из описания некоего свойства конструкта, являющегося объектом измерения. С другой стороны, разработанный по критериально-ключевому принципу тест в последующем может пройти процедуру факторизации.

«Эмпиричность» таких тестов в значительной степени сглаживается и последующей процедурой определения конструктной валидности.

Для методик, созданных в соответствии с к.п.п. наибольшее значение имеют эмпирические модели определения надежности (например ретестовой надежности, надежности параллельных форм, надежности частей теста).

Принцип конструирования тестов на основе выявления ограниченного, определяемого разработчиком круга факторов.

Факторный анализ – комплекс аналитических методов, позволяющих выявить скрытые (латентные) признаки, а также причины их возникновения и внутренние закономерности их взаимосвязи.

Факторный анализ направлен на преобразование исходного набора признаков в более простую и содержательную форму. Центральная задача метода – переход от совокупности непосредственно измеряемых признаков изучаемого явления к комплексным обобщенным фактором, за которым стоят комбинации исходных признаков, выделяемых на основе их внутренних закономерностей, отражающих структуру исследуемой области явлений.

Согласно точке зрения одного из создателей факторного анализа, Л.Терстоуна этот метод применяется для «конденсирования» тестовых оценок, сведения их к относительно малому числу независимых переменных и для выделения факторов, необходимых для описания индивидуальных различий тестовых результатов. Поэтому факторный анализ представляет собой не только метод статистической обработки исходных данных для их обобщений, но и широкий научный метод подтверждения гипотез относительно природы процессов, присущих самому измеряемому свойству.

Наглядной моделью факторного анализа может служить схема:

Области признаков (психологических особенностей, свойств, способностей и т.д.), измеряемых тестами А,В,С представлены в виде прямоугольников. В зоне 1 находятся общие признаки для тестов А и В, в зоне 2 для тестов В и С, в зоне 3 – признаки, влияющие на успешность выполнения тестов А и С. В зоне 4 (пересечение зоны 1, зоны 2 и зоны 3) представлены признаки, объединенные общим для совокупности трех тестов фактором. Относительная площадь зон иллюстрирует факторный вес – меру проявления выявленной латентной переменной (признака) в результатах того или иного теста, - представленность в результатах данных теста выделенного универсального фактора Хавс.

Исходной информацией для проведения факторного анализа является корреляционная матрица, или матрица интеркорелляционной показателей тестов. В некоторых моделях факторного анализа матрица может включать и другие характеристики связей и сопряженности между изучаемыми признаками (например, кластерные отношения, расстояния в семантическом пространстве и т.д.). Выделенные путем анализа интеркорреляций или других характеристик связи обобщенные факторы первого порядка могут быть представлены в виде новой матрицы, отражающей корреляции между факторами. На основе таких матриц могут определяться факторы более высокого порядка.

В истории психологии факторный анализ связан с решением ряда теоретических задач. Сначала он воспринимается как один из основных подходов к раскрытию содержания психологических свойств.

Так, Ч. Спирменом (1931) на основе анализа корреляции между результатами различных тестов была выдвинута идея единого генерального фактора (фактор G), лежащего в основе успешности выполнения любых тестов, связанных с измерением интеллектуальных свойств. Им же в 1927 году была разработана математически обоснованная методика факторного анализа теоретической основой которой послужила однофакторная теория, исходящая из того, что в основе матрицы интеркорреляций лежат один общий и столько единичных факторов, сколько было использовано тестов. Л.Терстоуном (1931) разработан мультифакторный анализ оценки многих коррелирующих между собой (облических) и относительно независимых (ортогональных) факторов, объясняющий мультифакторную концепцию интеллекта. После работ Л.Тестоуна начался период активной разработки различных математических моделей факторного анализа.

В психологической диагностике факторного анализа широко используется как для решения исследовательских задач, так и при конструировании психологических методик.

Под фактором разумеется конструкт, операционально определяемый его факторными нагрузками. Под факторными нагрузками понимаются значения корреляции переменных с данным фактором. При разработке теста корреляционному анализу подвергаются связи между заданиями и в тесте оставляют только те из них, которые коррелируют с общим фактором. Этот фактор затем выступает в качестве конструкта. Данная процедура обеспечивает уверенность в том, что тест измеряет только одну переменную и каждое задание измеряет эту же переменную. Тест может измерять переменные, связанные с несколькими факторами, в том случае, если по своей сути он представляет собой набор субтестов, каждый из которых направлен на один из факторов-конструктов.

Укажем здесь в качестве образца необходимые этапы эмпирико-статистической работы при адаптации многомерного переводного тест-опросника.

  1. Анализ внутренней валидности, внутренней согласованности пунктов, из которых состоит тест-опросник. Этот анализ совершенно необходим, если в зарубежной методике он применялся в качестве средства самого конструирования методики. Этот анализ признан показать, что некое (еще не ясно, какое именно) общее диагностическое свойство, лежащее на пересечении всех эмпирических индикаторов (в центре «пучка» скоррелированных пунктов-векторов), существует. Такой анализ обязателен по отношению ко всем тестовым шкалам, полученным с помощью факторного анализа, например к тестам опросника Айзенка EPI и 16PF Кэттела. А вот к опроснику «локус контроля» или ко многим основным клиническим шкалам MMPI требование внутренне согласованности применять необязательно, так как пункты в эти шкалы подбирались по внешнему критерию и не связаны в один фактор-пучок. Анализ внутренней согласованности может быть применен и к одномерным, и к многомерным тестам. В первом случае достаточно располагать настольным калькулятором. Для многомерных тестов необходимо использование специальной программы на ЭВМ.

По отношению к негомогенным шкалам анализ внутренней согласованности позволяет осуществить в снятом виде необходимую проверку информативности пунктов (процент правильных или подтверждающих ответов должен соответствовать оригинальной авторской версии).

  1. Проверка устойчивости к перетестированию. Совершенно необходима при диагностике свойств, по отношению к которым теоретически ожидается инвариантность во времени. Анализ ретестовой надежности может быть (так же как анализ надежности - согласованности) совмещен с исследованием информатированности отдельных пунктов теста, а также, возможно, и устойчивости отдельных пунктов. Без сведений о ретестовой надежности психологи не имеет право использовать тест для построения любого элементарного статистического экстраполирующего прогноза.

  2. Анализ корреляций с релевантным внешним критерием. Этот этап адаптации совершенно необходим, если тест разрабатывался изначально как критериально-ориентированный, т.е. отбор пунктов производился на основании их корреляций с каким-то критерием валидности. Например, подобная работа проделана для сокращенной модифицированной версии MMPI коллективом Ф.Б. Березина

  3. Проверка или рестандартизация тестовых норм. Об этом этапе уже говорилось выше. К сожалению, только этот этап работы по адаптации тестов тестов до недавнего времени признавался всеми психологами как необходимый. Но и в этом случае далеко не всегда воспроизводилась необходимая статистическая работа по проверке устойчивости полученного распределения тестовых баллов к расщеплению выборки.

  4. Специфичный этап для многомерных тестов – проверка воспроизводимости структуры отношений между шкалами. Например, для теста Айзенка принципиальна ортогональность, статистическая независимость факторов «экстраверсия - интроверсия» и «нейротизм – эмоциональная стабильность». На воспроизводимости структуры связей шкал между факторами 16PF (Ямпольский Л.Г., 1981; Мельников В.М.) основывается корректность подсчета исторических фактов.

  5. Уже беглый взгляд на пять указанных этапов адаптации позволяет убедиться в том, что адаптация зарубежных тестов мало чем уступает по объему эмпирико-статистической работы конструированию оригинальных методик. Здесь было бы даже более адекватным использование термина «адаптация», но выражения «исследование зарубежной методики на отечественной выработке».

Сказанное, тем не менее, не следует понимать как призыв к полному отказу от работы с зарубежными методиками. Нет, конечно же, такая работа должна проводиться интенсивно и планомерно. Особенно по отношению к тем методикам, которые уже получили международное распространение, доказали свою кросскультурную универсальность, адаптированы и успешно применяются. Создание отечественных эквивалентов международных тестов позволяет использовать международный опыт валидизации, теоретического осмысления и практического использования этих тестов. Сравнение результатов, структурно-функциональных характеристик адаптированных и отечественных тестов, учет разнообразия исторических и актуальных детерминант, обусловливающих психологическую дифференциацию индивидов, необходимы для развития психологии в современных условиях.

Особые задачи ставит перед психологом ситуация «внутрикультурного переноса» теста на новую популяцию, отличающуюся от выборки стандартизации половозрастными или профессионально-культурными особенностями. В этом случае необходимо:

  1. Проверить валидность методики, если методика чувствительна по своему содержанию к профессиональной или региональной специфике (могут ли отвечать пенсионеры, или школьники, или жители отдаленных регионов на вопросы, подразумевающие типичные ситуации из жизни студента, как правило, не менее 30 испытуемых).

Если результаты проверки валидности оказываются неудовлетворительными (коэффициент корреляции явно ниже 0,5 и дальнейшее наращивание выборки все равно не оправдает применение теста со столь низким показателем валидности), то по собранным результатам следует произвести простейший «анализ пунктов» - посмотреть, не оказались ли некоторые пункты явно неинформативными (все испытуемые отвечают одинаково), не оказались ли некоторые вопросы явно бессмысленными или слишком «прямыми», социально значимыми в данной ситуации. Не исключено, что при исключении неудачных пунктов из подсчета тестового балла (после приравнивания С1 = 0) искомая валидность будет обнаружена.

  1. Проверка соответствия тестовых норм.

Только после позитивного результата в проверке валидности целесообразно расширять выборку и реконструировать эмпирическое распределение тестовых баллов.

Абсолютное большинство ситуаций, которые обычно расцениваются как ситуации «применения», а на самом деле являются ситуациями более или менее серьезного «внутрикультурного переноса». Именно эти обстоятельства предопределяют высокий уровень требований и психометрической подготовке психологов-психодиагностов.

  1. При конструировании методики решающее значение имеют методологическая ориентация и статус психолога.

Под статусом в данном случае понимаются существенные различия в нормативных (закрепленных в должностных инструкциях) требованиях к продукту деятельности психолога (Таблица 3).

Таблица 3. Различия в нормативных

требованиях к продукту деятельности психолога

Психолог в

исследовательском учреждении

Психолог-практик

«Конечный продукт»

Внутрипсихологическая валидизация сконструированной методики

Практическая эффективность психодиагностической программы

  • указать на статистическую значимую связь результатов диагностики с величиной какого-то социальноценного показателя

  • построить психологическую концепцию «вмешательства»

Стратегия конструирования тестов и тестовых батарей

Теоретическая обоснованность и эмпирическая однозначность диагностического конструкта (ориентация на конструктную валидизацию). У исследователя хватает ресурсов для того, чтобы обеспечить множественность разнообразных по своему статусу критериев валидости включенных наблюдателей до экспериментального моделирования реальных ситуаций проявления измеряемого свойства.

Ведущая ценность – эффективность эмпирического средства (даже не имеющая соответствующего научно-строго конструкта).

Большинство ценных эмпирических тестов становятся предметом для изучения со стороны психологов-исследователей, реконструирующих научную концепцию валидности этих тестов, что значительно улучшает их характеристики.

Составитель теста должен привести сведения о надежности и валидности теста.

Надежность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.

В основе анализа надежности теста лежит представление об истинных оценках и ошибках измерения. Распределение оценок, полученных на генеральной совокупности при выполнении теста, измеряющего одну характеристику, теоретически должно подчиняться нормальному закону. Поэтому при разработке теста исследователю необходимо отбирать задания т.о., чтобы распределение реальных тестовых оценок было по возможности близко к нормальному.

Для этого на практике используются корреляционное методы, позволяющие определить надежность через устойчивость и согласованность результатов.

Методы:

  • Ретестирование (повторное обследование одной и той же выборки). Недостаток: испытуемый помнит свои ответы.

  • Параллельные тесты (трудно осуществить на практике)

  • Проведение одного теста без ограничения во времени. Тест делится на две равные части. Полученные показатели по двум частям теста коррелируются обычным методом (для половины теста). Для вычисления надежности всего теста по методу расщепления используют формулу Спирмена-Брауна.

  • Оценить надежность теста относительно экспериментатора как оценщика и как эксперимента.

Т.о. различные методы оценивая надежности исходят из различных источников ошибок. Поэтому очень, чтобы метод, использованный для получения коэффициента надежности, был четко описан.

Коэффициенты надежности имеют ограниченную практическую ценность для пользователей теста. Стандартная ошибка измерения обычно более полезна; т.к. обладает относительной независимостью и может быть использована для установления пределов определенной вероятности балла.

Валидность (обоснованность) теста

Вопросы валидности – это вопросы о том, какие и насколько обоснованные выводы могут быть сделаны на основе тестовых оценок. Все вопросы, относящиеся к валидности, могут быть сведены к двум:

  1. какие выводы можно сделать о том, что измерялось тестом;

  2. какие выводы могут быть сделаны о реальном поведении человека, отличающемся от наблюдаемого при тестировании.

  1. Выясняет внутреннюю природу самого измерения. Тест как измерительный инструмент, является операционализацией психического свойства или специфической области умения или знания. В этом плане существенной проблемой является получение заключений о полноте отражения тестовыми баллами этой области, и в этом смысле следует говорить о внутренней (конструктной) валидности.

  2. Выясняется полезность тестового измерения в качестве предсказателя поведения. В этом плане существенной проблемой является получение заключения о том, насколько тестовые баллы связаны с некоторыми другими, и в этом смысле следует говорить о внешней (критериальной) валидности.

Валидность не измеряется, о ней только судят (например, по набору коэффициентов). Виды валидности зависят от видов заключений, которые желательно извлечь из тестовых оценок. Традиционно описывают три взаимозависимых типа интерпретации заключений, обобщающих подавляющее большинство возможностей применения тестов: валидность по критерию, содержательная и конструктная.

Использование психодиагностических процедур.

На результаты психодиагностических исследований существенное влияние оказывают условия их практического использования. Прежде всего форма проведения психодиагностических испытаний: групповая или индивидуальная. Групповое тестирование вносит существенные отличия в сравнении с индивидуальной формой работы.

Возраст испытуемых. Следует знать, что тесты требуют от тестируемых сложившихся навыков самостоятельной работы. Многие вербальные тесты-опросники, построенные на самооценке и саморефлексии, изначально ориентированы на детей старше 11—12 лет и имеют существенные ограничения, связанные с групповой формой использования. Классические батареи для обследования умственного развития, такие как тесты Стэнфорд—Бине и Векслера, ориентированы на индивидуальную форму проведения.

Состояние испытуемых. При индивидуальном обследовании психолог, как правило, видит, в каком состоянии находится испытуемый, и может, учитывая, например, что в этот день он не совсем здоров, отложить обследование. При групповом обследовании психолог должен спросить, кто из собравшихся в аудитории чувствует себя не совсем хорошо. При этом могут выясниться, например, такие «мелочи», что кому-то только что закапали лекарство в глаза и он ничего не видит, и т.п.

Форма предъявления тестовых заданий. Наиболее типичная форма предъявления тестовых заданий и инструкций — письменная. Но вполне допустимо (и в некоторых случаях более эффективно) предъявление тестовых заданий на слух. Это облегчает управление «трудными» детьми (младшего возраста), хотя и вносит элемент отклонения от стандартизации, ведь работает «живой диктор», который волей-неволей варьирует интонации, задавая те или иные вопросы. Например, одним из основных назначений первых мультимедийных компьютеров (Apple Mac) было предъявление стандартизованных речевых формулировок на слух с последующим введением ответов с клавиатуры. Оказалось, что армейское тестирование новобранцев в США, как правило, проводится с помощью устного предъявления заданий, так как чуть ли не половина новобранцев в США просто неграмотны и не могут прочесть тестовых заданий. Предъявление теста в устной форме имеет не только преимущества (контроль за вниманием аудитории), но и недостатки. В этом случае приходится ориентироваться на темп, доступный более медлительным испытуемым, а самые быстрые начинают скучать, отвлекаться, и из-за этого внимание их рассеивается, они могут допустить ошибки.

Время проведения тестирования. Если тестирование проводится после уроков, то весьма вероятно, что запас эмоционально-волевых ресурсов, необходимых детям для сосредоточенной и серьезной работы, к этому времени уже просто растрачен. Они будут вести себя расторможенно и дурашливо просто потому, что не могут вести себя иначе — уже устали. Конечно, это в меньшей степени относится к людям более зрелым. Однако общая рекомендация для всех возрастных групп — психодиагностические процедуры вообще и групповые тесты в частности лучше приводить в первой половине дня.

Предотвращение списывания. Всем известно, что ученики подсказывают друг другу и списывают на контрольных работах, поэтому, как правило, соседям по парте предлагают разные варианты. То же самое следует делать и в случае с групповыми тестами, особенно если тестируются дети из одного класса, которые уже заранее знают, как «правильно» сесть.

Для исключения списывания надо иметь так называемые параллельные формы одного и того же теста. Их следует подыскивать при комплектовании «тестологического портфеля». К сожалению, отечественная практическая психология не имеет корректных параллельных форм (таких, которые ставят всех в равные условия по трудности и по смыслу заданий). В силу этого надо обязательно рассаживать детей по одному за парту (стол) и лучше даже через стол. То есть тестировать надо одновременно фактически лишь четверть класса (если численность класса равна числу мест в аудитории). Такая необычная рассадка детей в классе сразу же произведет на них дополнительное впечатление и внушит более серьезное отношение к этой процедуре.

Разный темп работы. Индивидуальные различия в темпе выполнения тестов объясняются не только уровнем подготовки, но и просто стилевыми особенностями темперамента. Эти отличия могут быть разительными: один и тот же тест в одном и том же классе некоторые дети выполняют в 2—3 раза быстрее других! К этому надо быть готовым, и это надо предвидеть.

Если тест проводится в письменной форме, то следует заранее объявить, что должны делать те, кто завершит работу досрочно (сдать заполненный бланк и выйти из помещения или несколько раз проверить свою работу). Какой вариант выбрать, зависит от теста и от обстановки в группе (что приведет к меньшей дезорганизации). Но лучше применять такие тесты, которые не могут быть выполнены досрочно вообще никем. В этом случае надо позаботиться о другом — предупредить, что многие просто не успеют завершить работу в срок, что это нормально, что так и задумано.

Один из способов устранения проблемы разного темпа — применение двухстадийной схемы тестирования. В этом случае всем испытуемым предъявляется вначале краткий предварительный тест. Затем его результаты обрабатываются и испытуемые разбиваются на три группы: первой предъявляется легкий тест, второй — средний по трудности, третьей — повышенной трудности. В последнее время такого рода «индивидуальную настройку» уровня трудности все чаще производят с помощью компьютерного адаптивного тестирования.

Уровень знакомства в группе. Очевидно, что обстановкой в аудитории труднее управлять, если испытуемые хорошо знают друг друга. Вот почему серьезное аттестационное тестирование в зарубежных странах проводится не в стенах школы, а в специализированных внешкольных центрах тестирования, куда учащиеся приходят по предварительной записи и где они оказываются в одной аудитории с незнакомыми людьми.

Соревновательная мотивация. Ситуация группового тестирования провоцирует соревновательную мотивацию. Это может простимулировать их на более усердную работу. Но следует избегать и избытка соревновательной мотивации. Это приводит к ухудшению результатов у тех, кто чувствует себя не совсем уверенно, кто привык не выигрывать, а проигрывать.

Настройка лидеров. Большое значение имеет отношение неформальных лидеров к процедуре тестирования. Особенно это проявляется при тестировании учащихся одного класса, но подобный эффект может возникнуть и в группе незнакомых подростков (ведь дети быстро интуитивно выделяют лидеров даже в незнакомом окружении — по самоуверенной манере поведения, по модному задача диагноста — довести стандартную инструкцию к тесту до ее понимания каждым испытуемым, присутствующим в аудитории. Но многие стандартные инструкции ничего не говорят о том, как следует вносить исправления в бланк. Если об этом ничего не сказать, то при обработке бланков вы столкнетесь с путаницей и неоднозначными ситуациями. Поэтому «прикиду», просто по росту и т.п.). Например, в одном случае один-два лидера (на которых равняются остальные члены группы) серьезно выслушивают инструкцию, с озабоченными лицами деловито берутся за выполнение теста, не отвлекаясь на болтовню. Можно не сомневаться, что в этом случае их примеру последуют остальные. В другом случае лидеры бросают ехидные замечания и шуточки по поводу предстоящей процедуры или выражают пренебрежительное отношение к ней. Поэтому весьма важно предвосхитить поведение лидеров. Еще лучше повлиять на него заранее. В индивидуальной беседе легче настроить лидеров на сотрудничество.

Исправление ответов. Понятно, что основная лучше всего изобразить фрагмент бланка на доске и показать, как именно надо вносить исправления. А лучше всего вооружить испытуемых карандашами и ластиками. Тогда можно просто стереть ластиком штриховку, нанесенную в ошибочную позицию на бланке (пустую клеточку или кружочек). Такой способ работы принят за рубежом при выполнении самых ответственных аттестационных тестов (например, тестов SAT или GRE в США). При этом возникает меньше ошибок и при автоматическом вводе в компьютер с помощью сканера.

Методические указания к самостоятельной и практической работе