- •Тема 1: организация психолого-педагогического исследования Теоретический блок (2 ч.)
- •Задание: подготовить презентацию и доклад.
- •1. Истоки психодиагностики
- •2. Ненаучная психологическая диагностика (физиогномика, френология, графология, хиромантия, дерматоглифтика)
- •3. Отечественные достижения в области психолого-педагогических исследований.
- •6. Классификация методов и методик психодиагностики (б.Г. Ананьев, а.А. Бодалев и в.В. Столин, в.К. Гайда и в.П. Захаров, другие классификации).
- •Классификация методов психодиагностики (б.Г. Ананьев)
- •4. Классификация психодиагностических методов и методик (в.К. Гайда, в.П. Захаров)
- •5. Классификация психодиагностических методов по критерию формализованности
- •6. Рубрикация картотечного описания методик
- •Основные этические принципы и правила работы психолога-диагноста.
- •1. Принцип специальной подготовки и аттестации лиц, использующих психодиагностические методики.
- •2. Принцип личной ответственности.
- •3. Принцип обеспечения суверенных прав личности.
- •4. Принцип объективности.
- •5. Принцип конфиденциальности.
- •6. Принцип психопрофилактического изложения результатов.
- •8. Принцип ограниченного распространения психодиагностических методик (принцип профессиональной тайны).
- •История возникновения тестирования (индивидуальное и групповое тестирование).
- •10. Надежность как одна из основных характеристик теста. Виды надежности.
- •2 Надежность и валидность
- •11. Валидность как одна из основных характеристик теста. Виды валидности.
- •13..История проективного метода
Операциональный статус методики.
Психометрические показатели методики.
Сопряженные практические задачи (области использования).
Компетентность исполнителя.
Комплектность, состав методики.
Оборудование.
Теоретические положения.
Ход работы.
Обработка результатов.
Интерпретация результатов.
Основные этические принципы и правила работы психолога-диагноста.
Общие этические принципы и нормы психодиагностического обследования
Также как и медицинское обследование, любое психодиагностическое обследование может существенно повлиять на судьбу человека. Поэтому во всех странах, где психодиагностическая практика широко и интенсивно развивается, она регламентируется как общим профессионально -этическим кодексом, так и специально разработанными профессионально -этическими стандартами в области тестирования и психодиагностики.
Психолог несет всю полноту ответственности за возможный моральный и косвенный материальный ущерб, в том числе ущерб для соматического и нервно-психического здоровья, который может быть причинен испытуемому при неправильном проведении обследования. Судьба человека зависит от психодиагностики, если на ее основе ставится медицинский или судебно - психологический диагноз, осуществляется конкурсный отбор или прием на работу.
Профессионально-этические принципы в психодиагностике
1. Принцип специальной подготовки и аттестации лиц, использующих психодиагностические методики.
Требование, чтобы психодиагностические методики использовались только достаточно квалифицированными пользователями, является первым шагом по защите человека от их неправильного использования (и от психолога).
Психолог-диагност должен выбирать методики, которые подходят как для конкретной цели, с которой он проводит обследование, так и для конкретного человека, которого он обследует. Психолог должен знать соответствующую научную литературу, касающуюся выбранной методики, и должен быть способным оценить репрезентативность норм, надежность, валидность, достоверность методики. Психодиагност делает выводы и дает рекомендации только после рассмотрения диагностической информации в свете другой, касающейся человека информации (в случае противоречия – необходимо отказаться, обосновав).
Психолог должен знать границы своей компетентности и ограниченность используемых методов и не предлагать свои услуги, а также не использовать методики, которые не удовлетворяют профессиональным стандартам, установленным в отдельных областях практики и для определенных категорий методик.
2. Принцип личной ответственности.
Вся полнота ответственности за правильность проведения методики и ее результатов целиком лежит именно на психологе.
3. Принцип обеспечения суверенных прав личности.
Достаточно сложный вопрос, касающийся посягательств на тайну личности. Поскольку о сущности ряда тестов, раскрывающих эмоциональные и мотивационные особенности, а также установки личности, человеку ничего не сообщается, он может проявить такие черты в ходе тестирования, которые для него самого нежелательны, при этом не осознавая, что он делает. Основной этический принцип в данном случае гласит: человек не должен подвергаться какому-либо обследованию обманным путем.
Человек перед обследованием должен быть предупрежден, кто будет иметь доступ к результатам обследования и какие решения могут быть приняты. Если это несовершеннолетние дети, такое предупреждение должны официально получить родители. Исключение: когда проходят тестирование в обязательном порядке и тесты утверждены.
4. Принцип объективности.
Обследование должно быть абсолютно беспристрастным. На его исполнителя не должны оказывать влияние общие впечатления о личности обследуемого: симпатии и антипатии, собственное состояние или настроение.
5. Принцип конфиденциальности.
Вся информация, получаемая в процессе обследования, должна быть строго конфиденциальной: она должна быть доступной только для тех, для кого она предназначена. Требования конфиденциальности психологической информации, может нарушаться только в тех случаях, когда нераскрытие диагностических данных представляет опасность для обследуемого человека или общества.
6. Принцип психопрофилактического изложения результатов.
При сообщении результатов самому испытуемому должны быть соблюдены соответствующие меры предосторожности, направленные против их неправильного использования, неверной интерпретации или возможного появления невротически-депрессивных реакций или состояний.
Если испытуемый настаивает на том, чтобы «переделать» тестовое задание, психолог должен иметь наготове «запасной» вариант практически эквивалентной методики, (параллельные формы), чтобы убедить самого испытуемого, что ему представлен дополнительный шанс, и что результаты первого тестирования достаточно достоверны. Испытуемый также должен иметь возможность комментировать содержание своих результатов и в случае необходимости разъяснять или исправлять фактическую информацию.
Если известно, что информация может быть использована во вред испытуемому, для конфронтации или ухудшения положения, она может быть преподнесена в форме снижающей эту возможность или не предоставляться совсем. Главная заповедь «Не навреди».
7. Принцип ненанесения ущерба (Принцип благополучия клиента). Результаты психодиагностики ни в коем случае нельзя использовать во вред человеку, прошедшему тестирование. Если психодиагностика проводится в целях конкурсного отбора или при приеме на работу, то данный принцип применяется вместе с принципом открытости результатов психодиагностики.
8. Принцип ограниченного распространения психодиагностических методик (принцип профессиональной тайны).
Сертифицированные психологическим обществом профессиональные психодиагностические методики могут распространяться только среди аттестованных специалистов.
Этот принцип преследует двоякую цель: неразглашение содержания методик и предупреждение их неправильного применения. Доступ к таким методикам должны иметь только специалисты, гарантирующие их правильное использование и отвечающие за достоверность результатов. Сохранение профессиональной тайны имеет большое значение для обеспечения корректной и точной психодиагностики. Профессиональные психодиагностические методики не должны публиковаться в научно - популярных изданиях и поступать в открытую продажу. Свободный доступ к методикам может привести к тому, что они утратят свою диагностическую ценность.
История возникновения тестирования (индивидуальное и групповое тестирование).
Тестовые методики связаны с теоретическими принципами бихевиоризма.
Термин «тест» был введен Ф. Гальтоном.
Первым исследователем применившим интеллектуальный тест был Дж. М. Кеттелл (1891г в лаборатории при Колумбийском университете).
В 1904г. Министерство образования Франции поручило Альфреду Бине разработать методику при помощи которой можно было бы отделить детей, способных к обучению, от страдающих прирожденными дефектами и не способных к обучению в нормальной школе. В 1905г. Бине в сотрудничестве с Теофилом Симоном разработали первую шкалу (серия тестов), которая в дальнейшем несколько раз пересматривалась авторами. Шкала Бине в последующих редакциях (1908, 1911) используется и сейчас.
Коэффициент IQ был предложен В.Штерном (частное, получаемое при делении умственного возраста на хронологический и умноженный на 100).
3 Возникновение группового тестирования
В США в период Первой мировой войны появилась новая форма тесто¬вых испытаний - групповое тестирование. А.С. Отис (1886—1963) разработал две формы армейских тестов— "Альфа" и "Бета". Первая из них предна¬значалась для работы с людьми, знающими английский язык. Вто¬рая — для неграмотных и иностранцев.
1920-е гг. характеризовались настоящим тестовым бумом.
Возникло но¬вое направление в тестологии — тестирование специальных способно¬стей, которое вначале призвано было лишь дополнить оценки тестов ин¬теллекта, а впоследствии выделилось в самостоятельную область.
Термин «тест» [ англ. test – проба, проверка, опыт, испытание, исследование] был введен основателем тестовой диагностики американским психологом Д.Кеттелом в конце XIX века. Позднее тесты совершенствовали французский психолог А.Бине, позже другой американский психолог Э.Торндайк и его ученики. Тест – это стандартизированное задание или система контрольных заданий, нацеленных на измерение актуального уровня знаний, умений и навыков, а также способностей испытуемого. Соответственно, под тестированием понимается метод психолого-педагогической диагностики, применяющий стандартизированные задания.
Тестовая методика с момента зарождения постоянно находилась в процессе совершенствования. Альфред Бинэ (18571911) один из основоположников учения о тестах. Им разработана (в вариантах теста 1908 и 1911 гг.) система возрастных шкал для диагностики детей. Он сгруппировал тестовые задания по возрастным группам, в которых «нормальные» дети решали их на 5090%. Если данную задачу решало около 75% определенного количества детей одинакового возраста, она считалась показательной для данного возраста. По числу заданий, которые решил ребенок, вычислялся возраст его интеллектуального развития. Задания, как правило, предполагали владение логическими, логико-перцептивными и арифметическими действиями, выявляли общую осведомленность, ориентировку в практических ситуациях, произвольную память и пр. Таким образом была составлена серия тестов для каждого возраста.
Однако этот возраст интеллектуального развития может сообщить что-то об умственных способностях ребенка и перспективах его развития только в том случае, если его сопоставить с возрастом жизни ребенка. Поэтому немецкий психолог Вильям Штерн (18711938) предложил разделить возраст интеллектуального развития на возраст жизни и получить таким образом сопоставимый коэффициент интеллектуального развития. Чтобы получить целые числа, полученную величину умножали на 100. Величина, равная 100, соответствовала совпадению возраста интеллектуального развития и возраста жизни и обозначала тем самым средний уровень интеллектуального развития. Английский психолог Берт, а также американский ученый Термен попытались усовершенствовать эту систему. По их именам названы шкалы Бине-Берта и Бине-Термена.
Шкала тестов Бине-Термена устроена таким образом, что на каждый период детского возраста дает шесть тестов. Каждый тест считается за два месяца. Вначале испытуемому предъявляли задания, которые соответствовали возрасту на год меньшему, чем его собственный. Он должен был дать подряд пять правильных ответов. Этим фиксировался умственный «базовый возраст». Далее необходимо было к числу тестов «базового возраста» прибавить число всех правильных ответов. К примеру, если ребенок решил все задачи его возраста, допустим, для 6 лет и примерно три теста для более старших детей, то его умственный возраст считается равным 6 годам и 6 месяцам. В этом случае коэффициент интеллекта для данного ребенка высчитывается по формуле:
,
где УВ – умственный возраст (в соответствии с тестами);
ХВ – хронологический (паспортный) возраст.
IQ «Ай-кью» равняется умственному возрасту (в данном случае 6,5 лет), умноженному на 100 и деленному на действительный хронологический возраст ребенка (в нашем примере 6 лет). Для нашего примера коэффициент умственного развития ребенка будет равен приблизительно 108%, что является чуть выше нормы.
Впервые шкала IQ была применена в 1916 г. при адаптации теста Бине-Термена. Но применение данной шкалы сразу натолкнуло исследователей на тот недостаток, что невозможно рассчитать возраст жизни старше 16 или 19 лет, так как не было заданий, могущих выявить прогресс в возрасте интеллектуального развития. Вследствие чего невозможно было разработать шкалу коэффициента интеллекта для взрослых.
Д. Векслер в 1939 г. рассчитал для этого теста стандарты, полученные при вычислении отклонений от средней величины конкретной взрослой группы. Тем самым, он полностью отказался от определения возраста интеллектуального развития и деления его на возраст жизни. В этом случае название «коэффициент интеллекта» более не соответствовало существу полученной величины, но было сохранено ввиду широкой распространенности этого термина. Эту новую величину, сразу же вошедшую в научный обиход, называют «IQ-отклонением». Она характеризуется средней величиной, определяемой при выверке репрезентативной выборки, которая умножается на 100 и имеет стандартное отклонение в положительную или отрицательную стороны равную примерно 15 единицам.
На первом этапе создания тестов IQ испытуемого исчисляли путем деления умственного возраста на хронологический возраст, при этом основное внимание уделялось повышению качества измерений на основе главным образом классического аппарата теории погрешностей измерений. С накоплением экспериментального опыта теория тестов стала развиваться на базе латентно-структурного анализа (П. Лазарсфельд и др.) и связанного с этим анализом ряда математических моделей измерения. Теперь используется математическая теория оценки качества заданий и параметров личности. На этой основе делаются все современные тесты. Отклонения от коэффициента интеллектуального развития вычисляются при подсчете отклонения отдельных результатов от средней величины (нормально распределенных) данных. На шкале, с помощью которой определяется отклонение от коэффициента интеллектуального развития, средняя величина составляет 100, а стандартное отклонение в обе стороны примерно 15 единиц IQ.
10. Надежность как одна из основных характеристик теста. Виды надежности.
2 Надежность и валидность
Прежде чем психодиагностические методики могут быть исполь¬зованы для практических целей, они должны пройти проверку по ряду формальных критериев, доказывающих их высокое качество и эффек¬тивность. Эти требования в психодиагностике складывались годами в процессе работы над тестами и над их совершенствованием. К числу основных критериев оценки психодиагностических мето¬дик относятся надежность и валидностъ. Большой вклад в разработку этих понятий внесли зарубежные психологи (А. Анастази, Е. Гизелли, Дж. Гилфорд, Л, Кронбах, Р. Торндайк, Е, Хаген и др.). Ими были разра¬ботаны как формально-логический, так и математико-статнетический ап¬парат (прежде всего, корреляционные метод и факторный анализ) обос¬нования степени соответствия методик отмеченным критериям
В традиционной тестологии термин надежность означает относи¬тельное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Повторное применение надежных методик дает сходные оценки. При этом в определенной мере могут совпадать как сами результаты, так и порядковое место (ранг), занимаемое испытуемым в группе. И в том, и в другом случае при повторении опыта возможны некоторые расхождения, но важно, чтобы они были незначительными, в пределах одной группы. Таким образом, можно сказать, что надежность методики — это такой кри¬терий, который говорит о точности психологических измерений, т.е. позволяет судить о том, насколько внушают доверие полученные ре¬зультаты.
Степень надежности методик зависит от многих причин. Поэтому важной проблемой практической диагностики является выяснение факторов, снижающих точность измерений. Среди них наиболее часто называются следующие:
1) нестабильность диагностируемого свойства;
2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сфор¬мулированы указания по предъявлению методики испытуемым и т.д.);
3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т.д.);
4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.);
5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом — утомле¬ние и т.д.);
6) элементы субъективности в способах оценки и интерпретации результатов (при протоколировании ответов испытуемых, при оцени¬вании ответов по степени полноты, оригинальности и т.п.).
Одним из важнейших средств повышения надежности психодиагностической методики яв¬ляется единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с ис¬пытуемыми, порядок предъявления заданий и т.д. При такой стандар¬тизации процедуры исследования можно существенно уменьшить влияние посторонних случайных факторов на результаты теста и та¬ким образом повысить их надежность.
На характеристику надежности методик большое влияние оказыва¬ет исследуемая выборка. Она может как снижать, так и завышать этот показатель. Например, надежность может быть искусственно завыше¬на, если в выборке небольшой разброс результатов, т.е. если результа-ты по своим значениям близки друг к другу. В этом случае при по¬вторном обследовании новые результаты также расположатся тесной группой. Возможные изменения ранговых мест испытуемых будут не¬значительными, и, следовательно, надежность методики будет высо¬кой. Такое же неоправданное завышение надежности может возник¬нуть при анализе результатов выборки, состоящей из группы, имею¬щей очень высокие результаты, и из группы с очень низкими оценка¬ми по тесту. Тогда эти далеко отстоящие друг от друга результаты не будут перекрываться, даже если и вмешаются в условия эксперимента случайные факторы. Поэтому в руководстве обычно делается описа¬ние выборки, на которой определялась надежность методики. В настоящее время надежность все чаще определяется на наиболее однородных выборках, т.е. на выборках, схожих по полу, возрасту, уровню образования, профессиональной подготовке и т.п. Для каждой такой выборки приводятся свои коэффициенты надежности. Приво¬димый показатель надежности применим только к группам, подобным тем, на которых он определялся. Если методика применяется к выбор¬ке, отличающейся от той, на которой проверялась ее надежность, то эта процедура должна быть проведена заново.
Разновидностей надежности ме¬тодик так же много, как и условий, влияющих на результаты диагно¬стических испытаний. Однако практическое применение находят лишь несколько видов надежности.
Так как все виды надежности отражают степень согласованности двух независимо полученных рядов показателей, то математико-статистический прием, с помощью которого устанавливается надеж¬ность методики, — это корреляции (по Пирсону или Спирмену). На-дежность тем выше, чем ближе полученный коэффициент корреляции подходит к единице, и наоборот.
К.М. Гуревич предложил толковать надежность как:
1) надежность самого измерительного инструмента;
2) стабильность изучаемого признака;
3)константность, т.е. относительную независимость результатов от личности экспериментатора.
Показатель, характеризующий измерительный инструмент, предла¬гается называть коэффициентом надежности; показатель, характери¬зующий стабильность измеряемого свойства, — коэффициентом ста¬бильности; а показатель оценки влияния личности экспериментато¬ра — коэффициентом константности.
Именно в таком порядке рекомендуется осуществлять проверку методики: целесообразно сначала проверить инструмент измерения; если полученные данные удовлетворительны, то можно переходить к установлению меры стабильности измеряемого свойства; после этого, при необходимости, можно заняться критерием константности.
Определение надежности измерительного инструмента. От то¬го, как составлена методика, насколько правильно подобраны задания с точки зрения их взаимосогласованности, насколько она однородна, зависят точность, объективность любого психологического измере-ния. Внутренняя однородность методики показывает, что ее задания актуализируют одно и то же свойство, признак.
Для проверки надежности измерительного инструмента, говоряще¬го о его однородности (или гомогенности), используется так называе¬мый метод расщепления. Обычно задания делятся на четные и нечет¬ные, обрабатываются отдельно, а затем результаты двух полученных рядов коррелируются между собой. Для применения этого способа нужно поставить испытуемых в такие условия, чтобы они смогли ус¬петь решить (или попытаться решить) все задания. Если методика од¬нородна, то большой разницы в успешности решения по таким половинкам не будет, и, следовательно, коэффициент корреляции будет достаточно высоким.
Можно делить задания и другим путем. Например, можно сопоста¬вить первую половину теста со второй, первую и третью четверть со второй и четвертой и т.п. Однако расщепление на четные и нечетные задания представляется самым целесообразным, поскольку именно этот способ наиболее независим от влияния таких факторов, как врабатываемость, тренировка, утомление и пр.
Методика признается надежной, когда полученный коэффициент не ниже 0,75—0,85. Лучшие по надежности тесты дают коэффициен¬ты порядка 0,90 и более.
Но на начальном этапе разработки диагностической методики можно получить невысокие коэффициенты надежности, например, порядка 0,46—0,50. Это означает, что в разрабатываемой методике присутствует некоторое число заданий, которые в силу своей специ-фичности ведут к снижению коэффициента корреляции. Такие зада¬ния необходимо специально проанализировать и либо переделать их, либо вообще изъять.
Чтобы легче было установить, за счет каких заданий снижаются коэффициенты корреляции, необходимо проанализировать таблицы с выписанными данными, подготовленными для корреляций. Следует отметить, что любые изменения в содержании методики — изъятие заданий, их перестановка, переформулировка вопросов или ответов — требуют заново высчитывать коэффициенты надежности.
При ознакомлении с коэффициентами надежности не следует за¬бывать, что они зависят не только от правильного подбора заданий с точки зрения их взаимосогласованности, но и от социально-психоло¬гической однородности той выборки, на которой проверялась надеж¬ность измерительного инструмента.
В заданиях могут встретиться понятия, малоизвест¬ные одной части испытуемых, но хорошо известные другой части. От того, как много в методике таких понятий, будет зависеть и коэффи¬циент надежности; задания с такими понятиями могут случайно рас¬положиться и в четной, и в нечетной половине теста. Очевидно, пока¬затель надежности не следует приписывать только методике как тако¬вой, и нельзя уповать на то, что он будет неизменным, с какой бы вы-боркой ни проводилось тестирование.
Определение стабильности изучаемого признака. Определить надежность самой методики — это не значит решить все вопросы, связанные с ее применением. Нужно еще установить, насколько ус¬тойчив, стабилен признак, который исследователь намерен измерять. Было бы методологической ошибкой рассчитывать на абсолютную стабильность психологических признаков. В том, что измеряемый признак со временем меняется, нет ничего опасного для надежности. Все дело в том, в каких пределах варьируются результаты от опыта к опыту у одного и того же испытуемого, не приводят ли эти колебания к тому, что испытуемый по непонятным причинам оказывается то в начале, то в середине, то в конце выборки. Сделать какие-то конкрет¬ные выводы об уровне представленности измеряемого признака у та¬кого испытуемого нельзя. Таким образом, колебания признака не должны иметь непредсказуемый характер. Если не ясны причины, по которым происходит резкое колебание, то такой признак не может быть использован в диагностических целях.
Для проверки стабильности диагностируемого признака, свойства используется прием, известный под названием тест—ретест. Он за¬ключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреля¬ции между результатами первого и второго обследования. Он будет свидетельствовать о сохранении или не сохранении каждым испытуе¬мым своего порядкового номера в выборке.
На степень устойчивости, стабильности диагностируемого свойст¬ва влияют разнообразные факторы. Число их достаточно велико. Важно соблюдать требования единооб-разия процедуры проведения эксперимента. Так, например, если пер¬вое тестирование проводилось в утренние часы, то и повторное долж¬но быть проведено утром; если первый опыт сопровождался предва¬рительным показом заданий, то и при повторном испытании это усло¬вие также должно быть соблюдено и т.д.
При определении стабильности признака большое значение имеет промежуток времени между первым и вторым обследованием. Чем короче срок от первого до второго испытания, тем (при прочих рав¬ных условиях) больше шансов, что диагностируемый признак сохра¬нит уровень первого испытания. С увеличением временного интервала стабильность признака имеет тенденцию снижаться, так как возраста¬ет число посторонних факторов, влияющих на нее. Следовательно, напрашивается вывод, что целесообразно проводить повторное тести¬рование через короткий срок после первого. Однако тут есть свои сложности: если срок между первым и вторым опытом небольшой, то некоторые испытуемые могут воспроизвести свои прежние ответы по памяти и, таким образом, отойдут от смысла выполнения заданий. В этом случае результаты двух предъявлений методики уже нельзя рас¬сматривать как независимые.
Трудно четко ответить на вопрос, какой срок можно считать опти¬мальным для повторного эксперимента. Только исследователь, исходя из психологической сущности методики, условий, в которых она про¬водится, особенностей выборки испытуемых, может определить этот срок. При этом такой выбор должен быть научно обоснован. В тестологической литературе наиболее часто называются временные интер¬валы в несколько месяцев (но не более полугода). Важно помнить, что коэффициент стабильности не следует рас¬сматривать только с его узко формальной стороны, по его абсолютным значениям. Если методика исследует свойство, которое в период ди¬агностирования находится в процессе интенсивного развития (напри¬мер умение проводить обобщения), то коэффициент стабильности может оказаться невысоким, но это не следует истолковывать как не¬достаток методики. Такой коэффициент стабильности должен интер¬претироваться как показатель определенных изменений, развития ис¬следуемого свойства. Совсем другое требование предъявляется к коэффициенту ста¬бильности, если автор методики считает, что измеряемое свойство уже сформировано и должно быть достаточно устойчивым. Коэффи¬циент стабильности в этом случае должен быть достаточно высоким (не ниже 0,80).
Таким образом, вопрос о стабильности измеряемого свойства ре¬шается не всегда однозначно. Решение зависит от сущности самого диагностируемого свойства.
Определение константности, т.е. относительной независимости результатов от личности экспериментатора. Коэффициент константности определяется путем корреляции ре¬зультатов двух опытов, проведенных в относительно одинаковых ус¬ловиях на одной и той же выборке испытуемых, но разными экспери¬ментаторами. Коэффициент корреляции не должен быть ниже 0,80.
11. Валидность как одна из основных характеристик теста. Виды валидности.
Другим после надежности ключевым критерием оценки качества методик является валидность. Вопрос о валидности методики решается лишь после того, как установлена достаточная ее надежность, поскольку ненадежная методика не может быть валидной. Но самая надежная методика без знания ее валидности является практически бесполезной.
Наиболее укоренившимся определением этого понятия является то, которое приведено в книге А. Анастази: "Валидность теста— понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает". Валидность по своей сути — это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность. По этой причине не существует какого-то единого универсального подхода к определению валидности. В зависимости от того, какую сторону валидности хочет рассмотреть исследователь, используются и разные способы доказательства. Проверка валидности методики называется валидизацией.
Валидность в первом ее понимании имеет отношение к самой методике, т.е. это валидность измерительного инструмента. Такая проверка называется теоретической валидизацией. Валидность во втором понимании уже относится не столько к методике, сколько к цели ее использования. Это прагматическая валидизация.
Итак, при теоретической валидизации исследователя интересует само свойство, измеряемое методикой. Это, по существу, означает, что проводится собственно психологическая валидизация. При прагматической валидизации суть предмета измерения (психологического свойства) оказывается вне поля зрения. Главный акцент сделан на то, чтобы доказать, что "нечто", измеряемое методикой, имеет связь с определенными областями практики.
Провести теоретическую валидизацию, в отличие от прагматической, порой оказывается значительно труднее. Выбирается какой-нибудь независимый от методики внешний критерий, определяющий успех в той или иной деятельности (учебной, профессиональной и т.п.) и с ним сравниваются результаты диагностической методики. Если связь между ними признается удовлетворительной, то делается вывод о практической значимости, эффективности, действенности диагностической методики.
Для определения теоретической валидности найти какой-либо независимый критерий, лежащий вне методики, гораздо труднее. Поэтому на ранних стадиях развития тестологии, когда концепция валидности только складывалась, бытовало интуитивное представление о том, что тест измеряет:
методика называлась валидной, так как то, что она измеряет, просто "очевидно";
доказательство валидности основывалось на уверенности исследователя в том, что его метод позволяет "понять испытуемого";
методика рассматривалась как валидная (т.е. принималось утверждение, что такой-то тест измеряет такое-то качество) только потому, что теория, на основании которой строилась методика, "очень хорошая".
Принятие на веру голословных утверждений о валидности методики не могло продолжаться длительное время. Первые проявления действительно научной критики развенчали такой подход: начались поиски научно обоснованных доказательств.
Провести теоретическую валидизацию методики — это доказать, что методика измеряет именно то свойство, качество, которое она, по замыслу исследователя, должна измерять. Так, например, если какой-то тест разрабатывался для того, чтобы диагностировать умственное развитие детей, надо проанализировать, действительно ли он измеряет именно это развитие, а не какие-то другие особенности (например личность, характер и т.п.). Таким образом, для теоретической валидизации кардинальной проблемой является отношение между психологическими явлениями и их показателями, посредством которых эти психологические явления пытаются познать. Такая проверка показывает, насколько замысел автора и результаты методики совпадают.
Не столь сложно провести теоретическую валидизацию новой методики, если для измерения данного свойства уже имеется методика с доказанной валидностью. Наличие корреляции между новой и аналогичной, уже проверенной методиками указывает на то, что разработанная методика измеряет то же психологическое качество, что и эталонная. И если новый метод одновременно оказывается более компактным и экономичным в проведении и обработке результатов, то психодиагносты получают возможность использовать новый инструмент вместо старого.
Однако теоретическая валидность доказывается не только путем сопоставления с родственными показателями, но также и с теми, где исходя из гипотезы значимых связей не должно быть. Таким образом, для проверки теоретической валидности важно, с одной стороны, установить степень связи с родственной методикой (конвергентная валидность), а с другой— отсутствие этой связи с методиками, имеющими другое теоретическое основание (дискриминантная валидность).
Гораздо труднее провести теоретическую валидизадию методики тогда, когда указанный путь проверки невозможен. В таких обстоятельствах только постепенное накопление разнообразной информации об изучаемом свойстве, анализ теоретических предпосылок и экспериментальных данных, значительный опыт работы с методикой позволяют раскрыть ее психологический смысл.
Важную роль для понимания того, что методика измеряет, играет сопоставление ее показателей с практическими формами деятельности. Но здесь особенно важно, чтобы методика была тщательно проработана в теоретическом плане, т.е. чтобы имелась прочная, обоснованная научная база. Тогда при сопоставлении методики с взятым из повседневной практики внешним критерием, соответствующим тому, что она измеряет, может быть получена информация, подкрепляющая теоретические представления о ее сущности.
Если доказана теоретическая валидность, то интерпретация полученных показателей становится более ясной и однозначной, а название методики соответствует сфере ее применения.
Что касается прагматической валидизации, то она подразумевает проверку методики с точки зрения ее практической эффективности, значимости, полезности, поскольку диагностической методикой имеет смысл пользоваться только тогда, когда доказано, что измеряемое свойство проявляется в определенных жизненных ситуациях, в определенных видах деятельности. Ей придают большое значение особенно там, где встает вопрос отбора.
Для проведения прагматической валидизации методики, т.е. для оценки ее эффективности, действенности, практической значимости, обычно используется независимый внешний критерий— показатель проявления изучаемого свойства в повседневной жизни. Таким критерием могут быть и успеваемость (для тестов способностей к обучению, тестов достижений, тестов интеллекта), и производственные достижения (для методик профессиональной направленности), и эффективность реальной деятельности — рисования, моделирования и т.д. (для тестов специальных способностей), субъективные оценки (для тестов личности).
Американские исследователи Дж. Тиффин и Э. Маккормик (1968), проведя анализ используемых для доказательства валидности внешних критериев, выделяют четыре их типа:
1) критерии исполнения (в их число могут входить такие, как количество выполненной работы, успеваемость, время, затраченное на обучение, темп роста квалификации и т.п.);
субъективные критерии (они включают различные виды ответов, которые отражают отношение человека к чему-либо или к кому-либо, его мнение, взгляды, предпочтения; обычно субъективные критерии получают с помощью интервью, опросников, анкет);
физиологические критерии (они используются при изучении влияний окружающей среды и других ситуационных переменных на организм и психику человека; замеряются частота пульса, давление крови, электросопротивление кожи, симптомы утомления и т.д.);
критерии случайностей (применяются, когда цель исследования касается, например, проблемы отбора для работы таких лиц, которые менее подвержены несчастным случаям).
Внешний критерий должен отвечать трем основным требованиям: он должен быть релевантным, свободным от помех (контаминации) и надежным.
Под релевантностью имеется в виду смысловое соответствие диагностического инструмента независимому жизненно важному критерию. Другими словами, должна быть уверенность в том, что в критерии задействованы именно те особенности индивидуальной психики, которые измеряются и диагностической методикой. Внешний критерий и диагностическая методика должны находиться между собой во внутреннем смысловом соответствии, быть качественно однородными по психологической сущности. Если, например, тест измеряет индивидуальные особенности мышления, умение выполнять логические действия с определенными объектами, понятиями, то и в критерии нужно искать проявление именно этих умений. Если относительно внешнего критерия неизвестно, релевантен он измеряемому свойству или нет, то сопоставление с ним результатов психодиагностической методики становится практически бесполезным. Оно не позволяет прийти к каким-либо выводам, которые могли бы дать оценку валидности методики.
Требования свободы от помех (контаминации) вызываются тем, что, например, учебная или производственная успешность зависит от двух переменных: от самого человека, его индивидуальных особенностей, измеряемых методиками, и от ситуации, условий учебы, труда, которые могут привнести помехи, "загрязнить" применяемый критерий. Чтобы в какой-то мере избежать этого, следует отбирать для исследования такие группы людей, которые находятся в более или менее одинаковых условиях. Можно использовать и другой метод. Он состоит в корректировке влияния помех. Эта корректировка носит обычно статистический характер. Так, например, производительность следует брать не по абсолютным значениям, а в отношении к средней производительности рабочих, имеющих аналогичные условия труда.
Когда говорят, что критерий должен иметь статистически достоверную надежность, это означает, что он должен отражать постоянство и устойчивость исследуемой функции.
Поиски адекватного и легко выявляемого критерия относятся к очень важным и сложным задачам валидизации.
Оценка валидности методик может носить количественный и качественный характер. Для вычисления количественного показателя — коэффициента валидности — сопоставляются результаты, полученные при применении диагностической методики, с данными тех же лиц, полученными по внешнему критерию. Используются разные виды линейной корреляции (по Спирмену, по Пирсону).
Практика показала, что для расчета валидности количество испытуемых не должно быть меньше 50, однако лучше всего более 200.
Коэффициент валидности был статистически значим. Низким признается коэффициент валидности порядка 0,20—0,30» средним — 0,30—0,50 и высоким — свыше 0,60.
Не всегда для вычисления коэффициента валидности правомерно использовать линейную корреляцию. Этот прием оправдан лишь тогда, когда доказано, что успех в какой-то деятельности прямо пропорционален успеху в выполнении диагностической пробы.
Существуют несколько видов валидности, обусловленных особенностями диагностических методик, а также временным статусом внешнего критерия. Однако чаще всего называются следующие:
Валидность "no содержанию". Используется, например, в тестах достижений. Обычно в тесты достижений включается не весь материал, который прошли учащиеся, а какая-то его небольшая часть (3—4 вопроса). Валидность "по содержанию" также подходит к критериально-ориентированным тестам. Иногда этот прием называют логической валидностью.
Валидность "по одновременности" (текущая валидность). Определяется с помощью внешнего критерия, по которому информация собирается одновременно с экспериментами по проверяемой методике.
"Предсказывающая"валидность ("прогностическая" валидность). Определяется также по внешнему критерию, но информация по нему собирается некоторое время спустя после испытания. Внешним критерием обычно бывает выраженная в каких-либо оценках способность человека к тому виду деятельности, для которой он оценивался по результатам диагностических испытаний. Хотя этот прием наиболее соответствует задаче диагностических методик — предсказанию будущей успешности, применять его очень трудно. Точность прогноза находится в обратной зависимости от времени, заданного для такого прогнозирования. Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно.
"Ретроспективная" валидность. Определяется на основе критерия, отражающего события или состояние качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики.
При приведении данных о валидности разработанной методики важно точно указать, какой вид валидности имеется в виду ("по содержанию", «по одновременности» и т.д.). Желательно также сообщать сведения о численности и особенностях индивидов, на которых проводилась валидизация. Такая информация позволяет пользующемуся методикой исследователю решить, насколько валиден этот прием для той группы, к которой он собирается его применять. Как и в случае с надежностью, необходимо помнить, что в одной выборке методика может обладать высокой валидностью, а в другой — низкой. Поэтому если исследователь планирует использовать методику на выборке испытуемых, существенно отличающейся от той, на которой проводилась проверка валидности, ему необходимо заново провести такую проверку. Приводимый в руководстве коэффициент валидности применим только к группам испытуемых, подобным тем, на которых он определялся.
13..История проективного метода
Проективные методики представляют собой специфическую, довольно неоднородную группу психодиагностических приемов клинической ориентации. Последнее означает не столько направленность проективных методик на выявление тех или иных аномалий личности, сколько способность методик прогнозировать индивидуальный стиль поведения, переживания и аффективного реагирования в значимых или конфликтных ситуациях, выявлять неосознаваемые аспекты личности.
История проективных методик – это и хронология, отмечающая особо важные вехи развития проективной техники, и история развития проективного метода как целостного подхода к пониманию природы личности и способов ее экспериментального изучения.
Счет проективным методикам ведется с теста словесных ассоциаций К. Юнга, созданного им в 1904-1905 годах. К. Юнгу принадлежат открытие и доказательство феномена, лежащего в основе всех проективных методик, а именно возможность посредством косвенного воздействия на значимые области-переживания и поведения человека («комплексы») вызывать пертурбации в экспериментальной деятельности. К. Юнг показал таким образом, что бессознательные переживания личности доступны объективной диагностике. Впоследствии разнообразные варианты ассоциативного теста применялись для выявления чувства вины (детекторы лжи М. Вертгаймера и А. Р. Лурия), асоциальных вытесненных влечений (Дж. Брунер, Р. Лазарус, Л. Постмен, Ч. Эриксен и др.), для отграничения нормы от патологии (Г. Кент и А. Розанов). Тесты незаконченных предложений и рассказов также нередко считают ведущими свое происхождение от ассоциативного теста К. Юнга.
Триумф проективной диагностики связан с появлением в 1921 г. «Психодиагностики» Г. Роршаха, опубликованной в Бер не на немецком языке.
За время, прошедшее после выхода в свет «Психодиагностики», появились методики, родственные тесту Г. Роршаха. Наиболее известны среди них Бен-Роршах («Bero»)-тест, тест Цуллигера и тест Хольцмана. Bero-тест создавался Роршахом и его непосредственным сотрудником как параллельная серия оригинального набора таблиц.
Еще одна из наиболее распространенных в мире методик – Тест тематической апперцепции (ТАТ) была создана в 1935 г. Г. Мюрреем (1893-1988) совместно с Х.Морган. Стимульный материал состоит из таблиц с изображениями неопределенных, допускающих неоднозначные толкования ситуаций. Испытуемому предлагалось придумать небольшую историю о том, что привело к ситуации, изображенной на картинке, и как она будет развиваться.
К началу 40-х гг. 20 века диагностика, благодаря проективным методикам стала очень популярной. Сегодня она занимает лидирующее положение в зарубежных исследованиях личности, несмотря на критическое
отношение к данным, получаемых с помощью проективных методик. Критические замечания в адрес этих методик сводятся к указаниям на их недостаточную стандартизацию, пренебрежение нормативными данными, неподатливость традиционным способам определения надежности и валидности, а главное – на большой субъективизм в интерпретации результатов.
