- •Введение
- •Модуль 1. Психодиагностика как наука
- •Глава 1. Введение в психодиагностику
- •Понятие и задачи психодиагностики
- •Психодиагностика и смежные направления
- •Сферы применения психодиагностики
- •1. Экономика, армия, правоохранительная система
- •2. Образование
- •3. Здравоохранение
- •Глава 2. История психодиагностики
- •2.1. Истоки становления психодиагностики
- •2.2. Психодиагностика в хх столетии
- •2.3. Перспективные направления развития психодиагностики
- •Глава 3. Психологический диагноз
- •3.1. Понятие, специфика и виды психологического диагноза
- •3.2. Методы постановки и способы применения диагноза
- •1) Методы постановки диагноза
- •2) Способы применения диагноза
- •3.3. Ошибки в постановке диагноза
- •Глава 4. Психодиагностическая методика (тест)
- •Понятие и составные части психодиагностической методики
- •4.2 Классификация психодиагностических методик
- •Глава 5. Профессиональные стандарты в психодиагностике
- •5.1. Стандарты образовательного и психологического тестирования
- •5.2 Требования к психодиагностическим методикам
- •5.3. Требования к пользователям психодиагностических методик
- •1) Использование пдм психологом
- •2) Использование пдм специалистами-смежниками
- •5.4 Этический стандарт (кодекс) психолога
- •Модуль 2. Психометрические основы психодиагностики
- •Глава 6. Измерительные шкалы
- •6.1. Понятие и виды измерительных шкал
- •6.2. Точность и ошибки измерения
- •6.3. Статистическая природа тестовых шкал
- •Глава 7. Репрезентативность и стандартность
- •7.1. Понятие репрезентативности
- •7.2. Способы создания и оценки репрезентативности выборки
- •Значения ua для стандартных доверительных вероятностей
- •7.3. Понятие стандартности
- •7.4. Подходы к пониманию нормы в психодиагностике
- •1) Клинический подход к пониманию нормы
- •2) Статистический подход к пониманию нормы
- •7.5. Нормативные данные и таблицы
- •7.6. Стандартизация первичных тестовых показателей
- •1. Преобразование тестовых оценок в интервальную шкалу
- •2. Квантильная стандартизация
- •Глава 8. Надежность и валидность
- •8.1. Понятие и виды надежности
- •8.2. Оценка надежности
- •8.3. Снижение достоверности результатов тестирования
- •1. Погрешности, вносимые специалистом
- •2. Погрешности, вносимые испытуемым
- •3. Погрешности, связанные с условиями и организацией диагностики
- •8.4. Контроль достоверности тестирования
- •8.5. Понятие и виды валидности
- •1. Понятии валидности
- •2. Виды валидности
- •2.1. Внутренняя и внешняя валидность
- •2.2. Концептуальная и конструктная валидность
- •2.3. Очевидная и содержательная валидность
- •2.4. Эмпирическая (критериальная), прогностическая и текущая валидность
- •2.5. Конвергентная и дискрименантная валидность
- •8.6. Оценка валидности
- •Глава 9. Конструирование и адаптация психодиагностических методик
- •9.1. Разработка психодиагностической методики
- •1. Составление концептуальной модели пдм
- •1.1. Сферы и цели применения пдм
- •1.2. Основные характеристики пдм
- •1.3. Шкалы и диагностируемые психические качества
- •1.4. Методические принципы построения шкал
- •2. Разработка стимульного материала
- •2.1. Создание тестовых заданий (на примере шкал субъективного типа)
- •2.2. Оформление стимульного материала, опросной сетки и «ключей» для пилотажного исследования
- •3. Оценка содержательной валидности и очевидной валидности
- •5. Оценка репрезентативности выборки
- •6. Оценка диагностической силы пунктов
- •7. Оценка надежности-согласованности
- •8. Оценка конвергентной или дискриминантной валидности
- •9. Составление окончательного варианта стимульного материала, ключей, интерпретации
- •9.2. Адаптация зарубежной психодиагностической методики
- •1. Проблема адаптации
- •2. Процедура адаптации
- •1) Определение целесообразности адаптации зарубежного теста
- •2) Анализ концепции, на базе которой был разработан тест
- •3) Перевод пунктов стимульного материала пдм
- •Модуль 3. Психодиагностические методики и их применение
- •Глава 10. Методики объективного типа
- •10.1. Методики диагностики психических функций и состояний индивида
- •1) Методики диагностики внимания
- •2) Методики диагностики восприятия и воображения
- •3) Методики диагностики мышления
- •4) Методики диагностики памяти
- •10.2. Методики диагностики психомоторных и психофизиологических особенностей индивида
- •Глава 11. Методики субъективного типа
- •11.1. Методики диагностики темпераментных и социально-психологических особенностей индивида
- •1) Методики диагностики темпераментных особенностей индивида
- •2) Методики диагностики социально-психологических качеств индивида
- •3) Методики изучения одновременно темпераментных и социально-психологических качеств индивида
- •16Pf личностный опросник
- •4) Методики диагностики типов и типологических особенностей индивида
- •11.2. Методики диагностики малой группы, неформальной подгруппы и индивида в группе
- •1) Метод определения структуры группы
- •2) Методики диагностики субъектных характеристик группы и подгрупп
- •3) Методики диагностики феноменов отношений в группе и подгруппах
- •4) Методики диагностики характеристик индивида в группе и подгруппе
- •Глава 12. Применение эвм в психодиагностике
- •12.1. Способы применения эвм
- •12.2. Компьютерные и компьютеризированные психодиагностические методики
- •1. Преимущества и ограничения компьютерной и бланковой диагностики
- •2. Компьютерное адаптивное тестирование
- •3. Программные оболочки для конструирования тестов
- •Глава 13. Нормативно-документальная основа психодиагностической деятельности
- •13.1. Нормативно-правовое обеспечение психодиагностической
- •1. Нормативно-правовые требования в области персональных данных
- •1.1. Основные понятия
- •1.2. Принципы обработки персональных данных
- •1.3. Условия обработки персональных данных
- •1.4. Передача персональных данных
- •1.5. Меры по обеспечению безопасности персональных данных при их обработке
- •1.6. Обработка персональных данных без использования средств автоматизации
- •1.7. Исключительно автоматизированная обработка персональных данных
- •1.8. Права субъекта персональных данных
- •1.9. Ответственность за нарушение требований об обработке персональных данных
- •2. Положение о психологической службе
- •3. Должностная инструкция
- •4. Нормативы времени
- •13.2. Документация в психодиагностической работе
- •Глава 14. Проведение психодиагностического обследования
- •14.1. Процедура психологического тестирования
- •14.2. Поведение тестируемого
- •Практикум 1 «Бланковые психодиагностические методики»
- •1 Изучение методики
- •2 Работа с методикой
- •Практикум 2 «Компьютерные психодиагностические методики»
- •1 Самотестирование
- •2 Изучение методики
- •3 Тестирование испытуемого
- •Практикум 3 «Разработка и оценка стимульного материала пдм»
- •1 Составление пунктов методики
- •2 Оценка пунктов методики
- •2.1 Оценка очевидной валидности
- •2.2 Оценка содержательной валидности
- •2.3 Проведение первого пилотажного исследования
- •2.4 Оценка диагностической силы пунктов
- •Показатели диагностической силы пунктов методики
- •2.5 Составление окончательного варианта стимульного материала и "ключей".
- •2.6 Проведение второго пилотажного исследования
- •2.7 Оценка надежности-согласованности
- •Литература
8.2. Оценка надежности
1. Ретестовая надежность. Самый простой способ определения этого вида надежности – проведение двух обследований с помощью методики на одной и той же выборке испытуемых через определенный интервал времени. В этом случае коэффициент надежности (гя) просто равен корреляции между двумя рядами тестовых показателей.
По существу, коэффициент корреляции (г) выражает степень соответствия или связи между двумя множествами показателей. Вычисляемые по реальным данным коэффициенты корреляции попадают между граничными значениями (-1 и +1) и обычно отличаются от нуля, но практически всегда оказываются меньше единицы (по абсолютному значению). Коэффициенты корреляции можно вычислять разными способами, в зависимости от природы данных. Наибольшее распространение получил коэффициент корреляции Пирсона.
,
(16)
где
xi
и
yi
–
тестовые оценки i
испытуемого
по двум замерам,
и
-
средние
значения, соответственно, по первому и
второму замеру на выборке испытуемых,
и
-
среднеквадратические отклонения по
первому и второму замеру на выборке
испытуемых, n
– количество пар значений.
Этот коэффициент учитывает не только положение индивида в группе, но и степень его отклонения в ту или иную сторону от среднего уровня выборки.
Если коэффициент корреляции между двумя тестовыми замерами составляет от +0,7 до +0,9 (на уровне р<0,01), то ретестовая надежность считается высокой, а если более + 0,9, то – очень высокой. Чем больше объем выборки, на которой производилась оценка ретестовой надежности, тем о более высокой надежности свидетельствуют одни и те же значения коэффициента корреляции. Например, коэффициент г=0,81, полученный по методике на выборке N=270, свидетельствует о более высокой надежности, чем если бы такое значение корреляции было получено на выборке N=120.
Надо иметь в виду, что значения коэффициентов корреляции при оценке надежности шкал субъективного типа будут снижаться при следующих условиях:
- оценка многомерных методик по сравнению с одномерными тестами;
- использование трех- и пятиальтернативных вариантов ответов по тестовым заданиям, особенно с развернутой формулировкой;
- наличие тестовых заданий, обладающих средней диагностической силой.
Возникает противоречивая ситуация, когда повышение надежности-согласованности сопровождается ухудшением других характеристик методики и наоборот.
В описании процедуры и результатов оценки методики всегда следует указывать, в каком интервале времени измерена ретестовая надежность. Поскольку корреляции постепенно снижаются по мере увеличения этого интервала, для любого теста существует не один, а бесконечное множество ретестовых коэффициентов надежности. Желательно также давать некоторые сведения о событиях, происшедших за время между двумя сеансами тестирования с теми, на ком измерялась надежность теста. Также хорошо было бы знать, какими соображениями руководствовался разработчик при выборе именно этого интервала.
2. Надежность параллельных форм. Одних и тех же испытуемых тестируют в первый раз с помощью одной формы, а второй раз – посредством другой, эквивалентной формы. Корреляция между показателями, полученными по двум формам теста, представляет его коэффициент надежности. Заметим, что такой коэффициент надежности служит мерой как временной устойчивости, так и согласованности ответов на различные выборки заданий (или формы теста). Таким образом, этот коэффициент служит смешанной характеристикой двух типов надежности. Однако поскольку оба ее типа важны для большинства целей тестирования, надежность взаимозаменяемых форм оказывается полезной мерой для оценки многих тестов.
Как и в случае ретестовой надежности, сведения о надежности параллельных форм всегда должны сопровождаться указанием длительности временного интервала между двумя предъявлениями теста, а также характеристикой релевантных событий, происшедших за это время в жизни испытуемых. Если обе формы применяются непосредственно одна за другой, то полученная корреляция показывает только надежность параллельных форм, но ничего не говорит о надежности как временной устойчивости. Дисперсия ошибок в этом случае обусловлена колебаниями результатов при переходе от одного набора заданий к другому, а не временными флуктуациями показателей.
3. Надежность-согласованность. Этот вид надежности можно определить посредством деления теста либо на две равноценные половины, либо на столько частей, сколько содержится в нём заданий, с оценкой связи между частями теста.
3.1. Надежность эквивалентных половин теста. При таком способе каждый испытуемый получает два показателя благодаря разделению теста на две эквивалентные части.
Первая проблема, с которой приходится сталкиваться при применении метода расщепления, связана с тем, как разделить тест, чтобы добиться максимальной эквивалентности его половин. Всякий тест можно членить многими способами. В большинстве тестов первая и вторая половины оказались бы неэквивалентными вследствие различий в характере и уровне трудности заданий, а также в связи с кумулятивными эффектами вхождения в работу, утомления и любых других факторов, воздействие которых нарастает от начала к концу теста. Подходящий для большинства целей метод состоит в вычислении показателей отдельно по четным и нечетным заданиям теста.
Полученные показатели по двум частям теста коррелируются обычным методом. Однако эта корреляция показывает надежность лишь половины теста. Например, если весь тест состоит из 24 заданий, то корреляция вычисляется между двумя множествами показателей, каждый из которых основан только на выполнении 12 заданий. В отличие от надежности этого типа, при расчете ретестовой надежности и надежности параллельных форм, каждый показатель основывается на полном наборе заданий теста.
Поэтому применительно к расчетам надежности эквивалентных частей теста используется формула Спирмена – Брауна, предполагающая удвоение числа заданий теста:
,
(17)
где rhh – коэффициент корреляции эквивалентных половин теста.
При прочих равных условиях, чем больше заданий содержит тест, тем выше его надежность. Вполне оправданно ожидать, что чем обширнее выборка поведения, тем адекватнее и согласованнее получаемые единицы измерения.
Альтернативный метод вычисления надежности эквивалентных половин теста разработан Рюлоном:
,
(18)
где
-
дисперсия разностей
между
показателями каждого испытуемого по
обеим половинам теста,
-
дисперсия
показателей по полному тесту.
Любая разность между показателями испытуемого по двум половинам теста отражает постороннее влияние или дисперсию ошибок. Дисперсия таких разностей, поделенная на дисперсию показателей по всему тесту, дает долю дисперсии ошибок в этих показателях. Вычитая эту дисперсию ошибок из единицы, мы получаем долю «истинной» дисперсии для установленного применения теста, которая равна его коэффициенту надежности.
3.2. Надежность совокупности тестовых заданий. Этот метод определения надежности, также использующий однократное предъявление единственной формы теста, основан на оценке согласованности ответов по всем заданиям теста. На эту внутреннюю согласованность влияют два источника дисперсии ошибок: а) выборочная представленность содержания (как в случае надежности параллельных форм и эквивалентных половин теста); б) неоднородность содержания тестовых заданий. Чем однороднее задания, тем выше внутренняя согласованность. Например, если один тест включает только задания на умножение, а другой — на сложение, вычитание, умножение и деление, то первый тест, вероятно, покажет более высокую внутреннюю согласованность, чем второй. Во втором, более разнородном тесте один испытуемый может лучше справиться с вычитанием, чем с другими арифметическими действиями, другой покажет относительно высокий результат в делении, но хуже проявит себя в сложении, вычитании и умножении и т д.
Существует несколько способов оценки этой разновидности надежности-согласованности.
Коэффициент надежности Кьюдера – Ричардсона. Внутренняя согласованность находится по данным однократного проведения единственной формы теста, но вместо использования показателей по двум эквивалентным половинам теста эта методика опирается на результаты выполнения каждого задания. Из различных формул шире других применяется так называемая формула КR-20:
,
(19)
где rtt – коэффициент надежности полного теста, п – число заданий в тесте,
–
стандартное
отклонение суммарных показателей теста,
p
и
q
–
доля
испытуемых, соответственно справившихся
(р)
и
не справившихся (q)
с каждым
заданием.
Чтобы
вычислить
,
нужно
для каждого задания найти произведение
p
х q,
а
затем сложить эти произведения по
всем заданиям.
Коэффициент
альфа Кронбаха.
Формула
Кьюдера – Ричардсона применима лишь к
тем тестам, в которых выполнение
заданий оценивается по
принципу «А – не-А» (альтернативные
признаки),
т.е. «да» или «нет», «верно» или «не
верно».
В некоторых тестах, однако, практикуется
более дифференцированная
форма представления результатов заданий.
Например, в личностном
опроснике испытуемый может получить
различные числовые показатели по любому
конкретному
пункту опросника в зависимости от того,
на какой из готовых категорий ответов
он остановил свой выбор: например, «да»,
«пожалуй, да», «нечто среднее», «пожалуй,
нет», «нет». Для таких тестов была
выведена обобщенная формула, известная
как коэффициент альфа.
В этой формуле
заменена
на
-
сумму
дисперсий балльных оценок по каждому
заданию теста. Процедура вычислений
состоит в нахождении дисперсии всех
индивидуальных балльных оценок по
каждому заданию с последующим суммированием
этих дисперсий по всем заданиям.
Полная формула коэффициента альфа
выглядит следующим образом:
(20).
Кластерный анализ Горбатенко. Его суть состоит в применении математической процедуры «распознавания образа». Она позволяет «без учителя» выделять таксоны (кластеры), заpанее не задавая пpедполагаемое их количество и состав. Таксон включает в себя ряд тестовых заданий, которые фактически можно рассматривать как обладающие внутренним сходством, а значит, характеризующиеся надежностью-согласованностью.
Алгоритм данного метода предполагает:
а) составление «матрицы описания», которая характеризует конкретное состояние группируемых переменных (пунктов методики);
б) установление по определенным критериям численных значений связей (сходства) между всеми группируемыми переменными (пунктами методики) и построение «матрицы коэффициентов сходства»; в качестве меры «сходства» описаний i-го и j-го членов группы используется величина:
,
(21)
где
-
число совпадений выборов в i-ом и j-ом
столбцах,
-
число несовпадений выборов в i-ом и j-ом
столбцах,
-
суммарное число выборов в i-ом и j-ом
столбцах.
в) группировка переменных (пунктов) в таксоны и определение коэффициента плотности, характеризующего качество данной группировки; для того чтобы определить качество (плотность) полученных таксонов, используется мера D, которая вычисляется по формуле:
D=
,
(22)
где
-
число пунктов методики,
-
мера сходства между «центральным» и
наиболее «удаленным» (несходным с
центральным) пунктом.
г) в случае, если группировка производилась неоптимальным образом или качество группировки не удовлетворяет определенным критериям, производится перегруппировка переменных.
Для проведения расчетов используется специально разработанная компьютерная программа.
По методике (или каждой шкале многомерного теста) в программу дважды вводятся ответы всех испытуемых выборки по каждому заданию:
ответы по совпадению с ключом (значимым вариантам ответов), которые индексируются «1»;
ответы по несовпадению с ключом, которые индексируются «0».
По каждому способу обработки во внимание принимаются:
количество таксонов и «доминирующий» (по численности и плотности) из них;
не вошедшие ни в один таксон тестовые задания.
В окончательном варианте стимульного материала оставляют только те задания, которые входят в «главный» таксон каждого способа ввода данных (могут быть задания, которые одновременно входят в один и другой таксон).
