Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры к экзамену Психодиагностика.docx
Скачиваний:
181
Добавлен:
06.06.2015
Размер:
173.91 Кб
Скачать

18. Поведение диагноста, его взаимодействие с тестируемым как важнейший фактор объективности диагностического обследования.

В целом дети более восприимчивы к влиянию экспериментатора и ситуационным изменениям, чем взрослые; при исследовании дошкольников роль экспериментатора особенно важна. Эмоционально неуравновешенные и неуверенные в себе люди, по-видимому, в любом возрасте также более подвержены влиянию побочных факторов. Имеются данные, свидетельствующие о том, что результаты тестирования могут систематически меняться в зависимости от экспериментатора. Разница в результатах может быть связана с личностными особенностями экспериментатора, такими, как его возраст, пол, раса, профессиональный или социоэкономический статус, опытность, черты характера и внешний вид. Однако исследования действия этих особенностей экспериментатора дали обманчивые или неубедительные результаты, поскольку в них не сумели отделить влияние того или иного качества экспериментатора и особенности испытуемого,а значит, влияние двух или более факторов могло смешиваться. Поведение экспериментатора до и во время тестирования также, вероятно, влияет на тестовые результаты. Например, проверочные исследования показали, что выполнение теста интеллекта значимо различается в зависимости от того, установились ли между экспериментатором и испытуемым теплые или прохладные отношения, держал ли себя экспериментатор напряженно и отчужденно или, напротив, естественно и непринужденно. Более того, вероятно, существует зависимость между особенностями экспериментатора и испытуемого, в том смысле, что одни и те же качества экспериментатора или его манера поведения могут по-разному влиять на разных испытуемых в зависимости от индивидуальных особенностей последних. Еще один способ, которым экспериментатор может непреднамеренно повлиять на ответ испытуемого, связан с тем, чего сам он ждет от теста.

  1. Проверка надежности теста, виды: ретестовая, параллельных форм, внутренняя согласованность. Способы повышения надежности теста.

Надежность – это устойчивость теста к действию различных помех

Если при повторном измерении результаты те же, то тест надежен.

Оценка надежности заключается в определении устойчивости теста к действию различных помех.

Условия оценки:

- проведение двух вариантов теста в разных условиях.

- сравнение показателей одного и того же теста в разных условиях.

Виды надежности:

  1. Ретестовая надежность (повтор).

  2. Надежность по внутренней согласованности заданий.

  3. Надежность оценщика.

  4. Надежность параллельных форм.

  5. Надежность, в которой оцениваются вариации других условиях тестирования.

Виды надежности зависят от факторов, которые варьируются.

  1. Ретестовая надежность. Фактор времени – сравниваются результаты тестирования на одной группе людей через какой-то промежуток времени. Если тест устойчив к изменению преходящих факторов, то результаты будут устойчивы.

  2. Надежность по внутренней согласованности заданий. Фактор по согласованности – насколько отдельные задания теста реагируют на помехи. Внутри теста получаем ли мы устойчивость в ответах.

  3. Надежность оценщика. Этот вид связан с анализом тестовых заданий и их обработкой. Надежность оценщика включается тогда, когда процедура обработки не стандартизированная, не унифицированная, недостаточно четко описаны тесты (например, проективные тестовые методики) и возможна субъективная обработка, а нужно единообразие обработки ответов.

  4. Надежность параллельных форм. Оценивает, в какой степени две формы могут быть взаимозаменяемыми, эквивалентными. Для многих тестовых методик есть параллельная форма – это тест с таким же объемом, с оценкой тех же качеств, с такой же надежностью, с одним содержанием и весом, только формулировки разные (это один и тот же тест, и в описании методики руководства есть указание на то, что есть форма А и форма Б – все приличные опросники имеют параллельные формы). Для чего нам разные тесты, направленные на измерение одного и того же? Чтобы померить динамику качества, когда мы проводим измерения перед обучением и после обучения, т.к. возможна научаемость одному тесту, и надо дать параллельную форму, которая измерит то же самое.

  5. Надежность, в которой оцениваются вариации других условиях тестирования. Надежность, в которой оцениваются вариации других условий тестирования. На результаты выполнения тестовой методики могут повлиять множество факторов. Данные факторы редко учитываются на практике в силу трудоемкости (например, факторы, связанные с характеристиками диагноста – пол, возраст, личностные особенности, условиями тестирования, состоянием участников тестирования и т.д.).

Надежность – это первая процедура психометрической оценки теста, необходимая, но недостаточная.

Рассмотрим виды надежности отдельно.

Ретестовая надежность

Ретестовая надежность – временная стабильность, коэффициент устойчивости. Она проверяет, в какой степени оценки остаются более или менее постоянными в течение времени.

Высокая надежность нам обещает: если тест дает разные результаты у одного и того же человека – значит, изменился сам человек. Нам надо, чтобы наш измерительный инструмент давал точные замеры.

Но есть характеристики устойчивые, а есть – неустойчивые во времени. Устойчивые – интеллект, характер и темперамент у взрослых. Неустойчивые – эмоциональные состояния, возраст. И мы должны понимать это характеристика устойчивая или нет.

Для исследования ретестовой надежности мы проводим 2 последовательных тестирования на одной и той же группе людей через какой-то промежуток времени.

Исходные допущения для ретестовой надежности (что мы должны понимать, принимать):

  • Измеряемая переменная константна во времени (результаты должны быть одинаковыми при ретестовой надежности – интеллект, а внимание – динамическая, изменяемая характеристика).

  • Первое и второе тестирование должны быть идентичны в плане мотивационной установки испытуемого (иначе, например, дома на диване я дам одни ответы, а в ситуации оценки – другие).

Способ оценки ретестовой надежности – корреляция первого и второго результата тестирования (это может быть коэффициент корреляции Спирмена или Пирсона – в зависимости от шкалы тестирования).

Диапазон для ретестовой надежности – коэффициент корреляции менее 0,7 по модулю считается неудовлетворительным, а выше – надежные показатели.

Интервал ретеста (промежуток между тестированиями) – от двух недель до полугода. Многое зависит от того, что за характеристика, с какой целью мы проводим тестирование. При коротком интервале – есть опасность, что участник тестирования просто воспроизводит ответы по памяти. При длинном интервале – есть вероятность, что участник действительно сам изменился. Например, для детей полгода – слишком большой интервал времени, т.к. они меняются очень быстро.

Надежность по внутренней согласованности заданий

Может быть двух видов:

  1. Надежность частей теста.

  2. Надежность отдельных пунктов теста.

Бывает, что отдельное задание теста выбивается из процедуры и не коррелируют с другими вопросами.

Для личностных опросников – это нормально, когда шкалы не коррелируют, т.к. вопросы для каждого измерения каждой шкалы могут рассматриваться как отдельные тесты.

Но внутри шкалы задания должны согласовываться.

Исходные допущения для надежности по внутренней согласованности:

  • Если задания измеряют что-то одно, то между ними будет положительная корреляция.

  • Если задания измеряют что-то одно, то вариативная дисперсия ответов (разброс показателей внутри выборки) не должна быть сильно большой (не больше трех стандартных отклонений сигма).

Как проводится оценка этой надежности по внутренней согласованности?

Тест случайным образом делится на 2 части, и определяется корреляция суммарного балла по обеим частям. Если задания одинаковой сложности, то можно просто поделить пополам или случайным образом. Если задания расположены по нарастающей сложности, то лучше взять четные и нечетные вопросы. Количество заданий в каждой части должно быть одинаковым, но задания могут быть разной степени сложности, и надо, чтобы в задания попали задания равной сложности.

Надежность по внутренней согласованности отдельных заданий рассчитывается при помощи формул альфа-Кронбаха – мы смотрим, как каждое задание теста коррелирует с общим баллом.

Если задания гомогенны (однородны), то проблем с надежностью по внутренней согласованности не возникает.

Для типологических опросников, проективных методов данный показатель авльфа-Кронбаха не должен быть высоким (нет требований к высокой согласованности), т.к. эти методики дают целостную и разностороннюю характеристику. Показатель может быть не выше 0,6 по модулю или может вообще не приниматься во внимание (например, если задания неоднородны, шкалы не связаны между собой).

Для типологических опросников альфа-Кронбаха необходимо считать отдельно для каждой шкалы.

Надежность оценщика

Показывает, насколько устойчив тест к ошибкам в процессе обработки.

Исходные допущения:

  • Мы предполагаем, что оценщики действуют строго в соответствии с руководством к тесту.

  • Связаны с проверкой и обработкой результатов (может оказаться, что повлиял личный контакт), поэтому важно, чтобы один проводил тестирование и другой обрабатывал протоколы. Оценщикам вслепую предъявляют протоколы (без фамилий), а они пишут заключения. Исключается прямой контакт с испытуемым.

Способ оценки – считаются парные корреляции разных оценщиков.

Надежность параллельных форм

Проведение двух эквивалентных форм теста дает экспериментатору информацию о том, насколько близки по существу две различные формы теста.

Способ оценки:

Рассчитывается коэффициент корреляции между показателями одной и другой формами теста, результаты которых получены при двух отдельных процедурах тестирования через какой-то временной интервал.

Хороший показатель – 0,7 по модулю и выше.

Резюме: надежность – это первый показатель тестового инструмента, который мы смотрим. Если к нам попал в руки тест, надежность которого неизвестна, то мы ему, скорее всего, не доверяем.

  1. Проверка валидности теста, виды: содержательная, критериальная, текущая, прогностическая, конкурентная, конструктная.

Валидность – это понятие, относящееся к тому, что именно измеряет тест и насколько хорошо он это делает.

Надежность – это когда мы устойчиво воспроизводим один и тот же результат. А валидность – это попадание в цель, это точность измерения выбранного показателя.

Валидность – метафорически – это точность стрельбы (попадание в яблочко).

Надежность – метафорически – это кучность стрельбы (попадание из раза в раз в одно и то же место мишени).

Если валидность высокая, а надежность – низкая: мы измеряем то самое, но результаты у одного и того же человека каждый раз разные.

Если надежность – высокая, а валидность (валидность по содержанию) – низкая: человек воспроизводит одинаковые ответы, но тест измеряет на самом деле не то, что в нем указано (например, не женственность, а что-то другое).

Опишем виды валидности

Валидность по содержанию – определяется через подтверждение того, что задания теста отражают все аспекты изучаемой области поведения. Для определения содержательной валидности подбираются эксперты, которые указывают, какая область поведения наиболее важна для исследования данной характеристики (подбор методик, тестовых заданий).

//Дембо-Рубинштейн Методика исследования самооценки – хорошая методика, но проективная.

Конструктная валидность – демонстрируется полным, насколько это возможно, описанием переменной, для измерения которой предназначен тест.

Это наиболее тонкий и наиболее сложный аспект теста.

Как оценивать – можно оценить с помощью корреляционного анализа, корреляцию показателя с внешними критериями.

Кроме того, используется факторный анализ для определения этого вида валидности.

В рамках конструктной валидности рассчитывается конвергентная и дивергентная валидности.

Конвергентная валидность (это когда понимаем, что исследуемое свойство точно предполагает такое-то свойство и точно исключает такое-то свойство) – состоит в том, чтобы проверить, связаны ли ли тестовые оценки с другими показателями, как ожидается (например, уверенность в себе должна коррелировать с высокой самооценкой).

Дивергентная валидность устанавливает, что тест не измеряет другие черты, с которыми он, теоретически, не должен быть связан (например, уверенность в себе не должна коррелировать с агрессивностью).

Конкурентная валидность – оценивается по корреляции разработанного теста с другими тестовыми методиками, валидность которых относительно измеряемого параметра уже установлена.

Также отражает способность теста дифференцировать испытуемых по измеряемому признаку. Определяется при помощи метода контрастных групп.

Текущая критериальная валидность – характеризуется тем, что значение критерия и значения теста получаются практически в одно время с очень небольшим интервалом. Например, мы одновременно изучаем успеваемость учащихся и измеряем их способности.

Прогностическая валидность – на основании некоторых результатов тестирования можно предвидеть какие-либо результаты или какое-либо поведение. Сначала проводится тестирование, а затем через какое-то время замеряют критерий.

Смысл прогностической валидности в отличие от текущей: в какой степени показатель по данной методике способен предсказывать результаты.

Критериальная валидность – основана на том, что результаты теста сопоставляются с показателями по критерию, который измеряет то же самое. Например, сопоставляем успешность как показатель теста и успешность в жизни, уровень интеллекта и успеваемость.

Значения независимого критерия могут быть:

  1. Номинальными (есть – нет, принадлежит группе – не принадлежит, алкоголик – не алкоголик).

  2. Метрическими (выраженными в балльной системе).

Внешний критерий должен быть близким к измеряемому свойству.

Критерий может быть положительным и отрицательным, с которым должна быть отрицательная корреляция. Например, «черствый столб» и «любовь» – не должны коррелировать.

Критериальная валидность оценивается п помощи корреляции и при помощи контрастных групп.

  1. Стандартизация, определение. Общее представление о стандартизации.

Стандартизация – это единообразие процедуры проведения и оценки выполнения теста.

Два подхода к стандартизации:

  1. Выработка единых требований к процедуре тестирования.

  2. Определение единого критерия оценки результатов диагностических испытаний – определение точки отсчета и единиц измерения.

Стандартизации подвергается:

  1. Сама инструкция.

  2. Стимульный материал.

  3. Стандартизация поведения психолога во время проведения тестирования.

  4. Указывается, можно ли использовать тест для групповой диагностики и как это делается.

  5. Рабочее место, положение диагноста.

  6. Стандартизация процедуры обработки данных (должен быть один общий алгоритм, ключи и пр.; для стандартизированных методик проблем не возникает, а для проективных методик – возникает).

  7. Стандартизация правил интерпретации данных.

Стандартизация позволяет осуществить сравнение показателя некоторого испытуемого с таковыми в генеральной совокупности или других релевантных групп (имеющих отношение к делу), что в итоге дает возможность адекватной интерпретации полученного показателя.

В рамках научных исследований при использовании психологических тестов мы не опираемся на нормы (они для нас не столь важны), а в большей степени изучаем сырые баллы.

  1. Стандартизация выборки.

При формировании выборки важно учитывать 2 переменные:

  1. Объем.

  2. Репрезентативность – выборка должна повторять генеральную совокупность так, как ложка супа повторяет кастрюлю супа: там должно быть и мясо, и бульон, и картошечка.

Для простого уменьшения стандартной погрешности адекватной будет выборка из пятиста испытуемых. Однако репрезентативность выборки не зависит от ее объема.

Пот получении нормы для общей популяции (например, все мужчины, все женщины, все дети 5 лет, все студенты) – необходимо протестировать 10 000 испытуемых.

При формировании выборки необходимо учитывать таким параметры как объем и соответствующая стратификация при отборе (от «страта» – слой группы, для страты достаточно 300 человек).

  1. Общие правила получения норм для генеральной популяции.

Правила получения норм для генеральной популяции (совокупности):

  1. Выборка должна быть стратифицирована. Обычно адекватной является стратификация на 4 уровня (например, пол, возраст, социальное положение, 4 переменная обычно имеет отношение к измеряемой переменной).

  2. В каждой подгруппе должно быть количество испытуемых, достаточное, чтобы сформировать адекватную выборку (как минимум, около 300 человек в каждой подгруппе – 300 мужчин, 300 женщин и пр.). Если нормы есть, то можем их использовать, но важно узнать, на какой выборке разрабатывались нормы, и можно ли переносить результаты исследования.

По причине того, что не всегда удается сформировать выборку, соответствующую характеристикам генеральной совокупности, разработчики тестов указывают более специфичные нормы для групп, специально соответствующих характеру и практическому применению теста. Можно ли переносить результаты тестирования учителей на других людей? Можно, но осторожно.

  1. Формирование выборок для специфических групп.

Для получения адекватных норм для специфических групп необходимо стратифицировать выборку по основной переменной, влияющей на эти группы. На нескольких примерах будет показано, как это делается в целом, хотя для выбора стратифицирующих переменных необходимы значительные исследования конкретной группы.  УЧАЩИЕСЯ ШЕСТЫХ КЛАССОВ  Чтобы получить соответствующую выборку для учащихся шестых классов, необходимо обеспечить ее адекватность. Так, основанием для формирования выборки может быть подбор всех учащихся из шестых классов. Для школ некоторыми основными стратифицирующими переменными являются: (1) Финансирование: публичная, частная, специализированная, государственная школы. (Выяснено, что это разделение на категории можно отбросить, но нашей целью является показать на примере формирование выборок для получения норм). (2) Пол: мальчики, девочки, смешанная группа. (3) Географическое размещение: центр города, поселок, сельская местность. (4) Статус школы в системе образования: начальная, общеобразовательная, колледж с шестилетним сроком обучения. Будет трудно отобрать выборку, точно сбалансированную по всем переменным (поскольку в центре города мало публичных школ), но, тем не менее, выборка, отражающая пропорции каждой из школ в общей популяции, даже если было по две школы на категорию, должна была бы дать адекватные нормы. Автор настоящей книги при разработке теста Ai3Q (Kline, 1971) использовал такую выборку учащихся шестых классов школ севера Англии, в которой оказалось по 1000 мальчиков и 1000 девочек из двадцати восьми школ. Даже для такого исследования понадобились большие ресурсы. Стоит отметить, что мы были не в состоянии обеспечить какие-либо другие нормативные группы. Ресурсы времени, денег и персонала были недостаточными.  ПРИМЕР: ОПРОСНИК МАЙЕРС-БРИГГС (МВТ1) - СПЕЦИФИЧЕСКИЕ НОРМЫ Myers-Briggs Type Indicator (МВТ1) (Myers-Briggs, 1962), разработанный для классификации испытуемых по типологии К. Г. Юнга, имеет обширные нормативные группы, некоторые из которых удовлетворяют строгим критериям адекватной нормализации; строгим, потому что на основании этих норм осуществляется имеющая решающее значение интерпретация. Например, существует выборка Реппа: соответствующим образом сформированная выборка из учащихся одиннадцатого и двенадцатого классов - 3503 мальчика и 2511 девочек из двадцати семи школ. Это может составить надежную нормативную группу. Аналогично этому, есть также выборка из 4562 студентов гуманитарных и естественно-научных факультетов восьми университетов, имевших среди университетов высокий рейтинг по уровню подготовки абитуриентов. Для таких студентов это опять превосходная выборка. Нет никакого сомнения, что эти две выборки обеспечивают хорошую основу для норм. С другой стороны, три выборки из творческих, менее творческих и наименее творческих архитекторов (объемом 40, 43 и 41 испытуемый, соответственно) вряд ли могут быть адекватными для чего-либо. Аналогично, выборка из одаренных детей - тридцать четыре мальчика и двадцать пять девочек - слишком мала, чтобы быть полезной.  Тест Майерс-Бригге - это свидетельство того, что эффективные нормы могут быть получены. На этом примере также явно видно, насколько это трудно, и что обычно исследователи имеют дело с менее, чем удовлетворительными данными.  Правила формирования выборок для специальных групп  (1) Найдите наиболее важные переменные, релевантные для данных групп, и используйте их как основание для стратификации выборки.  (2) Подберите настолько большую выборку, насколько возможно: как минимум из 300 испытуемых.  (3) Помните, что маленькая выборка - это лучше, чем вообще ничего. Если использовались небольшие выборки, акцентируйте внимание пользователей теста, на том, чтобы они не использовали нормы, а если будут делать это - то с предельной осторожностью.  Уже написано достаточно, чтобы стало ясно, что при установлении норм нет никаких теоретических проблем. Наоборот, обычной трудностью является отсутствие ресурсов: времени, денег, испытуемых и помощников для проведения тестирования и обработки тестов.  Однако, если тест предназначен для практических целей профотбора и профориентации, то естественно, что его нормы должны удовлетворять высоким стандартам. Существенно важно использование стратифицированных и больших выборок. При условии, что у нас есть хорошие нормативные группы, мы должны теперь обратиться к следующей проблеме стандартизации: каким образом лучше представить результаты. 

  1. Нормализация показателей. Различные типы стандартных показателей.

Обычно показатели некоторого индивидуума сравниваются с показателями релевантной нормативной группы посредством некоторого преобразования, которая выявляет статус этого индивидуума относительно данной группы.

Нормализованные показатели показывают место испытуемого в выборке стандартизации: где человек по сравнению со всеми остальными.

Способы нормализации показателей:

  1. Перевод в процентили (важен диапазон, чтобы увидеть место испытуемого в нашем распределении).

    1. Ранг показателя в процентилях определяется процентным отношением в нормативной группе тех испытуемых, которые получили более низкий показатель.

    2. Недостаток вычисления процентилей – они не могут быть использованы для последующего статистического анализа (мы не можем сравнивать группу с группой) как в случае с более мощными статистическими показателями – т.к. процентили являются значениями порядковой шкалы, а не метрической.

  2. Расчет стандартных показателей. Типы стандартных показателей:

    1. Z-показатели – для таких показателей среднее значение – 0, стандартное отклонение – 1, максимум – от -3 до +3. Такие показатели также позволяют увидеть место испытуемого среди других.

      1. где х сред – средний показатель по выборке, сигма – стандартное отклонение.

Недостаток – нулевое значение может настораживать испытуемого.

    1. Преобразование z-показателей позволяет получить нормализованные стандартные показатели и это делается не только с целью ухода от нуля, и есть для каждой шкалы – нормы для всех..

      1. , где А – среднее значение преобразованного распределения, В – стандартное отклонение преобразованного распределения, Zt –преобразованное значение.

      2. Например, к преобразованным показателям относится шкала IQ, в шкале IQ – среднее (А) – 100, стандартное отклонение (В) – 15.

      3. Шкала стенов – среднее значение – 5,5, стандартное отклонение – 2.

      4. Шкала станайнов – среднее значение – 5, стандартное отклонение – 2.

      5. Шкала T-баллов – среднее значение – 50, стандартное отклонение – 20.

  1. Последовательность стандартизации психологической методики.

  1. Определяется генеральная совокупность, для которой предназначена методика.

  2. Формируется репрезентативная выборка.

  3. По результатам ответов испытуемых из выборки строится эмпирическое распределение (чтобы понять относится к нормальному или не относится).

  4. Общий принцип построения стандартных шкал: разбиение выборки на группы, про которые известно, какой процент испытуемых из выборки они включают (как качественные, так и количественные характеристики). Установление границ групп дает возможность отнести каждый индивидуальный результат в некоторую группу и точно установить, сколько процентов испытуемых имеют большую и меньшую степень выраженности психологического свойства по отношению к той группе, в которую попадает индивидуальный результат.

  5. Пересчет сырых оценок в стандартные осуществляется различными способами в зависимости от того, является ли эмпирическое распределение нормальным.

  6. Определяем, является ли полученное распределение нормальным при помощи статистических критериев, например, кривой Гауса или критерия Холмогорова-Смирнова.

  7. На нормальном распределении проводится стандартизация. Для этого вычисляем z-показатель, точку отсчета.

  8. Если распределение не относится к нормальному, то можем использовать процентильную стандартизацию.

  1. Различные ситуации использования теста.

  1. Ситуация применения. Тест кем-то разработан (возможно в других социокультурных условиях), известны тестовые нормы, полученные на представителях данной языковой культуры (несоответствие выборки стандартизации и выборки применения по половозрастной структуре и профессионально-культурным признакам признается несущественным). Например, внимание, память, но при интеллекте, темпераменте – с осторожностью.

  2. Ситуация адаптация. Тест кем-то разработан, проверены надежность и валидность, но отсутствуют тестовые нормы (как правило, отсутствуют вообще для всех представителей данной языковой культуры). Задача адаптации сводится к построению тестовых норм.

  3. Ситуация конструирования. Есть концепция психического свойства, но нет процедуры его измерения, удовлетворяющей требованиям места, времени, возможностям количественного анализа и ограничениям прочих ресурсов. Надо придумать измерительную процедуру, проверить ее надежность и валидность, построить тестовые нормы.

  1. Этапы эмпирико-статистической работы при адаптации многомерного переводного теста-опросника.

I этап. Анализ внутренней валидности, внутренней согласованности пунктов, из которых состоит тест-опросник.

II этап. Проверка устойчивости к перетестированию. Это необходимо при диагностике свойств, по отношению к которым ожидается инвариантность во времени. Анализ ретестовой надежности может быть совмещен с исследованием информативности отдельных пунктов тестов, а также и устойчивости отдельных пунктов. Без сведений о ретестовой надежности психолог не имеет права использовать тест для построения статистического экстраполирующего прогноза.

I II этап. Анализ корреляции с релевантным внешним критерием. Данный этап необходим, если тест разрабатывался изначально как критериально ориентированный, т.е. отбор пунктов производился на основании их корреляций с каким-то критерием валидности.

I V этап. Проверка или рестандартизация тестовых норм.

V этап. Проверка вопроизводимости структуры отношений между шкалами (речь идет о связях между шкалами и насколько воспроизводится первоначальная структура методики).

  1. Ситуация «внутрикультурного переноса» теста на новую популяцию.

Новая популяция в данном случае отличается от выборки стандартизации половозрастными или профессионально-культурными особенностями.

I этап. Проверить валидность методики в том случае, если методика чувствительна по своему содержанию к профессиональной или региональной специфике.

а) Необходимо выбрать по возможности максимально экономичную процедуру проверки валидности. Размер выборки – не менее 30 испытуемых.

б) Производится простейший анализ пунктов на предмет того, не оказались ли некоторые пункты явно неинформативными (все отвечают одинаково), бессмысленными, слишком прямыми, социально значимыми в данной ситуации.

в) на основании данного анализа неудачные пункты могут быть исключены.

II этап. Проверить соответствие тестовых норм. Только после получения позитивного результата при проверке валидности целесообразно расширять выборку и реконструировать эмпирическое распределение тестовых баллов.

  1. Децентрированный перевод.

Формы перевода:

  1. Симметричный, или децентрированный перевод (на другой язык), стремящийся сохранить как верный смысл, так и привычность и разговорность как в том, так и в другом языке.

  2. Ассиметричный, уницентрированный перевод, в котором доминирует верность одному из языков, обычно языку оригинала (хорош для перевода песен, преданий).

Цель симметричного перевода – сохранение смысла, культурный символ языка-оригинала переводится таким культурным символом другого языка, который вызывает ту же функциональную реакцию (предполагается культурная эмпатия).

Децентрация осуществляется с помощью обратного перевода. Процедура: после того, как исследователь подготовил опросник на своем самом что ни на есть доступном переводу языке, он сажает за работу двух переводчиков, из которых один переводит на местный язык половину, а другой – вторую половину. Затем каждый из них берется за половину, переведенную другим, и снова переводит ее на язык оригинала. Если верен обратный перевод, то оба переводчика заслуживают доверия.

  1. Этические проблемы психологического тестирования и психологической оценки. Общие этические принципы психодиагностического обследования.

Для того, чтобы предотвратить неправильное употребление психологических тестов, возникла необходимость в соблюдении некоторых предосторожностей как относительно самих тестов, так и их показателей. Проблемам распространения и использования психологических тестов посвящена большая часть <Этических норм психологов>-кодекса профессиональной этики, официально принятого Американской психологической ассоциацией. Принципы 13, 14 и 150 неразглашении результатов теста, интерпретации данных и его публикации относятся непосредственно к тестированию. Сфера действия принципов 6 (конфиденциальность), 7 (ненанесение ущерба) и 9 (беспристрастность) хотя достагочно широка, но во многом применима и к тестированию.

1992г – «этический кодекс психолога» в США.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]