Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

6.1. Понятие и виды измерительных шкал и другое

.docx
Скачиваний:
0
Добавлен:
14.01.2023
Размер:
114.76 Кб
Скачать

6.1. Понятие и виды измерительных шкал

В психодиагностике понятие «шкала» используется в широком и узком значении. В первом случае этим термином называется конкретная психометрическая методика (например, шкала Бине-Симона, шкала Векслера, шкала тре­вожности Тейлора, шкала мотивации одобрения Марлоу-Крауна), так что фактически ставится знак равенства между понятиями «шкала» и «методика», «тест».

Во втором случае речь идет об измерительной шкале как форме фиксации со­вокупности признаков изучаемого психического явления с упорядочиванием их в определенную числовую систему. Каждому элементу совокупности проявлений исследуемого явления соответствует определенный балл или шкальный индекс, количественно уста­навливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть. В основу разработки конкретной ПДМ (теста) закладывается определенный тип измерительной шкалы.

Выделяют следующие виды измерительных шкал: неметри­ческие (номинативные и порядковые шкалы) и метрические (интер­вальные шкалы и шкалы отношений).

Номинативные шкалы (шкалы наи­менований) устанавливают соответствие признака тому или иному классу. Объек­ты объединяют в классы на основании какого-либо общего свойства (классы эк­вивалентности) либо символа (обозна­чения). Не обязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь.

Одним из распространенных видов но­минативной шкалы является классифика­ция объектов на две группы по принципу «А – не-А» (альтернативные признаки в дихотомической шкале наименований). Большинство диагностических и исследовательских методик построено на основе этого типа измерительной шкалы.

Примерами использования та­кой шкалы являются оценивание ответа испытуемого на пункты тест-опросника или теста интеллекта в виде утверждения или отрицания, соответ­ствия или несоответствия полученного ответа «ключу» измеряемого свойства:

Вы склонны преувеличивать в своем воображении неприятные события, которые могли бы произойти?

а) да;

б) нет.

Можно понять людей, которые не прочь воспользоваться в своих интересах заблуждениями других.

а) да, это реалии жизни, которые надо принимать такими, какие они есть;

б) согласен, в этом для всех будет польза: для одних – достижение результата, а для других – урок на будущее;

в) нет, такое поведение вызывает у меня недоумение.

Найдите закономерность и продлите числовой ряд 3 5 9 17 ...

а) 25;

б) 33;

в) 35.

Вставьте пропущенное слово, выбрав из трех возможных слов.

фляга (альт) жесть

косяк (....) мираж

а) кора;

б) риск;

в) кожа.

Другой разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группи­руемых при сборе информации или ее об­работке:

Вы предпочитаете проводить досуг...

а) с товарищами и приятелями;

б) на лоне природы;

в) занимаясь спортом;

г) читая книгу;

д) у телевизора;

е) в кругу семьи.

В профессиональной деятельности для меня более всего важно:

а) зарплата;

б) интересная работа;

в) общение;

г) самостоятельность;

д) проявление своих возможностей;

е) внимательное отношение руководства.

При построении шкал наименований главными являются качественные различия, а потому числовые значения, используемые в качестве обозначений признаков изучаемого психического объекта (явления), не отражают количественных различий этих признаков.

Операции присвоения чисел признакам какого-то явления являются произвольной операцией. Поэтому классы признаков можно обозначать любыми символами – произвольными числами, буквами или другими знаками при условии, что каждый символ будет использован исключительно для обозначения одного класса признаков объекта (явления) и одновременно ни один класс признаков не будет обозначаться двумя или большим числом символов. Например, по каждому пункту тест-опросника при совпадении ответа испытуемого с значимым ответом по «ключу» начисляется одна условная единица («1»).

Особенности шкалы наименований накладывают определенные ограничения для использования методов математической статистики при обработке массива данных, полученных с помощью тех или иных методик, созданных на базе этой шкалы. Поскольку операции арифметического характера ограничены, то в качестве меры центральной тенденции используется мода. Модальный класс объектов определяют после подсчета абсолютных или относительных частот, т.е. встречаемости того или иного результата в каждом классе объектов. В качестве меры тесноты взаимосвязи между различными массивами измерений можно использовать коэффициент корреляции Пирсона. Однако если один из рядов пе­ременных представлен в шкале наименований, а другой – в любой иной (интервальной, отношений или по­рядковой), то применяется бисериальный коэффициен­т корреляции. Для оценки статистической значимости различий между частотами или модами используются непараметрические критерии (например, хи-квадрат).

Перемен­ные в дихотомической шкале могут рас­пределяться по нормальному закону или иначе. В последнем случае необходимо, используя процедуру нормализации, привести эмпирическое распределение к нормальному.

Порядковые шкалы предназначены для расчленения совокуп­ности признаков на элементы, связанные отношением «больше - меньше», и до­пускают отнесение переменных к груп­пам, упорядоченным (ранжированным) друг относительно друга и представляющим некоторое единство. При этом значения разностей между признаками не устанавливаются. Таким образом, порядковая шкала отображает монотонное возрастание или убывание признаков измеряемого свойства с помощью монотонно возрастающих или убывающих чисел.

Упорядочивание в порядковой шкале может быть униполярным и биполярным. В первом случае исходят из степени выраженности признаков измеряемого качества. Например, в тесте цветового выбора испытуемому предъявляется 8 цветных квадратов (в полном наборе – 73) на белом фоне, из которых он выбирает один наиболее понравившийся, приятный. Выбранный квадрат откладывается в сторону, затем процедура повторяется. В конечном счете образуется ранжированный ряд квадратов, в котором цвета располагаются по их привлекательности для обследуемого. В опроснике терминальных и инструментальных ценностей Рокича от испытуемого требуется проранжировать представленные наборы ценностей по мере убывания их личностной значимости. В модифицированном тесте прогрессивные матрицы Равенна каждый ответ включает три варианта, последовательно приближающиеся к правильному. В шкале реактивной и личностной тревожности по каждому пункту методики (например, «Меня волнуют неудачи») испытуемый должен выбрать один из четырех вариантов ответа: «Нет, это совсем не так» (1), «Пожалуй, так» (2), «Верно» (3), «Совершенно верно» (4).

В биполярной порядковой шкале в основе разделения признаков лежит ранг (числовое значение) степени приближения к одному из противоположных полюсов качества. Типичным примером этой шкалы может служить техника семантического дифференциала, созданная Ч. Осгудом. В первоначальном варианте какое-то заданное специалистом понятие (например, «Моя работа», «Моя группа») оценивается путем соотнесения с одной из фикси­рованных точек (+3, +2, +1, 0, -1, -2, -3) набора биполярных конструктов («хороший-плохой», «бодрый-вялый» и т.п.). В методике изучения межличностной идентичности в группе и подгруппах стимульный материал также построен на основе биполярной порядковой шкалы с применением 7-балльной шкалы Ликерта.

В шкале интервалов элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака. Иначе говоря, классы объектов всегда дискретны и упорядочены по степени возрастания или убывания измеряемого свойства. В этой шкале одинаковым разностям степени выраженности измеряемого свойства соответствуют равные разности между приписываемыми им числами. Шкалы интервалов имеют равные единицы измерения, однако способ их определения является произвольным, а значит, и сами единицы произвольны. В этих шкалах нулевая точка отсчета также устанавливается произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.

Шкалам интервалов присущи все те отношения, которые характерны для номинативных и порядковых шкал. Основными операциями с элементами интервальных шкал являются операции установления равенства, разности, сопоставление больше-меньше в отношении измеряемых свойств, а также утверждение равенства интервалов и равенства разностей между значениями одной шкалы.

Интервальные шкалы чаще применяются в процедуре стандартизации первичных тестовых показателей. К ним относятся следующие шкалы: IQ-показатель стандартный (шкалы измерения интеллекта Векслера), стены – стандартная десятка (16PF личностный опросник), стэнайны – стандартная девятка (Психодиагностический тест), Т-баллы (Миннесотский многоаспектный личностный опросник) и др.

В шкалах отношений числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано, так что в нулевой точке измеряемый признак полностью отсутствует. Следовательно шкалы отношений характеризуются тем, что в них: а) классы объектов разделены и упорядочены согласно измеряемому свойству: б) равным разностям между классами объектов соответствуют равные разности между приписываемыми им числами; в) числа, приравниваемые к классам объектов, пропорциональны степени выраженности измеряемого свойства (эта особенность не свойственна всем предыдущим шкалам).

В области психологии такие шкалы используются прежде всего в психофизике (например, шкала порогов абсолютной чув­ствительности анализатора). Основная их особенность заключается в том, что испытуемый сам оценивает количественные отношения между физическими раздражителями.

На уровне этих шкал допускаются все те операции, которые могут применяться к перечисленным выше шкалам, а также – операции установления равенства-неравен­ства отношений между отдельными значениями шкалы.

В заключение надо отметить, что в психодиагностике часто используется термин шкалирование, под которым подразумевается совокупность методических и математических приемов для упорядочивания исходных эмпири­ческих данных в шкальные, т.е. для измерения особенностей проявления психических явлений. Иначе можно сказать, что шкалирование – это приравнивание к измеряемому психическому явлению чисел по определенным правилам, так чтобы в отношениях чисел отображались отношения этого диагностируемого явления. Фактически понятие «шкалирование» является синонимом понятия «измерение».

6.2. Точность и ошибки измерения

Психодиагностическая методика рассматривается как обычная шкала для измерений, принятых в естественных науках. Каждая такая шкала характеризуется определённой точностью. Например, метровая линейка для измерения тканей, в которой деления расположены через каждые 5 мм, обладает невысокой точностью, и погрешность измерения лежит в пределах 5 мм. На обычной ученической линейке, на которую нанесены миллиметровые деления, точность значительно выше. Погрешность измерения такой линейкой лежит в пределах 1 мм. Существуют специальные измерительные устройства, которые образуют шкалы с очень маленькой погрешностью измерения. Например, микрометр, точность измерения которого будет очень высока, а погрешность будет лежать в пределах 1 микрона.

Можно ли применить понятие точности и погрешности измерения к ПДМ? В принципе можно. ПДМ принципиально ничем не отличается от обычной измерительной шкалы. Непонятно только другое. С чем можно сравнить точность ПДМ - с точностью микрометра или с точностью портняжного метра? Если для измерения всевозможных размеров имеется большое количество разнообразных измерительных приборов, образующих измерительные шкалы различной точности, то при измерении психических свойств пока существуют только ПДМ, точность которых не с чем сравнить.

В психодиагностической литературе точность измерения обычно рассматривается в контексте разброса (дисперсии) результатов произведенных с помощью методики измерений. В самом широком смысле точность измерения показывает, в какой сте­пени индивидуальные различия в тестовых показателях могут быть отнесены на счет «истинных» различий в изучаемых свойствах, а в какой могут быть приписаны слу­чайным ошибкам. Иначе говоря, надо определиться с тем, какую долю общей дисперсии (общей изменчивости) тестовых показа­телей составляет дисперсия ошибок. Это не «ошибки» в обычном смысле слова, пред­полагающем, что их можно было бы избежать или скорректировать путем усовершен­ствования методологии измерений.

Надо иметь в виду, что факторы, которые применительно к одним задачам можно было бы счесть источниками случайной вариации показателя (т.е. дисперсии ошибок), при решении других задач могут быть отнесены, и не без основания, к причинам его истин­ной дисперсии. Например, если бы нас интересовало измерение колебаний настрое­ния, то происходящие день ото дня изменения в показателях шкалы «радость - уны­ние» были бы релевантны цели данного теста и, следовательно, составляли бы часть истинной дисперсии показателей. С другой стороны, если бы тест предназначался для измерения более устойчивых характеристик личности, те же ежедневные колебания попали бы уже в разряд дисперсии ошибок.

В сущности, любое условие тестирования, которое не имеет отношения к цели теста, представляет собой источник дисперсии ошибок. Поэтому, стремясь к поддер­жанию единых условий тестирования (контролируя общую обстановку, временные ограничения, инструкции испытуемым и другие аналогичные факторы), пользователи тестов способствуют уменьшению дисперсии ошибок и повышению на­дежности тестовых показателей. Но и при оптимальных условиях тестирования ни один тест не является абсолютно надежным инструментом. Поэтому каждый тест сле­дует сопровождать сведениями о его надежности. Сообщаемая мера надежности ха­рактеризует тест только в случае его проведения в стандартных условиях и с людьми, имеющими сходство с теми, кто входил в состав нормативной выборки. Следователь­но, при описании теста нужно точно указывать и характеристики этой выборки, вме­сте с типом измеренной на ней надежности.

Стандартная ошибка измерения вычисляется по следующей формуле:

, (1)

где - стандартное отклонение показателей теста на выборке испытуемых, - коэффициент надежности.

Например, если стандартные показатели IQ конкретному тесту интеллекта имеют =15 и коэффициент надежности =0,89, то SEM в этом тесте будет составлять .

Эта мера особенно удобна для оценки индивидуальных показателей. Например, тестовый показатель испытуемого А составляет 110. Вследствие разного рода случайных ошибок показатели этого испытуемого могут варьироваться вокруг истинного показателя (110), подчиняясь нормальному распределению. Среднее это­го распределения ста показателей можно принять за «истинный показатель» для дан­ного использования теста, а стандартное отклонение — за соответствующую SEM. Как и любое стандартное отклонение, стандартную ошибку можно интерпретировать в единицах плотности нормального распределения. При нормальном распределении в интервал + попадает приблизительно 68 % всех случаев. Следовательно, имеется примерно 2 шанса против 1 (точнее, 68:32), что IQ испытуемого А по этому тесту будут колебаться в пределах ± 1 SEM или 5 единиц в обе стороны от его истинного IQ. Если его истинный IQ = 110, можно ожидать, что в 2/3 (68 %) случаев показанные им результаты попадут в интервал между 105 и 115.

Несмотря на то что в литературе описаны приёмы определения точности и погрешностей измерения ПДМ, надо сказать, что в подавляющем большинстве описаний той или иной ПДМ нет указаний на точность или погрешность измерений. (Иногда специалисты апеллируют к показателям оценки ретестовой надежности и надежности-согласованности методики как к критериям точности измерения.) Таким образом, определение точности ПДМ и погрешности её измерения скорее пожелание, а не практическая реальность.

6.3. Статистическая природа тестовых шкал

Психометрические методики основаны на статистическом подходе и предполагают использование методов математической статистики.

Так, при создании и применении психодиагностической методики часто используется статистический подход к пониманию нормы. С точки зрения данного подхода по любой диагностируемой психической характеристике считается, что нормальных людей большинство. Людей с более сильными и менее сильными проявлениями этой характеристики меньше; причем, чем сильнее отклонения от среднего проявления характеристики, тем меньше таких людей. Иными словами, статистическое понимание нормы предполагает, что при диагностике индивидов или групп действует закон нормального распределения. Теоретически для полного описания нормального распределения используются три переменные: среднее значение, стандартное отклонение, количество обследованных людей. Нормальность распределения оценивается, как правило, с помощью критерия Колмогорова – Смирнова, который считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному.

Кривая распределения тестовых баллов отражает диагностическую силу пунктов ПДМ. Если кривая имеет правостороннюю асимметрию (рис. 1а), то в тесте преобладают задания с высокой диагностической силой, а если кривая имеет левостороннюю асимметрию (рис. 1б) – с низкой диагностической силой.

Рис. 1 Асимметрия распределения

Например, если в тесте интеллекта большинство заданий являются трудными, так как с ними не справляются многие испытуемые, то будет иметь место правосторонняя асимметрия и, наоборот, преобладание легких заданий будет обуславливать левостороннюю асимметрию. В первом случае тест плохо дифференцирует испытуемых с низким уровнем интеллектуальных способностей, а во втором случае – с высоким уровнем способностей.

Если ПДМ содержит задания примерно одинаковой диагностической силы (именно такие задания разрабатываются для оценки характеристик индивида или группы), то нормальность распределения суммарных баллов возникает автоматически. При этом форма кривой распределения тестовых баллов не позволяет говорить о реальной форме распределения измеряемого свойства, каким оно является само по себе – в широкой популяции испытуемых. Нормальность распределения является прямым следствием направленного отбора пунктов с заданными свойствами.

Если подбираются пункты, тесно коррелирующие между собой, то в распределении баллов возникает отрицательный эксцесс (рис. 2а).

Рис. 2 Эксцесс распределения

Максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершин распределения – до образования двух вершин – двух мод (рис. 2б). Бимодальная конфигурация распределения баллов указывает на то, что выборка испытуемых разделилась на две категории (с плавными переходами между ними). Это значит, что в основе пунктов ПДМ лежит какой-то один общий для всех признак, соответствующий определенному свойству испытуемых. Если у испытуемых есть это свойство, то они выбирают один вариант ответа, если нет этого свойства – то другой вариант. Например, в тесте интеллекта одна часть испытуемых справилась с большинством заданий, другая – не справилась.

В некоторых тестах пункты с одинаковой направленностью могут отрицательно коррелировать друг с другом. В этом случае на кривой возникает положительный эксцесс (рис. 2в): вся совокупность испытуемых по тестовым баллам шкалы концентрируется вблизи среднего значения. Такое возможно в двух случаях: а) неверно составлен «ключ» - объединены при подсчете отрицательно связанные признаки; б) испытуемые применяют, разгадав предназначение методики, определенную стратегию искажения ответов – преднамеренно балансируют ответы «да» и «нет» одного из полюсов измеряемого с помощью методики качества.

Соответствие методики принятым требованиям также устанавливается путем применения математико-статистических процедур. Например, репрезентативность выборки, на которой создаётся и апробируется методика, может быть оценена посредством определения минимального объема выборки с помощью определения доверительного интервала для среднего значения. Надежность-согласованность методики может быть определена с помощью альфа-коэффициента Кронбаха, факторного или кластерного анализа, а ретестовая надежность – корреляционного анализа. Для оценки конвергентной или дискриминантной валидности часто используют корреляционный анализ.

Для оценки эффективности всей процедуры измерения соотносят размеры ошибки измерения с размерами разброса суммарных баллов, вызванных индивидуальными различиями в измеряемой характеристике между испытуемыми. В терминах статистики речь идет о сравнении так называемой «истинной» дисперсии распределения суммарных баллов с дисперсией ошибки.

Обработка результатов тестирования по многим методикам выражается в подсчете суммарного балла с помощью ключа, который устанавливает числовое значение исхода по каждому пункту. Например, за правильное решение задания в тесте интеллекта присваивается условная единица – «1», а за неправильное или пропуск – «0», так что балл буквально выражает количество правильных ответов. Далее, для постановки диагноза конкретному индивиду или группе используются рассчитанные на определенной выборке нормативные данные (среднее значение и стандартное отклонение) и выделенные на их основе статистические зоны проявления диагностируемой характеристики.

Надо отметить, что совер­шенствование математико-статистического аппарата, в свою оче­редь, влияет на конструирование новых диагностических технологий и тестов, решение задачи обеспечения их эффективности.