- •Лекція №5
- •Этапы стандартизации психодиагностической методики. Стандартизация условий проведения теста.
- •Стандартизация (нахождение нормативных показателей)
- •Знаходження середнього та стандартного відхилення
- •Перевод сырых значений в стандартные показатели
- •5. Встановлення надійності тесту
- •2. Надійність паралельних форм.
- •3. Надійність частин тесту (метод расщепления).
Перевод сырых значений в стандартные показатели
Чаще всего в руководствах к тому или иному тесту можно встретить выражения нормы не в виде сырых баллов, а в виде стандартных производных показателей. То есть нормы к данному тесту могут быть выражены в виде Т-баллов, децилей, процентилей, станайнов, стандартных IQ и др. Перевод сырых значений (первичных показателей) в стандартные (производные) делается для того, чтобы результаты, полученные по разным тестам, можно было сравнивать между собой.
Бурлачук, с. 168-169, Словарь-справочник, с. 235-236.
Для получения стандартных показателей, например, z-баллов, находят разность между первичной оценкой и средним для нормативной группы и делят ее на стандартное отклонение нормативной группы.
z=(Х-Х¯):σ
Полученная таким образом шкала z имеет среднюю точку М=0, отрицательные и положительные значения. Единица измерения в шкале равна 1 σ стандартного нормального распределения.
z-шкала
-
-4
-3
-2
-1
0
+1
+2
+3
+4
Поскольку для большинства измерений единицы этой шкалы слишком велики, их переводят в другие баллы. z-показатели можно легко перевести в Т-баллы (где среднее равно 50, а сигма – 10). Для этого существуют специальные таблицы, например, в Словаре-справочнике Бурлачука, Морозова, с. 314.
Например, в методике СМИЛ Собчик (адаптированный тест ММРІ) количество ответов по разным шкалам не одинаково и поэтому сравнивать между собой сырые баллы не имеет смысла. Авторы переводят их в стандартизированные единицы – Т-баллы при помощи профильного листа. Более точный результат можно получить, используя формулу:
Т = 50 + 10(Х – М):σ, где 50 – это линия нормы, от которой ведется отсчет показателей как вверх (повышенные), так и вниз (пониженные).
Х – это полученный результат по шкале (сырой балл), М – среднее для каждой шкалы, σ – стандартное отклонение для каждой шкалы.
Авторы выделили узкий коридор нормы от 46-55Т, коридор нормы от 30 до 70Т, показатели свыше 75Т свидетельствуют о нарушенной адаптации и об отклонении состояния индивида от нормального. Если вспомнить нормальное распределение, 50 – это эмпирически выявленная усредненная норма, отклонение в пределах 2 σ (двух среднеквадратических отклонений), а именно 20Т вверх – получаем 70Т, вниз – получаем 30Т, то есть пределы нормы.
Всем знакомы тесты интеллекта, в которых уровень IQ измеряется в 100-бальной шкале. Там среднее равно 100, стандартное отклонение 16. При помощи этих преобразований достаточно просто привести данные, полученный по разным тестам, к единой шкале и сравнить, например, Равенна и Амтхауера.
В методике Р.Кеттелла используется шкала стенов (от 1 до 10 со средним 5,5).
5. Встановлення надійності тесту
Термін “надійність” має два основних значення. По-перше, тест вважається надійним, коли він внутрішньо узгоджений. По-друге, якщо з його допомогою отримуються одні й ті самі результати для кожного досліджуваного при повторному тестуванні.
О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:
При повторном применении метода к тем же самым испытуемым в одних и тех же условиях через определенный интервал времени результаты обоих тестирований существенно не различаются между собой.
Действия случайных посторонних факторов не оказывают существенного влияния на результаты тестирования. В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, температура, освещенность помещения и др. Такие посторонние случайные факторы еще называют факторами нестабильности измерительной процедуры.
При повторном применении метода к тем же самым испытуемым через определенный интервал времени в измененных условиях результаты обоих тестирований существенно не различаются между собой. Под измененными имеется в виду следующие условия: другой экспериментатор, состояние респондента и др.
Звичайно встановлюються наступні показники надійності:
надійність ретестова;
надійність паралельних форм;
надійність частин тесту.
1. Надійність ретестова – характеристика, що отримується шляхом повторного обстеження досліджуваних одним й тим самим тестом. Для обчислення ретестової надійності знаходиться коефіцієнт кореляції між результатами першого та другого тестування. Обчислення коефіцієнта кореляції “вручну” доступно описано в підручнику Л.Ф.Бурлачука, С.М.Морозова (Словарь-справочник по психодиагностике, СПб: Питер, 2000, ст.140-141). Статистичну значимість коефіцієнта кореляції обчислюємо за допомогою критерія Стьюдента (там же).
При використанні комп`ютерної програми хід роботи наступний: 1) обрахунок кількості балів по шкалі, набраних кожним досліджуваним в результаті першого та другого тестування (окремо); 2) введення результатів першого та другого тестування для кожного досліджуваного в таблицю (рядки таблиці – досліджувані, колонки: а1 – перше тестування, а2 – друге); 3) в основному меню вибрати Statistics / Correlate / Bivariate. В новому вікні перенести з лівого списку в правий ті змінні, між якими ми хочемо знайти кореляцію (а1, а2) 4) натиснути ОК. На екран виведеться матриця інтеркореляцій, де рядки та стовпчики – вказані змінні, а на їх перетині: коефіцієнт кореляції, обсяг вибірки та рівень статистичної значимості (р). Між змінними існує зв`язок, якщо значимість коефіцієнта кореляції менша за 0,05. Тобто, чим менше р, тим більш значимим є зв`язок і вищою є ретестова надійність.
ТЕСТ
ИНТЕРВАЛ
РЕТЕСТ
Временной интервал зависит от возраста (например, у маленьких детей изменения могут произойти в течение одного месяца), а также событий, происходящих с испытуемым в жизни. Повторне тестування повинно відбутися через деякий період часу: від одного місяця до півроку, а деяких випадках значно більше. Якщо термін менший за місяць, досліджуваний може пам`ятати результати першого тестування і відтворювати свої попередні відповіді. Як наслідок, кореляція буде завищеною.
Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также может свидетельствовать о ненадежности теста.
Как и любая другая статистическая величина, стандартная погрешность коэффициента корреляции связана с объемом выборки, на которой она была получена. Понятно, что лучше использовать большие выборки, чтобы минимизировать погрешность такого рода. Считается, что желательный минимум объема выборки – 200 человек. Также она должна быть репрезентативной.
