
х проБрун Ирина, Вальдман Алёна, Пономарева Алёна
Анализ теста по математике в рамках классической теории тестирования
Данный тест по математике состоит из 26 вопросов, разделенных на 3 части: А, В и С (10, 11 и 5 заданий в каждой части соответственно). Части А и В оценивались дихотомически, а часть С – политомически (от 0 до 4). Тест выполнили 1339 учеников. Максимальный балл по тесту составил 36 баллов (из 41 возможного), а минимальный 0 баллов (набрали по 2 человека). Средний балл за тест - 13,96. Средний балл по части А - 8,23 (из 10), по В - 4,39 (из 11), по С - 1,34 (из 20).
50% выборки (примерно 670 человек) набрали меньше 13 баллов. Разброс баллов достаточно большой, подтверждает это не только размах (36 баллов), но и достаточно большое значение стандартного отклонения (6,09). С вероятностью в 95% можно утверждать, что средний балл будет находиться в пределах от 2,02; 25,90. (рис.1. и таблица 1).
Таблица 1 Описательная статистика теста
Статистика |
Значение |
Среднее |
13,96 |
Медиана |
13 |
Стд. Отклонение |
6,09 |
Асимметрия |
0,40 |
Стд. ошибка асимметрии |
,07 |
Эксцесс |
0,02 |
Стд. ошибка эксцесса |
,13 |
Размах |
36 |
Минимум |
0 |
Максимум |
36 |
Рис.1. Распределение общего балла за тест
Коэффициент асимметрии положительный и равен 0,4 (распределение смещено вправо, а вершина распределения - влево), то есть большая часть тестируемых получает высокие оценки (характерно для облегченных тестов). Эксцесс - положительный (0,02), что говорит об островершинном распределении (однако значение данного коэффициента мало).
Исходя
из того, что значения коэффициента
асимметрии и эксцесса при нормальном
распределении должны находится в
пределах
(где λ
вычисляется
по функции Лапласа на определенном
уровне значимости), при уровне значимости
0,05 (соответствующее значении λ
равно
2,25), получаем, что значение коэффициента
асимметрии выходит за допустимые пределы
(
< 0,16), а значение коэффициента эксцесса
лежит в необходимых для нормального
распределения границах (|0,02| <0,29). В
связи с тем, что 2 условия не выполняются
одновременно, распределение нельзя
считать нормальным.
Надежность теста
Коэффициент надежности теста составил 0,88 (коэф-т Alpha), что говорит о том, что внутренняя согласованность теста достаточно высокая (SEM= 2,08). Данное значение подтверждается значением корреляции между половинами теста при расщеплении пополам по четным/нечетным вопросам (0,81), а также скорректированным коэффициентом корреляции по формуле Спирмена – Брауна (0,90).
Корреляция заданий теста между собой варьируется от 0,03 до 0,5. Отрицательных корреляций между заданиями теста не было обнаружено, однако ряд коэффициентов корреляции (7 коэффициентов) на уровне значимости 0,05 оказались не значимы (таблица 2).
Таблица 2 - Парные коэффициенты корреляции между вопросами
|
№1 |
№2 |
№3 |
№4 |
№5 |
№6 |
№7 |
№8 |
№9 |
№24 |
,12** |
,05 |
,12** |
,2** |
,09** |
,17** |
,18** |
,15** |
,13** |
№25 |
,06* |
,03 |
,06* |
,12** |
,04 |
,08** |
,07* |
,04 |
,06* |
№26 |
,07** |
,03 |
,07* |
,11** |
,04 |
,09** |
,08** |
,06* |
,05 |
**. Значимая корреляция на уровне значимости 0,01 (2-стороняя значимость)
*. Значимая корреляция на уровне значимости 0,05 (2-стороняя значимость)
- желтым выделены не значимые корреляции, голубым - значения коэффициента корреляции < 0,1.
Таким образом, задания 25 и 26 части С очень слабо или совсем не коррелируют со многими заданиями части А, что говорит о том, что задания части С измеряют другую латентную переменную. Возможно задания части С были направлены на выявление учеников с особенными знаниями или способностями к математике (например, это задания олимпиадного уровня). Задания части С будут рассмотрены далее подробней.
Мы с Алёнко по скайпу сошлись таком варианте, если что-то не так – можно получше формулировку поискать.