- •В.И. Звонников, м.Б. Челышкова Контроль качества обучения при аттестации: компетентностный подход Список сокращений
- •Введение
- •1. Качество результатов обучения и его оценка
- •1.1. Современные тенденции развития образования: императив качества
- •1.2. Основные подходы к трактовке качества образования в России и за рубежом
- •1.3. Зарубежный опыт реализации компетентностного подхода к оцениванию качества результатов обучения
- •1.4. Компетентностный подход и оценивание качества результатов обучения с позиций федеральных государственных образовательных стандартов нового поколения
- •1.5. Показатели качества образования
- •1.6. Системы менеджмента и оценки качества образования
- •1.7. Эвалюация в образовании
- •Практические задания и вопросы для обсуждения
- •2. Основы теории педагогических измерений
- •2.1. Понятийный аппарат теории педагогических измерений
- •2.2. Переменные и компоненты измерений в образовании. Надежность и валидность результатов измерения
- •2.3. Объективность педагогических измерений
- •2.4. Размерность пространства измерений
- •2.5. Уровни и шкалы измерений
- •2.6. Бипарадигмальная методология
- •Практические задания и вопросы для обсуждения
- •3. Основные подходы к разработке измерителей
- •3.1. Общие подходы к интерпретации результатов педагогических измерений
- •3.2. Нормативно-ориентированный подход и стандартизация тестов
- •3.3. Критериально-ориентированный подход
- •3.4. Задачи тестирования и виды тестов
- •3.5. Инновационные измерители в контексте компетентностного подхода
- •3.6. Основные этапы разработки аттестационных измерителей
- •Практические задания и вопросы для обсуждения
- •4. Аттестационные тесты. Их содержание, планирование, отбор и экспертиза
- •4.1. Целеполагание при планировании содержания педагогического теста
- •4.2. Планирование содержания теста
- •4.3. Общие принципы отбора содержания аттестационных тестов
- •4.4. Экспертиза качества содержания аттестационных тестов
- •Практические задания и вопросы для обсуждения
- •5. Формы тестовых заданий
- •5.1. Общие требования к заданиям тестов и классификация их форм
- •5.2. Задания с выбором одного или нескольких правильных ответов
- •Примеры заданий
- •5.3. Задания с конструируемым ответом
- •5.4. Задания на установление соответствия
- •5.5. Задания на установление правильной последовательности
- •5.6. Сравнительная характеристика форм тестовых заданий
- •1. Задания с двумя ответами
- •2. Задания с выбором из четырех-пяти ответов
- •3. Задания с конструируемыми регламентированными ответами
- •4. Задания со свободно конструируемыми ответами
- •5. Задания на соответствие
- •Практические задания и вопросы для обсуждения
- •6. Статистический анализ качества тестовых заданий и тестов
- •6.1. Классическая теория и методики конструирования тестов
- •6.2. Математико-статистический анализ качества тестов и тестовых заданий на основе классической теории тестов
- •6.3. Оценивание надежности и валидности педагогических тестов
- •6.4. Метод Кьюдера-Ричардсона для дихотомических оценок
- •6.5. Надежность и стандартная ошибка измерения
- •6.6. Валидность гомогенных тестов
- •Практические задания и вопросы для обсуждения
- •7. Сертификация аттестационных тестов
- •7.1. Общие сведения о системе сертификации педагогических тестов
- •7.2. Требования к качеству педагогических тестов
- •7.3. Требования к содержанию аттестационных тестов
- •7.4. Требования к статистическим характеристикам теста
- •7.5. Требования к характеристикам тестовых заданий компьютеризованного банка
- •7.6. Порядок сертификации тестов
- •Заключение
- •Словарь терминов
- •Список литературы
6.4. Метод Кьюдера-Ричардсона для дихотомических оценок
Метод Кьюдера-Ричардсона для оценки надежности также основан на однократном тестировании, но в отличие от предыдущего подхода не зависит от искусственных допущений о полной параллельности двух частей теста. Однако и он имеет свою ограниченную сферу применения, поскольку годится исключительно при использовании дихотомических оценок по результатам выполнения заданий гомогенных тестов.
Формула Кьюдера-Ричардсона (F. Kuder, M. Richardson-20, или KR-20) имеет вид [28, 36]
(6.10)
где р j – доля правильных ответов на j -е задание; q j — доля неправильных ответов, q j = 1 – р j ; S X 2 — дисперсия по распределению наблюдаемых баллов; n — число заданий теста.
Для исходной матрицы данных подсчитанная ранее исправленная дисперсия S X 2 = 6,89 , а доли правильных ответов получаются делением чисел R j в последней строке матрицы на 10. Тогда сумма произведений долей правильных и неправильных ответов будет 0,9 · 0,1 + 0,8 · 0,2 + 0,7 · 0,3 + 0,6 · 0,4 + 0,5 · 0,5+ 0,5 · 0,5 + 0,3 · 0,7 + 0,4 · 0,6 + 0,2 · 0,8 + 0,1 · 0,9 = 1,9 и коэффициент надежности
При оценке надежности нельзя полагаться лишь на один показатель, поскольку каждый из них имеет свои ограничения, смещающие оценки надежности теста в сторону завышения или занижения. Для достоверной проверки качества теста следует учитывать несколько показателей надежности, подсчитанных по разным формулам, лишь небольшая часть которых приведена в данном тексте. В качестве нижнего предела допустимых значений надежности обычно выбирают 0,7. При более низком значении использование теста вряд ли целесообразно в силу большой погрешности измерения.
Если тест разрабатывают профессионалы, то к нему предъявляют более жесткие требования. Как правило, тесты с надежностью менее 0,8 считаются непригодными в профессионально организованных службах и центрах тестирования. Значения коэффициента надежности, превышающие 0,9, говорят о высоком качестве теста. Они крайне желательны, но редко встречаются. Обычно в тестологической практике надежность тестов колеблется в интервале (0,8; 0,9). Коэффициент надежности, подсчитываемый по матрице тестовых результатов, всегда зависит от свойств выборки испытуемых. Поэтому при каждом очередном использовании теста приходится оценивать его надежность, а уж потом говорить о возможности интерпретации результатов выполнения теста.
6.5. Надежность и стандартная ошибка измерения
Один из аспектов применения коэффициента надежности связан с определением стандартной ошибки измерения. Для установления связи между стандартной ошибкой измерения и надежностью теста необходимо преобразовать формулу
и выделить в левой части S Е 2 . После преобразования формулы относительно S Е 2 получится выражение S Е 2 = S X 2 (1 – r н), или
где S X — стандартное отклонение по распределению индивидуальных баллов; r н – коэффициент надежности теста; S E — стандартная ошибка измерения. Это выражение обычно используется для вычисления S E по известным величинам r н и S X Что касается сущностного смысла, то S E (standard error of measurement) трактуется как стандартное отклонение результатов испытуемого от его истинного балла, полученное при выполнении им большого числа параллельных форм теста.
Для лучшего уяснения смысла показателя S E можно представить другую гипотетическую ситуацию, когда i -и испытуемый выполнял много раз один и тот же тест. Если предположить, что эффект запоминания отсутствует, то результаты тестирования образуют нормальное распределение вокруг истинного балла Т i со стандартным отклонением S E . На практике S E рассматривается как статистическая величина, отражающая степень точности отдельных измерений, поэтому величину S E используют для определения границ доверительного интервала, внутри которого должен находиться истинный балл оцениваемого ученика группы.
Построение доверительного интервала. Общераспространен подход, когда доверительный интервал выстраивается как две симметричные окрестности (левая и правая) вокруг наблюдаемого показателя ученика, хотя это не совсем верно, поскольку речь должна идти об окрестностях, расположенных слева и справа от истинного балла. Тем не менее этот факт вынуждено игнорируется в прикладных исследованиях в силу отсутствия истинного балла, и доверительный интервал при заданном риске допустить ошибку t =̣ 0,05, т.е. в пяти случаях из ста, принимается равным (X i – 1,96S E ; X i + 1,96S E ), где Χ i — наблюдаемый балл i -го испытуемого; 1,96 – константа, табличное число, используемое при t ≤ 0,05.
Для рассматриваемого ранее примера матрицы тестовых результатов (см. табл. 6.11), коэффициента надежности r н =̣ 0,78 и стандартного отклонения S X =̣ 2,62, вычисленного ранее для матрицы, S E будет равно
Тогда доверительный интервал для истинного балла первого ученика со значением Х i = 6 будет (6 – 1,23; 6 + 1,23) или (4,77; 7,23). Истинный балл первого ученика может находиться в любой точке этого интервала.
Интересна геометрическая интерпретация доверительного интервала на оси наблюдаемых баллов, приведенная для балла i -го учащегося. Очевидно, что с ростом S E границы доверительного интервала будут раздвигаться, и вместе с тем будут увеличиваться возможные пределы отклонения истинного балла от наблюдаемых результатов измерения (более правильная с точки зрения теории трактовка: пределы отклонения наблюдаемых баллов от истинной компоненты измерения).
