- •В.И. Звонников, м.Б. Челышкова Контроль качества обучения при аттестации: компетентностный подход Список сокращений
- •Введение
- •1. Качество результатов обучения и его оценка
- •1.1. Современные тенденции развития образования: императив качества
- •1.2. Основные подходы к трактовке качества образования в России и за рубежом
- •1.3. Зарубежный опыт реализации компетентностного подхода к оцениванию качества результатов обучения
- •1.4. Компетентностный подход и оценивание качества результатов обучения с позиций федеральных государственных образовательных стандартов нового поколения
- •1.5. Показатели качества образования
- •1.6. Системы менеджмента и оценки качества образования
- •1.7. Эвалюация в образовании
- •Практические задания и вопросы для обсуждения
- •2. Основы теории педагогических измерений
- •2.1. Понятийный аппарат теории педагогических измерений
- •2.2. Переменные и компоненты измерений в образовании. Надежность и валидность результатов измерения
- •2.3. Объективность педагогических измерений
- •2.4. Размерность пространства измерений
- •2.5. Уровни и шкалы измерений
- •2.6. Бипарадигмальная методология
- •Практические задания и вопросы для обсуждения
- •3. Основные подходы к разработке измерителей
- •3.1. Общие подходы к интерпретации результатов педагогических измерений
- •3.2. Нормативно-ориентированный подход и стандартизация тестов
- •3.3. Критериально-ориентированный подход
- •3.4. Задачи тестирования и виды тестов
- •3.5. Инновационные измерители в контексте компетентностного подхода
- •3.6. Основные этапы разработки аттестационных измерителей
- •Практические задания и вопросы для обсуждения
- •4. Аттестационные тесты. Их содержание, планирование, отбор и экспертиза
- •4.1. Целеполагание при планировании содержания педагогического теста
- •4.2. Планирование содержания теста
- •4.3. Общие принципы отбора содержания аттестационных тестов
- •4.4. Экспертиза качества содержания аттестационных тестов
- •Практические задания и вопросы для обсуждения
- •5. Формы тестовых заданий
- •5.1. Общие требования к заданиям тестов и классификация их форм
- •5.2. Задания с выбором одного или нескольких правильных ответов
- •Примеры заданий
- •5.3. Задания с конструируемым ответом
- •5.4. Задания на установление соответствия
- •5.5. Задания на установление правильной последовательности
- •5.6. Сравнительная характеристика форм тестовых заданий
- •1. Задания с двумя ответами
- •2. Задания с выбором из четырех-пяти ответов
- •3. Задания с конструируемыми регламентированными ответами
- •4. Задания со свободно конструируемыми ответами
- •5. Задания на соответствие
- •Практические задания и вопросы для обсуждения
- •6. Статистический анализ качества тестовых заданий и тестов
- •6.1. Классическая теория и методики конструирования тестов
- •6.2. Математико-статистический анализ качества тестов и тестовых заданий на основе классической теории тестов
- •6.3. Оценивание надежности и валидности педагогических тестов
- •6.4. Метод Кьюдера-Ричардсона для дихотомических оценок
- •6.5. Надежность и стандартная ошибка измерения
- •6.6. Валидность гомогенных тестов
- •Практические задания и вопросы для обсуждения
- •7. Сертификация аттестационных тестов
- •7.1. Общие сведения о системе сертификации педагогических тестов
- •7.2. Требования к качеству педагогических тестов
- •7.3. Требования к содержанию аттестационных тестов
- •7.4. Требования к статистическим характеристикам теста
- •7.5. Требования к характеристикам тестовых заданий компьютеризованного банка
- •7.6. Порядок сертификации тестов
- •Заключение
- •Словарь терминов
- •Список литературы
3.3. Критериально-ориентированный подход
При критериально-ориентированном подходе в педагогических измерениях результаты испытуемых интерпретируются по отношению к содержательной области или требованиям, установленным к учебным достижениям. Балл каждого студента подсчитывается путем перевода в проценты доли правильно выполненных заданий по отношению к общему числу заданий теста (для дихотомических оценок (1 или 0) по отдельным заданиям) либо отношения суммарного балла по правильно выполненным заданиям к общему числу баллов по всем заданиям теста (для политомических оценок по отдельным заданиям). Полученный для каждого студента процент сравнивается со стандартами выполнения – критериями, установленными экспертным путем и прошедшими эмпирическую валидизацию в процессе конструирования теста [1, 22, 28, 33].
Таким образом, при критериально-ориентированном подходе создаются тесты для сопоставления учебных достижений каждого студента с планируемым к усвоению объемом знаний, умений или навыков. В качестве интерпретационной системы отсчета используется конкретная область содержания, а не та или иная выборка студентов. Упор в интерпретации результатов делается на то, что может выполнить обучаемый и что он знает, а не на то, как он выглядит на фоне других студентов, выполнявших тест.
За рубежом типы критериально-ориентированных тестов имеют определенную классификацию: domain-referenced tests – тесты, ориентированные на содержательную область, результаты по которым, как правило, выражаются в процентах освоенного содержания; mastery, non-mastery tests – тесты для отбора испытуемых, достигших определенной ступени мастерства, результаты студентов в которых обычно делятся на две группы – превысившие критерий и не достигшие критерия выполнения.
В России такая классификация пока не сложилась, хотя она, несомненно, нужна, поскольку эти типы критериально-ориентированных тестов имеют разные технологии разработки.
С помощью критериально-ориентированных тестов благодаря содержательной интерпретации результатов тестирования можно:
• выявить освоенные и неосвоенные знания, умения, навыки и компетенции, построить индивидуальную образовательную траекторию каждого студента (domain-referenced tests) и повысить индивидуализацию учебного процесса;
• ранжировать тестируемых по проценту выполнения и построить рейтинговые шкалы (domain-referenced tests);
• разбить испытуемых на две группы с помощью одного критериального балла (mastery, non-mastery tests);
• разбить испытуемых на несколько групп с помощью нескольких критериальных баллов, поставив, например, балльные отметки – два, три, четыре, пять – и привести развернутый анализ неосвоенных разделов содержания и видов учебной деятельности.
Для получения критериального балла обычно применяют экспертный подход, результаты которого проходят статистический анализ методом контрастных групп. Главные принципы в работе экспертов – независимость суждений и четкое следование стандартизованным инструкциям.
При использовании статистического метода валидизации критериального балла всю группу студентов по результатам предварительных испытаний разбивают на три части: 27% – наиболее слабых, 27% – наиболее сильных и оставшаяся средняя часть. Затем всей группе студентов предлагают тест, из результатов которого выбирают только данные сильных и слабых студентов. По ним строят графики, представленные в сглаженном виде на рис. 3.1.
Рис. 3.1. Статистическая валидизация критериального балла методом контрастных групп
Через проекцию точки пересечения графиков на ось абсцисс проводят вертикальную прямую. Число процентов, соответствующих точке пересечения графиков, принимают за критериальный балл, а «хвосты» кривых слева и справа от вертикальной прямой показывают проценты неправильных решений (сильные испытуемые, попавшие в группы неаттестованных, и слабые студенты, отнесенные к аттестованным, соответственно).
Несмотря на кажущуюся привлекательность, благодаря содержательной интерпретации, критериально-ориентированный подход имеет недостатки, связанные с необходимостью полного охвата содержания, принимаемого за 100%, в одном тесте. Аттестационные критериально-ориентированные тесты нередко получаются очень длинными (из 150–300 заданий), выполнить которые даже студентам при одноразовом предъявлении просто невозможно. Поэтому при аттестации нередко применяют адаптивное тестирование, позволяющее за счет оптимизации трудности заданий значительно сократить длину теста [44]. Другой путь укорочения тестов – сокращение содержания теста за счет минимизации целей оценивания. Для этого критериально-ориентированные тесты нередко используют для проверки одного-двух умений или навыков, а при охвате более разнородного содержания выбирают нормативно-ориентированные тесты.
Помимо этого, критериально-ориентированные тесты имеют довольно ограниченную область применения. Они пригодны в тех случаях, когда можно четко определить знания, умения, навыки по конкретной области содержания и задать их верхний и нижний пределы для корректного определения критериев выполнения тестов. В более сложных и менее структурированных областях знаний, связанных с решением задач творческого уровня, определить верхний предел зачастую невозможно. Иногда при выполнении таких заданий студент руководствуется знаниями, но чаще все решают смекалка и догадка. Поэтому при создании тестов, предназначенных для контроля за выполнением задач творческого уровня, предпочтение следует отдавать нормативно-ориентированному подходу либо постараться совместить оба подхода в одном тесте.
Нормативно-ориентированный и критериально-ориентированный подходы не имеют тех различий, которые можно выявить путем обычного осмотра заданий тестов. Углубленный анализ существенных характеристик тестов, разработанных в рамках различных подходов, указывает на ряд особенностей. Нормативно-ориентированные и критериально-ориентированные тесты отличаются по целям создания, методике отбора содержания, характеру распределения эмпирических результатов тестирования и методам их обработки, критериям качества тестов и тестовых заданий, а главное, по интерпретации результатов испытуемых, выполнивших тест.
В частности, содержание критериально-ориентированного теста должно быть достаточно полно, в него включают все то, что условно можно принять за 100%-ный объем, планируемый к усвоению. Содержание нормативно-ориентированного теста фрагментарно, в нем могут быть только те разделы, которых достаточно для сравнения и дифференциации студентов по уровню учебных достижений. Нормативно-ориентированные тесты обычно имеют от 50 до 70% заданий примерно средней трудности, т.е. таких, которые смогла выполнить верно приблизительно половина тестируемых студентов (рис. 3.2).
Рис. 3.2. Распределение заданий по трудности в нормативно-ориентированном тесте
В критериально-ориентированных тестах, используемых для аттестации, основная часть заданий намного легче, особенно в тех случаях, когда стараются спланировать процент двоек и ограничить число неаттестованных студентов. Например, процент двоек не должен быть больше десяти, и критерий отсева неуспевающих хотят установить на уровне 70% (все, кто выполнил меньше 70% заданий теста, получают два), то в тест необходимо включить не менее 70% легких заданий, которые смогут выполнить верно 90% тестируемых студентов (рис. 3.3).
Рис. 3.3. Распределение заданий по трудности в критериально-ориентированном тесте
В силу того что распределения сырых баллов испытуемых по нормативно-ориентированным и критериально-ориентированным тестам имеют, как правило, различную форму, приходится использовать отличающиеся методы оценивания надежности и валидности результатов педагогических измерений, методики шкалирования и выравнивания. Типичные распределения баллов репрезентативной выборки испытуемых в нормативно-ориентированных и критериально-ориентированных тестах показаны на рис. 3.4 и 3.5.
Рис. 3.4. Распределение баллов репрезентативной выборки испытуемых в нормативно-ориентированных тестах
Рис. 3.5. Распределение баллов репрезентативной выборки испытуемых в критериально-ориентированных тестах
Наиболее существенные отличия между нормативно-ориентированными и критериально-ориентированными тестами сведены в табл. 3.1.
Таблица 3.1 Отличия между нормативно-ориентированными и критериально-ориентированными тестами
Между двумя подходами нет непреодолимых противоречий, а для преподавателей наиболее информативной является ситуация, когда оба подхода взаимно дополняют друг друга. Поэтому некоторые тесты разрабатываются с расчетом на то, чтобы результаты студентов можно было бы соотносить как с нормами, так и с содержанием теста. Примером этого в России являются КИМ ЕГЭ.
