- •Принятая система сокращений:
- •Структура теста
- •Спецификация
- •Пример распределения заданий по видам деятельности
- •Бланк оценочного средства
- •Бланк ответов
- •Основные этапы конструирования оценочного средства (теста)
- •Валидность
- •Существуют два основных вида тестов:
- •Выбор критериального бала
- •Рекомендации по назначению нормы трудности
- •Определение нормы трудности тестовых заданий
- •Типы тестовых заданий
- •Общие требования к тестовым заданиям
- •Тестовые задания закрытой формы
- •Тестовые задания открытой формы
- •Тестовые задания на установление соответствия
- •Тестовые задания на установление последовательности
- •Статистическая обработка выполнения тестов
- •Учет погрешности измерения
- •Шкалирование результатов
- •Анализ результатов тестирования
- •Структура компетентностно-ориентированного задания
- •Примеры тестовых заданий
- •Примеры тестовых заданий нового поколения
- •Мини-кейс
- •Расчетное задание с выбором ответа
- •Ситуационное задание «Хеджирование»
- •Техническое задание на разработку web-сайта.
- •Решение практических расчетных задач с обоснованием решения
- •Спецификация теста
- •4. Авторский коллектив разработчиков
- •Технологическая матрица фонда оценочных средств по дисциплине________________________
- •Анализ результатов________________________________тестирования
- •Образец компетентностно-ориентированного задания Темперамент
- •Спецификация тестового контроля знаний по физике
- •2. Документы, определяющие содержание тестового контроля знаний
- •3. Условия применения
- •4. Структура тестового контроля знаний
- •5. Распределение заданий по проверяемым элементам содержания
- •6. Время выполнения работы
- •7. Система оценивания отдельных заданий и работы в целом
- •8. Разработчик: ______________________________________________ демонстрационный вариант теста
- •Желаем успеха! Демонстрационный вариант теста
- •Ответы к заданиям с выбором ответов
- •К этому надо добавить 5 вариантов теста
Пример распределения заданий по видам деятельности
Проверяемые виды деятельности
|
Число заданий |
Максимальный первичный балл |
Процент максимального первичного балла за задания данного вида деятельности от максимального первичного балла за всю работу, равного 52 |
1. Воспроизведение знаний |
10 |
10 |
19 |
2. Применение знаний и умений в знакомой ситуации |
15 |
15 |
29 |
3. Применение знаний и умений в измененной ситуации |
10 |
12 |
23 |
4. Применение знаний и умений в новой ситуации |
5 |
15 |
29 |
Итого: |
40 |
52 |
100 (можно использовать как результирующие баллы) |
Бланк оценочного средства
Бланк (форма) с заданием на выполнение должен соответствовать структуре (модели композиции/макету) оценочного средства и содержать:
- информацию о легализации оценочного средства (к примеру: гриф «Утверждаю», подпись и печать);
- наименование оценочного средства;
- описание общей задачи;
- описание каждого задания (подзадачи) с исходными данными;
- краткую инструкцию по выполнению (пояснения);
- время, отводимое на выполнение.
2. Правильный(ые) вариант(ы) решения(й) задания в целом (отдельных задач).
3. Бланк (форма) для ответов/решений (если предусмотрено).
Бланк ответов
Для каждого оценочного средства разрабатывается бланк ответов в соответствии со структурой заданий. Может использоваться стандартизированный бланк, обеспечивающий задачи выполнения любых оценочных средств (унифицированная форма).
Основные этапы конструирования оценочного средства (теста)
Определение цели тестирования, выбор вида теста и подхода к его созданию.
Концептуальный выбор переменной измерения.
Анализ содержания учебной дисциплины и планирование содержания теста, априорный выбор длины теста и времени его выполнения, разработка спецификации теста.
Определение структуры теста, форм заданий и стратегии их расположения в тесте.
Создание предтестовых заданий (заданий, для которых нет данных апробации и их статистических характеристик, формируемых по результатам апробации).
Отбор заданий в тест и их ранжирование согласно выбранной стратегии предъявления на основании априорных авторских оценок трудности заданий.
Экспертиза содержания, формы предтестовых заданий и содержания теста.
Коррекция заданий и теста по результатам
Разработка методики апробационного тестирования, инструкций для учеников и для преподавателей, проводящих апробацию теста.
Формирование репрезентативной выборки апробации.
Проведение апробационного тестирования.
Проверка результатов выполнения теста (автоматизированная или ручная), подготовка эмпирических данных тестирования к виду, удобному для обработки и проведения анализа.
Статистическая обработка результатов выполнения теста (автоматизированная с помощью специального программного обеспечения).
Анализ и интерпретация результатов обработки в целях улучшения качества теста. Проверка соответствия характеристик теста научно обоснованным критериям качества.
Коррекция содержания и формы заданий на основании данных предыдущего этапа. Чистка теста и добавление новых заданий для оптимизации диапазона значений параметра трудности и улучшения системообразующих свойств заданий теста. Оптимизация длины теста и времени его выполнения на основании статистических оценок характеристик теста. Оптимизация порядка расположения заданий в тесте.
Повторение этапа апробации для выполнения очередных шагов по повышению качества теста.
Интерпретация данных обработки, установление норм теста и создание шкалы для оценки результатов испытуемых.
Этапы разработки теста
Критерии качества теста
Надежность теста отражает точность педагогического измерения и устойчивость результатов тестирования к воздействию "посторонних случайных факторов. Иными словами, тест называется надежным, если он дает одни и те же (или очень близкие) показатели для каждого испытуемого повторном тестировании. Можно проверить и другим способом: результаты тестирования сравнить с текущими оценками. Грубо говоря: если отличники остались отличниками, а двоечники остались двочниками и т.д. Т.Е не менее 70% совпадений, то уже приемлемый уровень, лучше, если 95%.
Надежность теста – это характеристика устойчивости и точности его результата.
Два фактора надежности теста – это его гомогенность и длина.
О надежности тестов судят по степени сохранения ранговых позиций испытуемых.
