
- •Лекция 1 понятие о качестве образования. Педагогическая технология. Традиционные и новые средства оценивания результатов обучения
- •Основные характеристики традиционной и современной педагогической технологий
- •Лекция 2 Мониторинг, рейтинг, портфолио
- •2. Рейтинговая система оценивания
- •3. Портфолио обучающихся
- •Лекция 3 история развития системы тестирования за рубежом и в россии
- •Артур Синтон Отис
- •Тестология в России.
- •Причины появления адаптивного тестирования
- •Виды адаптивного тестирования
- •Лекция 4 педагогические тесты. Термины и определения. Классификация педагогических тестов
- •Отличия теста от других форм контроля
- •Структура теста
- •Кассификация педагогических тестов
- •Сравнительный анализ нормативно-ориентированного и и критериально-ориентированного тестов
- •Лекция 5 типы, формы и виды тестовых заданий
- •Структура тестового задания:
- •Практическое занятие 1
- •Тема 1. Формы тестовых заданий
- •Различают два способа оценивания
- •Структура тестового задания
- •Тестовые задания закрытого типа
- •1. Тестовые задания альтернативных ответов
- •2. Тестовые задания множественного выбора
- •Задания с выбором нескольких правильных вариантов ответа
- •3. Тестовые задания на установление соответствия
- •4. Тестовые задания на установление последовательности
- •Тестовые задания открытого типа
- •Тестовые задания с кратким ответом
- •Лекция 6 основные этапы разработки педагогического теста
- •1. Определение целей тестирования
- •Классификация целей обучения
- •Конкретизированные цели обучения
- •2. Планирование содержания теста Анализ содержания учебной дисциплины и отбор содержания для теста
- •3. Определение структуры теста. Разработка спецификации теста
- •4. Составление тестовых заданий
- •5. Экспертный анализ содержания и формы тестовых заданий
- •Лекция 7 проведение пробного тестирования. Показатели качества тестов
- •Сбор и статистическая обработка результатов тестирования
- •Характеристика тестовых заданий
- •Трудность тестовых заданий
- •Дискриминативность тестового задания
- •Анализ качества дистракторов в заданиях закрытой формы
- •Анализ правдоподобности дистракторов в заданиях закрытой формы с четырьмя ответами
- •Показатели качества теста
- •Надежность
- •Оценка надежности теста
- •Двукратное тестирование:
- •Однократное тестирование:
- •Валидность
- •Практическое занятие 2
- •Тема 2. Работа с матрицей результатов тестирования
- •1. Составление матрицы. Понятие верных и неверных профилей ответов.
- •2 . График (рис. 5)
- •3. Меры центральной тенденции
- •4. Меры изменчивости.
- •5. Меры симметрии и островершинности кривых распределений
- •Лекция 8 современная теория конструирования тестов
- •Математические модели современной теории тестов
- •Лекция 9 стандартизация теста и интерпретация результатов тестирования. Егэ и качество образования
- •Стандартизация теста
- •Егэ и качество образования
- •Задачи единого экзамена
- •Преимущества егэ перед другими формами контроля
- •Объективность.
- •Надежность.
- •3. Достоверность.
- •Структура киМов егэ
- •Рекомендуемая литература
Характеристика тестовых заданий
По результатам апробационного тестирования определяются характеристики тестовых заданий – трудность, дискриминативность и валидность задания.
Трудность тестовых заданий
Трудность задания в классической теории тестов определяется через соотношение количества испытуемых, справившихся с данным заданием, и общего количества испытуемых, т.е. трудность задания – это доля учащихся, которые справились с заданием.
Т
рудность
задания вычисляется по формуле
где
pj
- доля правильных ответов на j-ое
задание; Yj
- количество испытуемых, выполнивших j
- ое задание верно, N
- число испытуемых в группе, j
- номер задания. Или в процентах, Pj
– трудность j
– ого задания в процентах:
.
В
хорошо сбалансированном по трудности
тесте есть несколько самых трудных
заданий со значением
.
Есть несколько самых легких с
.
Остальные задания по значениям p
занимают
промежуточное положение между крайними
ситуациями и имеют в основном трудность
60 - 70 %
в критериально-ориентированном тесте
и 40-60 %
в нормативно-ориентированном.
Дискриминативность тестового задания
Дискриминативность (дифференцирующая способность, различающая способность) задания – это способность задания дифференцировать испытуемых по уровню достижений, на сильных и слабых. Если задание одинаково выполняется и слабыми, и сильными, то можно говорить о низкой дискриминативности задания. Если задание выполняется сильными испытуемыми, а слабые дают отрицательный результат, то мы имеем высокую дискриминативность.
Высокая дискриминативность тестовых заданий важна для нормативно-ориентированных тестов, основная цель которых - ранжирование учащихся по уровню достижений.
Если индекс дискриминативности выше нуля (больше 0,3 считается удовлетворительным), а еще лучше стремится к 1, то это свидетельствует о том, что задание обладает хорошим (максимальным) дифференцирующим эффектом.
Для оценки дискриминативности задания будем использовать метод крайних групп, расчет по формуле:
,
где
– индекс дискриминативности для j-ого
задания теста; (P1)j
– процент учеников, правильно выполнивших
j-ое
задание в подгруппе из 27% лучших учеников
по результатам выполнения теста; (P0)j
– процент учеников, правильно выполнивших
j-ое
задание в подгруппе из 27% худших учеников
по результатам выполнения теста.
Индекс дискриминативности изменяется в пределах [-1; 1]. Максимального значения он достигает в том случае, когда все ученики из подгруппы сильных верно выполняют данное задание, а из подгруппы слабых это задание не выполняет верно никто. В этом случае задание будет обладать максимальным дифференцирующим эффектом. Нулевого значения индекс дискриминативности достигает тогда, когда в обеих подгруппах доли учеников, справившихся с заданием равны. Соответственно дифференцирующего эффекта нет вообще. Значение меньше 0 будет в ситуации, когда данное задание теста слабые ученики выполняют успешнее, чем сильные. Естественно, что задания, у которых индекс дискриминативности равен или ниже нуля необходимо удалить из теста (табл. 6).
С помощью подсчета значений бисериальной или точечно-бисериальной корреляции также оценивается валидность отдельных заданий теста. В целом задание можно считать валидным, если rpbis близко к 0,5. Оценка валидности задания позволяет судить о том, насколько задание пригодно. Если цель – дифференциация учеников по уровню подготовленности, то валидные задания должны четко отделить хорошо подготовленных от слабо подготовленных учеников тестируемой группы. Значения rpbis близкие к нулю, указывают на низкую дифференцирующую способность заданий теста. Все задания у которых rpbis<0, подлежат удалению из теста, так как на эти задания верно отвечают слабые ученики, а сильные либо ошибаются либо пропускают это задание.
Таблица 6
№ задания |
Pj для всех испытуемых |
Группа |
Индекс rдис |
|
Pj для слабой |
Pj для сильной |
|||
1 |
21,0 |
6,5 |
32,0 |
0,26 |
2 |
94,0 |
90,0 |
97,0 |
0,065 |
3 |
64,0 |
42,0 |
97,0 |
0,55 |
4 |
59,0 |
68,0 |
58,0 |
-0,097 |
5 |
27,0 |
16,0 |
29,0 |
0,13 |
6 |
70,0 |
29,0 |
94,0 |
0,65 |
7 |
30,0 |
13,0 |
42,0 |
0,29 |
8 |
12,0 |
9,7 |
16,0 |
0,065 |
9 |
33,0 |
16,0 |
52,0 |
0,35 |
10 |
73,0 |
42,0 |
90,0 |
0,48 |