
- •Кондаков и.М., Романюк э.И., Сорокина о.Л., Шишлянникова л.М. Разработка тестовых заданий для анализа знаний студентов
- •Глава 1. Психодиагностика в свете когнитивных наук 3
- •Глава 2. Разработка заданий тестов достижений 21
- •Глава 3. Обзор основных понятий общей теории педагогических измерений. 29
- •Глава 4. Основные психометрические характеристики тестов 35
- •Глава 5. Обработка результатов тестирования с помощью статистического пакета spss for windows 47
- •Глава 1. Психодиагностика в свете когнитивных наук
- •1.1. Принципы объективного тестирования
- •Классы диагностических средств в образовании
- •Примеры объективных тестов
- •Пример ситуационного теста
- •1.2. Тесты интеллекта и современная когнитивная психология
- •Методика
- •1.3. Тесты способностей и современная когнитивная психология
- •Примеры тестов способностей
- •Методика
- •Методика
- •Методика
- •Методика
- •1.4. Тесты достижений и современная когнитивная психология
- •Пример теста достижений
- •1.5. Использование моделей когнитивной психологии в тестировании знаний
- •Литература к главе 1
- •Глава 2. Разработка заданий тестов достижений
- •2.1. Содержание тестовых заданий
- •2.2. Формы тестовых заданий
- •Примеры тестовых форм
- •2.3. Анализ заданий в тестах достижений
- •Глава 3. Обзор основных понятий общей теории педагогических измерений.
- •3.1. Основные принципы построения педагогического теста.
- •3.2. Основные понятия общей теории измерений.
- •3. Шкала как средство отображения истинных баллов. Типы шкал
- •3.3. Процедура построения теста. Классификация видов педагогических тестов.
- •3.4. История развития теорий педагогических измерений.
- •1. Классическая теория тестов.
- •IV. Классификация теорий педагогических измерений по в.С. Аванесову:
- •1. Общая теория педагогических измерений.
- •4. Специальные математические теории педагогического измерения (Item Analysis; Item Response Theory)
- •Глава 4. Основные психометрические характеристики тестов
- •4.1. Валидность
- •4.2. Надежность
- •Глава 5. Обработка результатов тестирования с помощью статистического пакета spss for windows 11.5.0
- •5.1. Частотный анализ
- •5.2. Тест хи-квадрат
- •5.3. Непараметрические тесты
- •3.1. Сравнение двух независимых выборок
- •3.2. Сравнение двух зависимых выборок
- •3.3. Сравнение более чем двух независимых выборок
- •3.4. Сравнение более чем двух зависимых выборок
- •3.5. Тест Колмогорова-Смирнова
- •3.6. Отдельный тест по критерию хи-квадрат
- •3.7. Биноминальный тест
- •3.8.Анализ последовательностей
- •4. Корреляции
- •4.1. Коэффициент корреляции по Пирсону
- •4.2. Ранговые коэффициенты корреляции по Спирмену и Кендалу
- •4.3. Частная корреляция
- •4.4. Мера расстояния и мера сходства
- •5.5. Факторный анализ
- •5.6. Анализ пригодности
- •6.1. Задания типа верно – не верно
- •1. Descriptives for (Дескриптивные (описательные) статистики для)
- •2. Summaries (Итоги, общие сведения)
- •3. Inter-Item (Между пунктами)
- •6.2. Задания со ступенчатыми ответами (шкала Лайкерта)
3.4. История развития теорий педагогических измерений.
1. Классическая теория тестов.
Начало этой теории положил Ch. Spearmen в 1904 году. Существенный вклад в её развитие внес H. Gulliksen. Эти и другие авторы предполагали наличие истинного компонента измерения, в каждом результате. Они же заложили основы аксиоматики психолого-педагогических измерений
В ней существует семь основных аксиом:
1. Устойчивое существование латентного качества.
2. Возможность представления латентного качества как непрерывно измеряемой величины.
3. Существование истинного значения латентного качества у каждого испытуемого. Измеряемая величина предполагается варьирующейся на множестве испытуемых.
4. Неизбежная погрешность измерения, в соответствии с которым измеряемое значение X не равно истинному T. Для каждого i-го испытуемого Xi = Ti + Ei , где Ei - некоторая случайная ошибка измерения, состоящая из суммы возможных ошибок различного происхождения, значения и знака.
5. Случайные погрешности измерений распределены по нормальному закону.
6. Истинные и ошибочные компоненты измерений не коррелируют между собой.
Из четвертой и шестой аксиом вытекает седьмая аксиома.
7. Дисперсия тестовых баллов состоит из двух компонент:
.
2. Latent Trait Theory (Теория измерения латентных качеств)
В начале 40-х годов D.N.Lawly задался целью найти некое свойство, присущее заданию, которое было бы инвариантным (неизменяемым) относительно уровня подготовленности группы испытуемых. Таким свойством, как выяснилось, обладают так называемые характеристические кривые тестовых заданий и теста в целом. Автор стал рассматривать параметр крутизны кривой в качестве меры способности дифференцировать студентов по уровню их подготовленности. Поскольку все без исключения, теории педагогических измерений направлены на оценку истинных компонентов измерений латентных качеств, а также исходят из аксиомы устойчивого существования истинных компонентов измерения, то стало понятным, что название Latent Trait Theory нельзя признать правильным.
Поэтому в последние годы стали применять второе название Latent Trait Theory – Item Response Theory (IRT). В современных публикациях эту теорию часто называют «современной теорией», хотя сейчас существуют и другие «современные теории» (Random Sampling Theory; Theory of Generalizability), но практические преимущества некоторых положений этой теории в области педагогических измерений последних лет трудно переоценить
Главным в IRT являются утверждение о зависимости вероятности правильного ответа испытуемого от уровня подготовленности испытуемого и от параметров задания. Эту зависимость удобно представлять в виде логистической функции. Числу рассматриваемых параметров ставится в соответствие одна из возможных моделей измерения.
Создатель IRT G.Rasch попытался формализовать идею зависимости результатов сопряжения множества испытуемых с множеством заданий, используя матрицу тестовых данных. Подход G.Rasch был априорным, теоретическим, направленным на создание математической модели измерения и получения такой единицы педагогического измерения, с помощью которой можно было бы, на одной шкале, сравнить уровень знаний студента с уровнем трудности задания.
В
IRT
ставится важный исследовательский
вопрос - как соотносятся между собой
эмпирически наблюдаемые результаты
испытуемого (сырые баллы)
с
соответствующими значениями θi
того же испытуемого на латентной
переменной θ?
F.M.Lord сделал вывод, что линия
регрессии
тестового балла на латентную
переменную
имеет, в общем случае, вид логистической
функции, откуда можно понять, что тестовый
и истинный баллы связаны нелинейно.
В.А. Аванесов предложил новый перевод
IRT
на
русский язык как математическая
теория тестовых заданий