Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические-рекомендации-по-разрабоке-оценочных-средств.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
888.32 Кб
Скачать

2.3. Валидность педагогических тестов, ее виды и оценка

Как отмечалось выше, валидность — это характеристика способности теста служить поставленной цели измерения. Обычно постановка целей создания теста носит комплексный характер, поэтому часто стараются проверить валидность с разных позиций сообразно различным направлениям использования теста. Например, тест для приема абитуриентов в вузы должен служить цели дифференциации испытуемых и прогностическим целям, так как мало выделить лучших абитуриентов в момент приема, нужно также осуществить спрогнозировать успешность дальнейшего обучения зачисленных в вузы абитуриентов. Компетентностный тест должен быть валиден по содержанию (содержательная валидность), по измеряемой переменной (конструктная валидность) и по способности прогнозировать успехи в профессиональной деятельности выпускников учебных заведений (прогностическая валидность).

Оценку валидности всегда получают путем соотнесения характеристик результатов измерения с внешними критериями. В качестве таких критериев могут выступать оценки экспертов при анализе содержания теста и его адекватности целям измерения (содержательная валидность), результатов по другим тестам (конструктная валидность), успешности дальнейшего обучения или работы (прогностическая валидность). Высокая корреляция между анализируемыми результатами испытуемых и внешними критериями подтверждает высокую валидность теста. Основная трудность при такой валидизации носит не практический, а методологический характер, поскольку она состоит в выборе значимого внешнего критерия.

При разработке педагогических тестов, конечно, на первом плане находится содержательная валидность, которая определяется как характеристика репрезентативности содержания теста по отношению к запланированным для проверки знаниям и умениям. Если тест позволяет проверить все то, что задумано авторами в спецификации, он считается валидным. Представление о содержательной валидности не следует связывать только с полнотой отображения в тесте содержания проверяемого курса, необходимы также правильные пропорции содержательных элементов. Конечно, во всех случаях справедлив общий вывод — чем глубже и полнее отображение, тем выше уверенность в содержательной валидности теста.

В табл. 2.3.1 представлены различные виды вопросов, которые должен ставить перед собой создатель теста в процессе его валидизации.

Таблица 2.3.1

Виды вопросов для валидизации теста

Виды валидности

Вопрос

Способ получения ответа

Содержательная валидность

Соответствует ли содержания тестовых заданий целям измерения?

Экспертиза и данные факторного анализа говорят о соответствии содержания тестовых заданий целям измерения

Конструктная валидность

Насколько сильно результаты выполнения нового теста связаны с результатами выполнения признанного теста той же выборкой обучающихся?

Результаты корреляционного анализа данных тестирования по новому и признанному тестам показали, что они измеряют одну и ту же переменную

Прогностическая валидность

Может ли тест предсказать успехи или неудачу на последующей ступени обучения или работы?

Результаты корреляционного анализа данных тестирования с оценками обучающихся на последующей ступени обучения или профессиональной деятельности выпускников показали его высокую прогностическую способность

При количественных оценках валидности для педагогических тестов в качестве критерия обычно берутся оценки экспертов, выставленные ими при традиционной проверке знаний обучающихся без использования тестов. Процесс валидизации осложняется необходимостью установления меры согласованности оценок экспертов, которых обычно бывает не менее трех человек.

Источники повышения валидности теста:

  1. Подбор оптимальной трудности заданий для обеспечения планируемого закона распределения баллов по тесту применительно к целям измерения.

  2. Проведение нескольких экспертиз качества содержания теста.

  3. Расчет оптимального времени выполнения теста.

  4. Подбор валидных заданий с высокой дискриминативностью.

  5. Соответствие содержания измерителя его спецификации (содержательному плану).

  6. Четкое формулирование существенных признаков измеряемой переменной и ее отличий от других переменных, не планируемых к включению в данный тест (описания признаков проявления компетенций для компетентностных тестов).

  7. Создание банка калиброванных заданий, обладающих устойчивыми статистиками и использование банка при композиции теста.

  8. Помещение в тест на начальном этапе его разработки избыточного числа заданий для обеспечения возможности последующего удаления неудачных заданий при коррекции теста (по крайней мере в два раза больше, чем планируемая окончательное число заданий в тесте.