- •В.И. Звонников, м.Б. Челышкова Контроль качества обучения при аттестации: компетентностный подход Список сокращений
- •Введение
- •1. Качество результатов обучения и его оценка
- •1.1. Современные тенденции развития образования: императив качества
- •1.2. Основные подходы к трактовке качества образования в России и за рубежом
- •1.3. Зарубежный опыт реализации компетентностного подхода к оцениванию качества результатов обучения
- •1.4. Компетентностный подход и оценивание качества результатов обучения с позиций федеральных государственных образовательных стандартов нового поколения
- •1.5. Показатели качества образования
- •1.6. Системы менеджмента и оценки качества образования
- •1.7. Эвалюация в образовании
- •Практические задания и вопросы для обсуждения
- •2. Основы теории педагогических измерений
- •2.1. Понятийный аппарат теории педагогических измерений
- •2.2. Переменные и компоненты измерений в образовании. Надежность и валидность результатов измерения
- •2.3. Объективность педагогических измерений
- •2.4. Размерность пространства измерений
- •2.5. Уровни и шкалы измерений
- •2.6. Бипарадигмальная методология
- •Практические задания и вопросы для обсуждения
- •3. Основные подходы к разработке измерителей
- •3.1. Общие подходы к интерпретации результатов педагогических измерений
- •3.2. Нормативно-ориентированный подход и стандартизация тестов
- •3.3. Критериально-ориентированный подход
- •3.4. Задачи тестирования и виды тестов
- •3.5. Инновационные измерители в контексте компетентностного подхода
- •3.6. Основные этапы разработки аттестационных измерителей
- •Практические задания и вопросы для обсуждения
- •4. Аттестационные тесты. Их содержание, планирование, отбор и экспертиза
- •4.1. Целеполагание при планировании содержания педагогического теста
- •4.2. Планирование содержания теста
- •4.3. Общие принципы отбора содержания аттестационных тестов
- •4.4. Экспертиза качества содержания аттестационных тестов
- •Практические задания и вопросы для обсуждения
- •5. Формы тестовых заданий
- •5.1. Общие требования к заданиям тестов и классификация их форм
- •5.2. Задания с выбором одного или нескольких правильных ответов
- •Примеры заданий
- •5.3. Задания с конструируемым ответом
- •5.4. Задания на установление соответствия
- •5.5. Задания на установление правильной последовательности
- •5.6. Сравнительная характеристика форм тестовых заданий
- •1. Задания с двумя ответами
- •2. Задания с выбором из четырех-пяти ответов
- •3. Задания с конструируемыми регламентированными ответами
- •4. Задания со свободно конструируемыми ответами
- •5. Задания на соответствие
- •Практические задания и вопросы для обсуждения
- •6. Статистический анализ качества тестовых заданий и тестов
- •6.1. Классическая теория и методики конструирования тестов
- •6.2. Математико-статистический анализ качества тестов и тестовых заданий на основе классической теории тестов
- •6.3. Оценивание надежности и валидности педагогических тестов
- •6.4. Метод Кьюдера-Ричардсона для дихотомических оценок
- •6.5. Надежность и стандартная ошибка измерения
- •6.6. Валидность гомогенных тестов
- •Практические задания и вопросы для обсуждения
- •7. Сертификация аттестационных тестов
- •7.1. Общие сведения о системе сертификации педагогических тестов
- •7.2. Требования к качеству педагогических тестов
- •7.3. Требования к содержанию аттестационных тестов
- •7.4. Требования к статистическим характеристикам теста
- •7.5. Требования к характеристикам тестовых заданий компьютеризованного банка
- •7.6. Порядок сертификации тестов
- •Заключение
- •Словарь терминов
- •Список литературы
6.6. Валидность гомогенных тестов
Валидность – это характеристика способности теста служить поставленной цели измерения. Как правило, постановка целей создания теста носит комплексный характер, поэтому часто стараются проверить валидность с разных позиций сообразно различным направлениям использования теста. Например, нормативно-ориентированный тест для приема абитуриентов в вузы должен служить цели дифференциации испытуемых и прогностическим целям, так как мало выделить лучших абитуриентов в момент приема, нужно также спрогнозировать успешность дальнейшего обучения зачисленных в вузы абитуриентов.
Оценивание валидности всегда проводится путем соотнесения характеристик результатов измерения с внешними критериями [ 1,28, 36]. В качестве таких критериев могут выступать оценки экспертов при анализе содержания теста и его адекватности целям измерения (содержательная валидность), результатов по другим тестам (конструктная валидность), успешности дальнейшего обучения (прогностическая валидность). Высокая корреляция между анализируемыми результатами испытуемых и внешними критериями подтверждает высокую валидность теста. Основная трудность при такой валидизации носит не практический, а методологический характер, поскольку она состоит в выборе значимого внешнего критерия.
При разработке аттестационных тестов, конечно, на первом плане находится содержательная валидность, которая определяется как характеристика репрезентативности содержания теста по отношению к запланированным для проверки знаниям, умениям и требованиям ФГОС. Если тест позволяет проверить все то, что задумано авторами в спецификации и заложено в ФГОС, то он считается валидным относительно контролируемого содержания дисциплины и целей создания аттестационного теста. Представление о содержательной валидности не следует связывать только с полнотой отображения в тесте содержания требований ФГОС, необходимо также заботиться о правильности пропорций содержания теста. Если тест отображает второстепенные элементы содержания дисциплины вместо значимых разделов, то нельзя говорить о его высокой содержательной валидности.
Конечно, во всех случаях справедлив общий вывод – чем глубже и полнее отображение, тем выше уверенность в содержательной валидности теста. Однако при нормативно-ориентированном подходе есть свои особенности. Тест валиден по содержанию, если он обеспечивает высокую дифференциацию результатов испытуемых и в нем отображено все то главное, без чего нельзя говорить о знании курса. При этом отдельные содержательные разделы могут быть представлены фрагментарно, а другие и вовсе отсутствовать в тесте. Для повышения содержательной валидности в тест лучше включать задания, содержание которых не связано каким-либо заметным образом, и потому они не могут замещаться при проверке. При прочих равных условиях эта тенденция приведет к повышению полноты охвата содержания и, следовательно, к росту содержательной валидности теста. Таким образом, если речь идет о валидности, то конструктор заинтересован в выборе заданий с малыми коэффициентами интеркорреляции.
К противоположному выводу легко прийти, если стараться повысить надежность теста. Отбирая задания с большими коэффициентами интеркорреляции, можно обеспечить высокую однородность содержания и надежность теста. Это противоречие, отмеченное впервые Ф. Лордом [38], дает основание для возникновения серьезных проблем при конструировании теста. В частности, легко представить ситуацию разработки итогового теста по алгебре. Если включить в него только задания на решение уравнений одного вида, то можно достичь высокой надежности, близкой к 0,90. Однако, и это понятно без всяких объяснений, маловероятно, чтобы такой итоговый тест обладал приемлемой содержательной валидностью.
Таким образом, при конструировании гомогенного теста следует стремиться к повышению его надежности в разумных пределах, чтобы не снизить существенным образом содержательную валидность теста. Поэтому при отборе заданий в тест необходимо иметь четкое представление об их содержании и о множестве других факторов, а не просто отдавать предпочтение тем, которые высоко коррелируют друг с другом и обеспечивают хорошую надежность теста. Правда, по рассматриваемой выше проблеме есть другая точка зрения, принадлежащая Гилфорду и Ньюнелли [36]. Они полагают, что внутренняя согласованность теста является непременным условием его высокой содержательной валидности, и потому высокая надежность служит предпосылкой оптимальной валидности теста.
Кточке зрения Ф. Лорда присоединяются Кэттелл и Клайн [17]. По их мнению, максимум валидности может быть получен тогда, когда все задания слабо, но положительно коррелируют друг с другом, при этом каждое из них имеет высокую корреляцию с критерием по тесту. Поэтому повышению валидности способствует включение заданий, для которых характерны большие коэффициенты бисериальной корреляции с суммой баллов по тесту.
При количественных оценках валидности для педагогических тестов в качестве критерия обычно берутся оценки экспертов, выставленные ими при традиционной проверке знаний учеников без использования тестов. Процесс валидизации осложняется необходимостью установления меры согласованности оценок экспертов, которых обычно бывает не менее трех. Если мера согласованности достаточно высока, то для оценки валидности используется формула
где Х i – Х̅ – отклонение тестового балла i -го ученика от среднего балла по тесту; Х тi – Х̅ э — отклонение балла i -го ученика у экспертов от Х̅ э — среднего арифметического экспертных оценок; S X 2 — дисперсия баллов учеников по тесту; S mx 2 — дисперсия баллов экспертов; m — число экспертов.
Бывают случаи, когда педагог заинтересован в оценке прогностической валидности, например, указывающей меру вероятности прогноза успешности профессиональной деятельности выпускника вуза по результатам выполнения теста. В этом случае результаты по тесту коррелируют с результатами аттестации молодых специалистов, проводимой на предприятиях и организациях в течение нескольких первых лет работы. Высокая корреляция означает, что разработанные тесты прогностичны для отбора лучших выпускников вуза, обладающих сформированными профессиональными компетенциями.
Выводы
В отличие от традиционных средств контроля тесты проходят процесс научного обоснования качества, предполагающий оценку соответствия характеристик тестов двум важнейшим критериям: надежности и валидности. Разработка тестов для принятия административно-управленческих решений в образовании требует длительного исследовательского периода, охватывающего в циклическом режиме все этапы создания теста.
Анализ эмпирических данных тестирования начинается с построения матрицы, отражающей взаимодействие испытуемых и заданий в процессе выполнения теста. Обработка данных матрицы в классической теории тестов основывается на дескриптивной статистике, анализ результатов обработки позволяет оценить качество тестовых заданий и всего теста.
Наибольшую трудность при создании теста представляет интерпретация результатов обработки эмпирических результатов тестирования, но только благодаря ей может быть достигнуто высокое качество теста. Полная стандартизация процедуры предъявления теста способствует повышению точности и созданию качественных тестов.
Для разработки аттестационных тестов в вузе рекомендуется использовать традиционную теорию тестов.
