
- •Лекція 11
- •2. Кваліметричні шкали.
- •2.1. Типи кваліметричних шкал.
- •2.2. Вибір розмірності шкали.
- •3. Аналіз існуючих систем оцінювання рівня підготовки.
- •4. Розмір вибірки для контролю.
- •5. Вимоги до контрольних завдань.
- •5.1. Тривалість контролю.
- •5.2. Складність і трудомісткість контрольних завдань.
- •5.3. Структура контрольних завдань.
- •6. Особливості тестового контролю
- •6. Критерії і методи обробки результатів контролю.
- •8. Методи оцінки якості викладання.
6. Особливості тестового контролю
Тести – це досить короткі, стандартизовані або не стандартизовані проби, випробування, що дозволяють за порівняно короткі проміжки часу оцінити результативність пізнавальної діяльності студентів, тобто оцінити ступінь і якість досягнення кожним студентом цілей навчання.
Тести досягнень призначені для того, щоб оцінити успішність оволодівання конкретними знаннями і навіть окремими розділами навчальних дисциплін, і є більш об'єктивним показником навченості, ніж при традиційному оцінюванні.
Тести досягнень застосовуються з метою визначення ефективності програм, підручників і методів навчання, особливостей роботи окремих викладачів, педагогічних колективів тощо, тобто за допомогою цих тестів діагностують минулий досвід, результат засвоєння тих або інших дисциплін або їхніх розділів.
За формою проведення тести можуть бути індивідуальними і груповими, усними і письмовими, бланковими, предметними, апаратурними і комп'ютерними. При цьому кожен тест має кілька складових частин: посібник з роботи з тестом, тестовий зошит із завданнями і, якщо необхідно, стимульнийматеріал або апаратуру, лист відповідей (для бланкових методик), шаблони для обробки даних.
У керівництві наводяться дані про цілі тестування, вибірку, для якої тест призначений, результати перевірки на надійність, способи обробки й оцінки результатів. Завдання тесту, згруповані в субтести (групи завдань, об'єднані однією інструкцією), розміщені в спеціальному тестовому зошиті (тестові зошити можуть бути використані багаторазово, оскільки правильні відповіді відзначаються на окремих бланках). Якщо тестування проводиться з одним випробуваним, то такі тести звуться індивідуальними, якщо з декількома - груповими. Кожен тип тестів має свої достоїнства і недоліки. Перевагою групових тестів є можливість охоплення великих груп випробуваних одночасно (до кількох сотень людей), спрощення функцій експериментатора (читання інструкцій, точне дотримання часу), більш рівні умови проведення, можливість обробки даних на ЕОМ тощо.
Основним недоліком групових тестів є зниження можливостей в експериментатора домогтися взаєморозуміння з випробуваними, зацікавити їх.
Крім того, при груповому тестуванні ускладнено контроль функціонального стану випробуваних (тривожність, стомлення тощо). Іноді для того, щоб зрозуміти причини низьких результатів по тесту якогось студента, варто провести додаткову індивідуальну співбесіду. Індивідуальні тести позбавлені цих недоліків.
Велику увагу варто приділяти також вибору форми, в якій представлені варіанти відповідей до завдань тесту (вид тесту). Можна виділити тести наступних видів:
1. Тести з однозначним вибором відповіді. На кожне завдання пропонується кілька варіантів відповіді, з яких тільки один вірний. У математиці це звичайно числові відповіді або відповіді в координатному записі.
2. Тест із багатозначною відповіддю. У варіанти відповіді може бути внесене більше вірної відповіді, але в різних видах. Серед відповідей може й не бути вірних відповідей. Тоді в результаті кожному номерові завдань повинні бути виставлені номери правильних відповідей або прочерк.
3. Тести на доповнення. У цих тестах завдання оформляються з пропущеними словами або символами. Пропущене місце повинне бути заповнене учнями. Такі тести корисні при вивченні алгоритмів.
4. Тести перехресного вибору. У них пропонується відразу кілька завдань і кілька відповідей до них. Кількість відповідей рекомендується планувати трохи більше, ніж завдань. У результаті учень повинен надати ланцюжок двозначних чисел. Ці тести також можуть бути однозначними і багатозначними.
5. Тести ідентифікації. Аналогічні (4). У них використовуються графічні об'єкти або аналітичні описи.
У порівнянні з 1 -3 тести 4 і 5 більш складні для роботи тих, хто навчається, але і більш достовірні. В ході їх виконання формуються навички порівняння об'єктів, зіставлення, співвіднесення, представлення об'єкта в різних формах. Вони більш цікаві для тих, хто навчається видами діяльності, для викладача - наповненістю змісту.
Тестування широко використовується в навчальних закладах для тренувального, проміжного і підсумкового контролю знань, а також для навчання і самопідготовки учнів.
За типом тести поділяються на:
а) Закриті, де є готові відповіді: вибрати правильну відповідь з 2,3,4,5 наданих альтернативних відповідей, встановлення істинності, хибності, відповідності, встановлення послідовності тощо;
б) Відкриті: які не мають готових відповідей, їх треба конструювати самостійно, доповнити, закінчити, скласти.
Найбільш розповсюдженими є закриті тести, тому що саме вони здатні реалізувати достоїнства тестування. Однак вони мають ряд недоліків. Головним недоліком закритих тестів є те, що такий контроль вимагає всього лише розпізнавання правильної відповіді серед запропонованих, навіть не відтворення знань (інформації). А це найнижчий рівень пізнавальної діяльності. Істотною проблемою при застосуванні закритих тестів є питання точності (вірогідності) визначення частки знань, якими володіє той, кого тестують.
Задамося довірчою імовірністю Рдов= 0,95 і проведемо обчислення верхнього Dві нижнього Dнзначень довірчого інтервалу "частки знань" того, кого тестують.
Розглянемо варіант тестового експрес-контролю. Досвід тестування показує, що для альтернативного вибору відповіді на кожне запитання необхідно дати студенту біля однієї хвилини. Отже, для проведення 15-хвилинного експрес-контролю необхідний тест розміром у 15 питань.
На мал.1 представлені графіки залежностей Dві Dнвід числа помилкових відповідей (N) длядвоїчноготесту (із двома альтернативними відповідями К=2), що складається з 15 питань (довжина тесту М=15). З графіка видно, що тільки безпомилкова відповідь на всі 15 питань дає гарантію того, що студент володіє (пам'ятає) не менш 64% навчального матеріалу ("частка знань" Dв>0,64). Уже при чотирьох неправильних відповідях справедлива гіпотеза про те, що студент вибирає варіанти відповідей навмання, тобто про відсутність знань. Цей варіант тесту дозволяє виділити дві групи студентів:
- ті, що володіють навчальним матеріалом на рівні "зараховано";
- не опанували необхідний мінімум знань - "не зараховано".
На підставі цього можна зробити висновок про можливості застосування такого тесту при проведенні колоквіумів на лабораторних заняттях. При цьому слід зазначити занадто велику невизначеність в оцінці підготовки студентів. Довірчий інтервал (2∆= Dв - Dн ), тобто інтервал, у якому знаходиться фактична частка знань того, кого тестують, у залежності від числа помилок змінюється в межах 0,35 - 0,75.
Крім того, із графіків мал.1 випливає, що більш короткі тести (М<15) не дозволяють робити обґрунтовані висновки про задовільну підготовку студентів навіть при безпомилкових відповідях на всі питання.
Розглянемо
варіантчетверичноготесту (мал.2) з чотирма варіантами
відповідей К=4 при тій же довжині М=15. Як
видно з малюнка, збільшення кількості
варіантів відповідей до чотирьох
дозволяє значно (на 0,12 при всіх правильних
відповідях) підняти гарантована нижня
межа частки знань і, крім того, виділяти
вже три групи студентів:
- що володіють не менш ніж 75% навчальної інформації (оцінка "добре") у випадку правильної відповіді на всі питання;
- знаючих більш 60% інформації (оцінка "задовільно") при одній помилковій відповіді;
- "незадовільно" при N > 1.
Як видно з
мал.3, де представлені аналогічні
залежності для тесту M=15 і K=8, збільшення
кількості варіантів відповідей більш
чотирьох недоцільне (збільшення в два
рази числа варіантів дає в
порівнянні з четверичнимтестом приріст частки гарантованого
знання лише на 0,04). По-перше, це призводить
до незначного росту гарантованої частки
знань (звуженню довірчого інтервалу).
По-друге, треба мати на увазі, що
"неправильні" варіанти відповідей
повинні бути досить правдоподібні і
нерозрізнені при відсутності знань у
того, кого тестують. Розробка великого
числа таких варіантів досить складна
дидактична задача, за винятком варіантів
відповідей у виді числа або формули.
Диференціювати студентів по чотирьох рівнях відповідно до критеріїв чотири бальної шкали оцінювання дозволяє четверичний тест довжиною не менш 42 питань. Тестування цим тестом можна провести протягом однієї академічної години.
На
мал. 4 представлені аналогічні графіки
для розглянутого варіанта тесту. Оцінка
"відмінно" ставиться при
безпомилковому проходження тесту, від
однієї до трьох помилок - "добре",
4 - 7 помилок - "задовільно і N > 7 -
"незадовільно". До недоліків цього
тесту варто віднести досить велику
область невизначеності, довірчий
інтервал лежить у межах від 0,1 до 0,28.
Такий тест може бути використаний при
проведенні модульного контролю.
Екзаменаційне
тестування дозволяє використовувати
тести розміром більш 90 (M>90). На мал.5
представлені відповідні залежності
для випадку M=90, K=4. При цьому забезпечується
довірчий інтервал тестування не більш
0,17. Оцінка "відмінно"
виставляється при N<2, "добре" -
N<10 і "задовільно" - N<19.
Мал. 5.