Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
підручник.doc
Скачиваний:
90
Добавлен:
13.08.2019
Размер:
2.35 Mб
Скачать

Технологічні особлиості тестування

Якщо ви відчуваєте в собі бажання створити ідеальний варіант дидактичного тесту, для початку познайомтесь з деякими практичними порадами і рекомендаціями щодо їх розробки.

Дидактичні тести розробляються з метою формування навичок щодо найбільш ефективного контролю якості засвоєння матеріалу. Останні можуть бути короткими (10-20 завдань), середніми і довгими (до 300 завдань і більше). оптимальна кількість завдань - 40-60. Тести зазвичай складаються з двох частин: інформаційної та операційної. Інформаційна частина має включати чітко і просто сформульовану інструкцію (починати бажано з дієслова). Бажано, щоб інструкція супроводжувалася прикладом виконання. Операційна частина складається з певної кількості тестових завдань.

При складанні дидактичного тесту слід обов’язково враховувати, що існують певні вимоги до його зовнішнього оформлення. Текст з переліком тестових питань повинен мати завершений вигляд. Тому кожен тест має такі структурні компоненти: 1 - назву; 2 - звертання до учнів; 3 -настановлення; 4 - педагогічне доручення (інструкцію); 5 - власне завдання, вправи, запитання; 5 - на окремих аркушах - правильні відповіді, що залишаються у вчителя або методиста.

Існують різноманітні способи проведення тестування. В останні роки виник новий різновид останнього – адаптивне тестування, тобто такий контроль, який дозволяє регулювати важкість та кількість завдань, що пропонуються кожному студентові в залежності від його відповіді на поточне завдання: якщо він відповідає правильно – наступне завдання буде більш складним, а якщо не вірно – більш легким.

При створенні тестів одним із фундаментальних по значущості чинників є час. Приблизний час, необхідний для тестування, з’ясовується на етапі апробації тесту, проте орієнтований час планується заздалегідь.

У початковій школі тестування не повинне продовжуватися більше 20-30 хвилин, оскільки це час утримання уваги, яка підтримується мотивацією, для середніх шкіл і коледжів – близько години (40 – 50 хвилин). Разом з тим, підсумковий контроль для випускників та для студентів може продовжуватись до 90 хвилин. С. Отіс вважає, що час тестування повинен бути таким, щоб приблизно 5 відсотків учнів могли виконати всі завдання.98 За рекомендаціями психофізіологів, враховуючи індивідуальну та групову працездатність учнів, найсприятливішими для проведення тестування вважаються проміжки часу з 9 до 12 та з 16 до 18 години.99

Доцільні форми тестового завдання бажано обирати у відповідності до того, які структурні елементи лекції слід контролювати, які вміння та навички мають бути проконтрольованими. Однак остаточний вибір за тими, хто їх розробляє.

Критерії якості дидактичних тестів

У впровадженні тестового контролю слід не забувати також про перевіряння якості тестів. Основними параметрами якості тестів в цілому вважають валідність і надійність.

Валідність тесту визначається, насамперед, тим, наскільки повно і точно тест охоплює матеріал навчальної програми (окремої або одночасно декількох тем), наскільки він відповідає навчальним планам. Звичайно у підсумковому тесті з дисципліни (теми) застосовують 5-7 запитань з кожної теми (кожного питання теми). Якщо при цьому загальна кількість тестів буде надмірною, тести розподіляють на декілька рівнозначних варіантів. У тестах не має бути жодного позапрограмного питання. Під валідністю також розуміють відповідність того, що проектувалося перевірити, і того, що було перевірено насправді. Інколи замість знань з конкретної дисципліни дидактичний тест перевіряє загальний кругозір, ерудицію. Неправильна організація дидактичного тестування, що обумовлює несамостійність виконання тесту, можливість списування відповідей призводить до того, що остаточна оцінка знову ж таки відображає не рівень знань учня, а його кмітливість, винахідливість, вміння оперативно здобути інформацію у важких умовах і т.п.

Для перевірки валідності тесту отримані за допомогою цього тесту дані порівнюються з аналогічними даними, отриманими іншим способом (наприклад, відповіді учня на тестові запитання порівнюються з наданими ним же відповідями на аналогічні запитання в усній доповіді). Висока кореляція (зв’язок) між цими показниками свідчить про валідність тесту. Інколи валідність тесту для оцінки якості професійної підготовки визначається також через значну кореляцію результатів тесту і подальшої успішної діяльності за фахом.

Бажано також виконувати основні вимоги до тестових завдань для забезпечення їх валідності100:

  1. кожне тестове завдання повинне виражати одну думку; якщо твердження складне, то формулювання необхідно скоротити або поділити на декілька пунктів;

  2. необхідно користуватися чіткою, зрозумілою мовою, не використовувати багатозначних понять, рідко вживаних слів, сленгу, діалектизмів;

  3. слід намагатися використовувати прості речення: не надто короткі та непомірно довгі;

  4. завдання повинні бути реально наближені до змісту предмета, з якого відбувається тестування;

  5. неправильні відповіді до тестових завдань повинні бути правдоподібні, мати реальне відношення до предмета, що визначається, щоб мінімізувати вгадування.

Надійність тесту полягає в тому, наскільки точно він може “виміряти” знання учнів. “Надійний” тест повинен показувати однакові або близькі результати при повторному обстеженні, в аналогічних групах. При потворному обстеженні тест повинний надавати аналогічні результати для сильних, посередніх і слабких за успішністю учнів. Крім того, надійний тест надає можливість максимально наблизити оцінки різних викладачів стосовно одного і того ж учня (відповідати середній оцінці). Інколи надійність тесту перевіряється також його розчепленням на дві частини (наприклад, за кратними і некратними номерами завдань) і перевіркою кореляції між ними - чим вищою буде кореляція, тим надійніший тест.

В оцінюванні якості педагогічного тесту проводять не тільки перевірку якості тесту в цілому, а також роблять якісний аналіз окремих тестових завдань. Для цього часто розраховують коефіцієнти складності і дискримінативності.

Індекс складності (важкості) тестових завдань (pj) показує відсоток випробуваних, що виконали певне завдання, і розраховується за формулою:

,

де Rj - кількість випробуваних, що виконали j-те завдання вірно; N - число випробуваних; j - номер завдання в тесті.

Чим більше значення показника тим легшим вважається завдання (тим більш випробуваних його виконали). Ідеальним для тестового завдання вважається індекс важкості 50...60 %, а прийнятним – коливання його від 30 до 70%.

Індекс дискримінативності (розрізнення) тестових завдань (rдис) показує здатність завдання диференціювати (розділяти) учнів на кращих і гірших та розраховується за формулою:

,

де L - число правильних відповідей на завдання у групі «кращих» учнів (1/3 учнів, що найкраще справилися з тестом в цілому), H – число правильних відповідей у групі «гірших» випробуваних (1/3 учнів, що найгріше справилися з тестом в цілому); n – загальне число випробуваних в обох групах; j - номер завдання в тесті.

Індекс дискримінативності може змінюватися від -1 до +1: значення +1 він приймає тоді, коли з завданням справилися всі «кращі» випробувані і не справився не один «гірший»; значення 0 – тоді, коли на тестове завдання відповіло однакову кількість випробуваних обох груп; значення – 1 індекс приймає в тих виняткових випадках, коли з завданням справилися всі «гірші» випробувані і не справився не один «кращий». Чим вище значення індексу дискримінативності, тим кращим вважається тестове завдання. Прийнято такі норми:

0,35 і вище

- відмінно складене завдання;

0,25 – 0,34

- добре складене завдання;

0,15 – 0,24

- погано складене завдання, його рекомендується переглянути;

нижче 0,15

- дуже погано складене завдання, його варто переглянути

Для одержання достовірних результатів варто провести дослідження в досить великій вибірці випробуваних (бажано не менш 20 осіб). При цьому випробуваними повинні бути учні з різними навчальними здібностями.

Після обчислення коефіцієнтів складності і дискримінативності тестові завдання переглядаються, усуваються питання з незадовільними значеннями індексів (у деяких випадках при незадовільному значенні індексу складності але задовільному індексі дискримінативности завдання можна залишити – воно дозволяє краще диференціювати «сильних» і «слабких» учнів усередині кожної категорії). Проводиться остаточний підрахунок балів за результатами тестування.