Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глазунов Осн ор м-ва.doc
Скачиваний:
75
Добавлен:
23.03.2015
Размер:
868.35 Кб
Скачать

8.2. Тестування як метод перевірки й оцінки знань студентів

У світовій практиці при підготовці фахівців досить широко застосовують такий спосіб педагогічного контролю виміру характеристик особи­сто­сті суб'єкту навчання як тести досяг­­­нень – псиході­агно­сти­чні мето­д­и­ки вимірювання та оцінювання досягнутого рівня розвитку здіб­но­с­тей, умінь та знань.

Тести досягнень (на відміну від широко відомих тестів інте­ле­кту) відзеркалюють не стільки вплив накопиченого досвіду і загаль­н­их здібностей на поведінку та розв'язання тих чи інших завдань, скі­ль­ки вимірюють вплив спеціальних програм навчання, професійної та іншої підготовки на ефективність навчання тому чи іншому ко­м­п­лексу знань, формування різних спеціальних умінь.

Тести досягнень належать до найбільш багаточисельної (через кількість конкретних тестів та їх різноманітність) групи психодіагностичних методик. До них належить і педагогічний тест.

Під педагогічним тестом розуміється система взаємо­­­пов'язаних предметним змістом завдань специфічної форми, що дозволяють оцінювати структуру і вимірювати рівень знань та інші характе­ристики особистості.

Педагогічне тестування має відповідати принципам справедливості й гласності, науковості і ефективності.

Принципи справедливості і гласності є близькими за змістом прин­ци­пу об'єктивності. Вони реалізується шляхом відкритості всіх ета­пів і результатів педагогічного контролю, прозорістю й одноманітністю застосування методик тестування до всіх без винятку суб'єк­т­ів навчального процесу, а також мож­­­ливістю перевірки їх резуль­та­тів.

Принципи науковості і ефективності реалізуються шляхом побудови системи контролю на основі науково розробленої теорії тесту­вання, що забезпечує оптимальне співвідношення між досяг­­­нутим ефектом і сукупними витратами часу та коштів.

Науковість педагогічного контролю передбачає відповідність тестів певним критеріям оцінки якості методів вимі­рю­ва­н­ня, найважливішими з яких є об’єктивність, надійність, валідність, точність.

Виміри вважаються об’єктивними, якщо вплив суб’єк­ти­в­них дій тих, хто вимірює, є мінімальним. Іншими словами, виміри об’є­к­­­ти­в­ні в тому випадку, коли результати цих вимірів макси­ма­ль­но незалежні від дослідників. Це означає, що різні дослід­ни­ки, ви­мі­рюючи одну й ту ж характеристику, мають одержувати од­на­ковий результат. Щоб звести до мінімуму вплив суб'єктивних факторів, необхідна максимальна стандартизація умов проведення вимірювання та ана­лі­зу його результатів. До стандартизації висуваються такі вимоги:

— об'єктивність проведення вимірювання, що вимагає для всіх, хто підлягає іспитові, однакових умов проведення іспиту. Для цього стандартизується сам процес вимірювання. Тільки тоді, коли витри­мано однакові умови експерименту, результати вимірювання можна порівнювати між собою;

— об'єктивність обробки даних, що вимагає фіксації даних, їх накопичення, аналіз та збереження;

— об'єктивність інтерпретації результатів, що вимагає однако­вої інтерпретації одних і тих ж результатів вимірів різними дослід­никами. Це можливо лише за умови існування теоретичної конце­пції, яка лежить в основі даного методу. вимірювання та оціню­вання. У межах цієї теорії існують алгоритми аналізу та критерії, які є основою інтерпретації результатів. Таким чином, досліднику нада­ється можливість прийняти єдине правильне рішення, яке є оптима­льним у межах прийнятої теоретичної концепції.

Надійність методу вимірювання – це ступінь стійкості резу­ль­та­т­ів, що впливає на точність, з якою можна виміряти ту чи іншу ко­н­­­кретну ознаку. Перевірка надійності методу стосується насамперед відновлення результатів при повторних вимірах. Ступінь надійності методу визначається за допомогою коефіцієнта надійності.

Коефіцієнт надійності дорівнює коефіцієнту кореляції між ре­зультатами, які одержані однаковим методом та за однакових умов. Він показує, наскільки збігаються результати вимірів, які прове­дені в однакових умовах. Ступінь надійності методу залежить від об’єктивності методу, параметрів засобу вимірювання, стабільності характеристики, яку вимірюють.

Отже, при забезпеченні об'єктивності методу коефіцієнт надій­ності пропорційно залежить від характеристик засобу вимірювання, які визначають точність, з якою може вимірюватися той чи інший параметр. Точність вимірювання, згідно з теорією помилок, визна­чає значення помилки величини, яка вимірюється. Так, чим більша точність методу, тим менша помилка при вимірюванні й тим більша надійність цього методу.

Не можна не звернути уваги на необхідність стабільності характеристики, яка вимірюється. Особливо це стосується педа­гогічних вимірювань, оскільки ознаки, які в них досліджуються, є лабільними (нестійкими). Вони певною мірою залежать від багатьох внутрішніх та зовнішніх чинників, зокрема фізичного стану особи, яка проходить вимірювання.

Для контролю надійності тесту і якості засвоєння знань створюються групи ("батареї") тестів одного і того ж рівня.

Валідність методу – це комплексна характеристика, яка визначається як параметрами засобу та процедурами вимірювання, так і властивостями ознаки, яка досліджується.

Таким чином, валідність методу – це відповідність того, що вимірюється даним методом, тому що він повинен вимірювати. Отже, цей критерій встановлює сферу дійсності, для якої метод дає статистично ймовірні результати. Якщо мова йде про тестування діяльності певного рівня, то квалі­фі­ка­ційні завдання, що пропону­ють­ся в тесті, повинні відповідати са­ме такому рівню складності, тобто їх не можна виконати засобами ді­­я­­ль­ності більш низького рівня. При цьому говорять про функ­ці­о­нальну валідність тесту.

Валідність методу при вимірюванні успішності можна диференціювати за такими кри­теріями: валідність змісту, валідність відповідності й валідність прогнозу.

Валідність змісту – це відповідність вимог до змісту. Напри­клад, при вимірюванні успішності зміст навчання визначається нав­ча­льним планом та методом навчання, а вимоги визна­ча­ю­ться пере­ліком необхідних знань, умінь та навичок, які студент повинен мати, закінчивши навчання. Звичайно, що пору­шення пари­тету міх вимо­г­а­ми та змістом навчання приведе до порушення досто­ві­рності резу­ль­татів вимірювання, навіть якщо метод відповідатиме першим двом критеріям – об'єктивності та надійності.

Валідність відповідності – це відповідність результатів вимірювання та оцінювання однієї ознаки різними методами. Звичайно, одержані за новим методом результати, треба порівнювати з еталонним. Якщо такий еталонний метод відсутній, а існуючі методи не задовольняють критеріям якості, визначати валідність нового методу виходячи виключно з того, наскільки він відповідає методу, який застосовувався раніше, є не тільки методично неправильним, а й таким, що гальмує пошук більш досконалих методів.

Валідність змісту та відповідності називають ще емпіричною валідністю, статистичним показником якої є коефіцієнт валідності. Він визначається як коефіцієнт кореляції між результатами вимірю­в­а­ння певної характеристики методами, який досліджується, та ета­ло­нним методом. Але, як визначалося раніше, відсутність дійсно еталонного методу суттєво зменшує інформаційну цінність цього коефіцієнту.

Валідність прогнозу – це відповідність результатів, одержаних у даному експерименті, тим, які прогнозувалися на основі попере­д­нього експерименту. Валідність прогнозу безумовно визначає валід­н­ість методу, але вона більшою мірою залежить від динамічних змін характеристики, яка досліджується.

Кожний метод вимірювання залежно від інструментарію дає можливість отримати результати лише з певною обмеженою та чітко визначеною точністю, яка характеризує ступінь коливання па­р­а­метру, що вимірюється. Точність методу вимірювання визначає мінімальну або си­стематичну помилку, з якою можна провести вимірювання даним ме­тодом. Теорія помилок виходить з того, що при усуненні інших систематичних помилок коливання результатів вимірювання підпорядковуються статистичним закономірностям. Це дозво­ляє розрахувати кі­лькісно міру точності та врахувати її далі.

Критерії оцінки якості методів вимірювання, що перераховані вище, є необхідни­­­ми, але недостатніми критеріями ефективності педагогічного контролю. Ок­рім них ефективність значною мірою за­ле­жить від організації ко­н­­тролю, забезпеченості вищими навчальними закладами технічними і методич­­­ними засобами. Еф­е­ктивний контроль знань залежить також і від відповіді на най­б­і­льш важке питання – що таке знання предмета? Вирішення цього питання підводить викладача–розроб­ника тестів до формування певного образу, якому повинні задово­ль­ня­ти всі суб'єкти навчання, яких мо­ж­на було б віднести до тих, хто знає цей предмет. Такий образ до­­помагає відбору відповідного ма­­­теріалу–змісту, який уже у вигляді тестових завдань необхідно подати в певній канонічній формі.

Оцінка знань за допомогою формалізованих тестів у порівнянні з традиційним усним іспитом має ряд переваг: об’єктивність – правильна відповідь на кож­­­не з питань тесту заздалегідь установлюється комісією розроб­­­лювачів; перевірка великого обсягу знань одночасно в усіх екза­­­мено­ваних за відносно невеликий період часу; можливість машинної обробки, обробка результатів тестування і на­­­явність шкали оцінок.

Але тестовий іспит має і певні недоліки: складання тестових завдань потребує певної кваліфікації; вибіркові відповіді можуть мати еле­­­мент підказки;  тестові питання дозволяють досить надійно перевірити знання, а рівень сформованості умінь, професійного мислення майбутнього фахівця за допомогою педагогічних тестів можна перевірити тільки опосеред­ко­вано. Тому формалізований тестовий іспит є одним з методів, які використо­в­у­ються в ком­­­лексній оцінці компетентності тих, хто навчається.

Психологи вважають, що в умовах тестування рівень екзаменаційного хвилювання в тих, хто навчається, нижчий, ступінь уважності вищий, фізіологічні характеристики стану організму більш сприятливі. Перевагою тестового іспиту є уніфіка­ція вимог, застосування єдиного критерію і норм оцінки, економія часу тих, хто складає іспит, і викладачів.

Треба нагадати, що слово "тест" у перекладі з англійської мови означає "випро­бовування". Застосування тестів вимагає своєї методики, тому ефек­тивність тут прямо пов'язана з умінням укладати тести, оцінювати відповіді і т.д.

У нашому суспільстві до середини 30–х років тести досить широко застосовувалися в навчальних закладах, особливо в середній школі. Фахівці в галузі педології (науки про дитину) активно застосовували тестування для визначення розумових здібностей учнів. У 1936 році педологія була оголошена воро­жою буржуазною наукою, а тести – реакційними. Треба зазначити, що прийняттю такого рішення "сприяли" не тільки відома тенденційність влади, але й "претензії" окремих педоло­гів на те, що саме вони висловлюють "істину" про дитину і дитинство.

У середині 80–х років була здійснена спроба ввести суцільне тестування у вищих навчальних закладах. Однак через брак надійних тестів і відповідних фа­хівців ця спроба виявилася невдалою.

На сучасному етапі розвитку вищої школи в Україні тести застосовуються все ширше. Проведення тестування вимагає професійного став­лення, тобто необхідні загальні й конкретні методичні наробки.

Досить часто посилаються на зарубіжний досвід використання тестів. Необхідно зазначити, що ті чи інші країни мають свої традиції застосування тестів. Так, американський педагог і діяч освіти Адам Дреер указує на те, що структуру оцінки учня (середньої школи) мають складати не тільки підраху­нок балів за виконані тести, але й якість письмових робіт, інших самостійних завдань, усні відповіді в класі і т.д. (Див.: Дреер А. Преподавание в средней школе США. – М.:Прогресс,І983.– С.230–231). При цьому він підкреслює, що не може бути раз і назавжди встановленої питомої ваги кожного виду навчальної роботи при виведенні підсумкової оцінки, оскільки є різниця у викладанні конкретних предметів (наприклад, хімії, іноземної мови, історії тощо), а також є різні педагогічні підходи до викладання. У кінцевому ре­зультаті, на його думку, питома вага кожного виду занять у під­сумковій оцінці має визначатись самим учителем, тобто сам викла­дач визначає складові оцінки, а потім визначає їх вагу. У вказа­ній публікації наводиться можливі компоненти підсумкової оцінки, яка становить 100%: підсумкові іспити – 30%; контрольні тести – 30%; виконання домашніх завдань – 10%; усні відповіді – 10%; спеціальні завдання–проекти – 10%; короткі самостійні роботи – 10%.

У школах деяких європейських країн учитель після чергової перевірки знань і вмінь учнів виставляє 20% п'ятірок, 30% четвірок, 30% трійок і 20% двійок. Причому в його роботі незалежно від рівня підготовки класу в цілому і окремих учнів це співвідношення оцінок залишається постійним. Таким способом розвивається суперництво дітей, насаджується дух конкуренції, що виключає допомогу дітей один одному при складанні іспитів (Коротов В.М. Общая методика учебно–воспитательного процесса. –М.:Просвещение,І983. – С.І35.).

Ефективність будь–якого педагогічного методу (“як”) у значній мірі залежить від того, який предмет ("що") викладається. Наприклад, важливими ри­сами соціальних знань є багатоплановість, складність соціологічних понять; наявність альтернативних підходів до характеристики соціальних явищ; можливість вибору якоїсь концепції, парадигми.

Загалом можна скласти таку типологію тестів:

1. Формалізовані тести, які передбачають однозначні відповіді. Сильними сто­ронами цього підходу є: а) низький елемент суб’єктивності, оскільки на кожне питання може бути тільки одна відповідь; б) тести з однозначною відповіддю не займають багато часу, і тому можна закладати значну кількість питань. Отже, об'єктивність при підрахунку результатів і широке охоплення матеріалу – основні переваги тестів даного типу. Слабкі сторони: позбавлення студента самовираження, демонст­рації уміння синтезувати матеріал.

2. Тести, які передбачають розгорнуті нестандартні відповіді. Переваги: а)добре виявляє певні розумові процеси (синтезувати, порівнювати, протиставляти, інтерпретувати, оцінювати); б) досить активні зусилля з боку студента, оскільки вся відповідь укладається самостійно ; в) вироблення уміння письмово викладати свої думки. Недосконалість таких тестів полягає передусім у суб’єктивності оцінювання. Адже якщо питання передбачає кілька правильних варіантів, відповідей, то викладачу важко знайти об'єктивний критерій для оцінки кожної від­повіді, відповідь студента учня може не співпадати з упередженою думкою викладача; б)виконання такого тесту вимагає багато часу, тому можна задавати тільки кілька питань; в) на оцінку може повпливати думка викладача про даного студента, настрій викладача, ступінь втоми тощо.

3. Комбіновані тести: значна кількість однозначних питань із вклю­ченням "творчих" питань.

Для виявлення фактичного матеріалу краще застосовувати однозначні тести. Для перевірки глибини знань ліпше використовувати "творчі" тести.

Загальні технологічні правила формулювання тестових завдань:

1) необхідно формулювати зрозумілі, недвозначні питання (завдання);

2) завдання мають відображати конкретні, а не загальні аспекти ділянки знань;

3) необхідно уникати емоційного забарвлення тесту, адже воно може розкрити ставлення до питання викладача і таким чином спрямувати в певне русло відповідь студента.

Основними канонічними формами однозначних тестових завдань, які можуть бути рекомендовані, вважаються такі:

1) завдання закритої форми із запропо­­­нованими відповідями;

2) завдання відкритої форми з вільно конструйованими відповідями.

Тестові завдання закритої форми повинні складатися з трьох компонент:

а) інструкції до їх виконання;

б) запитальної (змістовної) частини;

в) відповіді(ей).

Форма подання текстових або графічних тестових завдань (задач) повинна задовольняти певним рекомендаціям психологів.

­­1. Декілька тестових завдань однакової форми необхідно супроводжувати однією інструкцією до їх виконання. При зміні форми тестових завдань необхідна нова відповідна інструкція. Такі інструкції викладаються на всіх екземплярах тестів, щоб студенти могли звіритися в будь–який момент.

2. Текст інструкції повинен відрізнятися від основного тексту (через інший шрифт або яскравий колір тощо) та відокрем­­­люватися від тестових завдань двокрапкою.

3. Тестові завдання нумеруються арабськими цифра­­­ми, причому нумерація тестових завдань різної форми безперерв­­­на.

4. Запитальна частина тестового завдання записується тіль­­­ки у стверджувальній формі, стисло й чітко, уникаючи двознач­­­ності.

5. Запитальна частина тестового завдання виділяється вели­­­кими літерами або активним кольором.

6. Власну нумерацію мають елементи відповіді тестового завдання.

7. Відповідь та запитальна частина не відокремлюється роз­­­діловим знаком "крапка".

8. Вiдповiдь тестового завдання розташовується під запи­­­тальною частиною симетрично.

9. Якщо вiдповiдь передбачає певну обчислювальну процеду­­­ру, то вона повинна бути не складною (по можливості без засто­­­сування технічних засобів).

Тестовi завдання закритої форми розрiзняються за принци­­­пом побудови відповіді:

1. Альтернативнi тестовi завдання, які передбачають на­­­явність двох варіантів організації відповіді тестового завдан­­­ня (типів "так" – "ні"; "правильно" – "неправильно") тощо. Як правило, їх використовують для грубої перевірки пра­­­вильності вибору або прийняття рішення в згорнутій формі.

2. Тестові завдання з множинним вибором. Вони передба­­­чають принаймні три можливі відповіді (але не більше п'яти). Цей тип тестових завдань використовується у тих випадках, коли із запропонованих декількох відповідей лише одна є пра­­­­­вильною. При розробці таких завдань виникають труднощі у виборі правдоподібних варіантів відповідей, які повинні виглядати дос­­­татньо прийнятими як правильні. Завдання такого типу доцільно використовувати в тих випадках, коли необхідно перевірити умін­­­ня щодо правильного відтворення отриманих завдань.

Завдання з множинним вибором у свою чергу діляться на види згідно з принципом підбору правильних та правдоподібних відпо­­­відей:

— тестові завдання, що побудовані за принципом відновлення відповідної частини;

— тестові завдання на відповідність;

— тестові завдання на порівняння і протиставлення (на аналіз взаємозв’язку);

— тестові завдання на визначення причинової залежності;

— тестові завдання на відтворення правильної послідовності.

Тестові завдання, побудовані за принципом запитань з мно­­­жинними відповідями "правильно" – "неправильно", використовуються в си­­­туаціях, коли відповіді або рішення можуть бути тільки правильними або неправильними, і не мають жодних відтінків переваги, а навпаки, є категоричними. Крім того, досить часто на запро­­­поноване запитання існує декілька правильних відповідей. У та­­­ких ситуаціях вважається, що тестується глибина знань, розумін­­­ня різних аспектів явищ, процесів тощо. В інструкції обов’язково вказується правило вибору відпо­­­віді.

Тестові завдання відкритого типупередбачають вільні від­­­повіді тих, хто тестується. Вони є завданнями без запропонова­­­них варіантів відповідей. Той, хто тестується, повинен викону­­­вати завдання згідно з власним баченням. По суті, тестове зав­­­дання відкритого типу являє собою твердження з невідомою змін­­­ною. Створення тестових завдань відкритого типу рекомендується розпочинати з постановки запитання. Далі формується повна і правильна відповідь таким чином, щоб ключове слово було на початку відповіді, а навчальний елемент, що ціка­­­вить нас, – у кінці. Завдання відкритого типу доцільно застосовувати для вияв­­­лення знань термінів, визначень, понять тощо.

Ідеально тестові завдання повинні розроблятися тим же самим авторським колективом, що і програма дисципліни. Кожне тестове завдання повинно пройти попередню експертизу:

— на ясність, стислість, чіткість та повноту думки, яку воно висловлює;

— важливість та нетривіальність думки, яку воно висловлює;

— відповідність за складністю і змістом до даного контингенту тих, хто навчається;

— відсутність загальних тверджень в основі запитання та в правильній відповіді;

— відсутність підказки.

Отже, при застосуванні тестування як методу перевірки й оцін­ки знань треба брати до уваги сучасний стан освіти в нашому суспільстві, тобто принципи існу­ючої освітньої системи, її традиції (тестування як один з компонентів системи контролю); загальні науково–методичні вимоги до складання тестів; адекватність, відповідність тестів внутрішньому змісту ("букві й духу") навчального предмета; необхідність забезпечення психологічного сприйняття студентами і викладачами тестування як складової навчального процесу.