- •Програма дисципліни “основи психометрії”
- •Теми практичних занять
- •Зміст програмного матеріалу за темами Тема 1. Вступ до психометрії
- •Тема 2. Параметри розподілу ознак
- •Тема 3. Зміст методичного дослідження з конструювання психологічних тестів
- •Тема 4. Конструювання завдань для тестів інтелекту та досягнень
- •Тема 5. Конструювання пунктів особистісного опитувальника
- •Тема 6. Перевірка психодіагностичної методики на надійність
- •Тема 7. Дискримінативність та валідність психодіагностичної методики.
- •Тема 8. Аналіз завдань тесту
- •Тема 9. Стандартизація тесту. Оформлення звіту про результати методичного дослідження
- •Плани практичних занять та методичні рекомендації до їх виконання Практичне заняття № 1. Параметри розподілу ознак
- •Хід заняття:
- •Практичне заняття № 2. Конструювання тестів різних видів
- •Хід заняття:
- •Практичне заняття № 3. Перевірка психодіагно-стичної методики на надійність
- •Хід заняття:
- •Практичне заняття № 4. Дискримінативність та валідність психодіагностичної методики
- •Хід заняття:
- •Практичне заняття № 5. Аналіз завдань тесту
- •Хід заняття:
- •Практичне заняття № 6. Стандартизація тесту. Звіти про результати методичного дослідження
- •Хід заняття:
- •Методичні рекомендації до індивідуальної роботи студентів
- •Оцінювання результатів роботи студентів
- •Розподіл балів, що присвоюється студентам за модулем «Основи психометрії»
- •Критерії присвоєння балів студентів
- •Література Основна:
- •Додаткова:
- •Ресурси:
- •Короткий термінологічний словник
- •Додатки Додаток а Індивідуальні дані показників за методикою „Діагностика емоційної зрілості” о.Я. Чебикіна
- •Додаток б Індивідуальні дані показників за шкалою «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» в.В.Бойко
- •Додаток в Результати аналізу завдань шкали «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» в.В.Бойко
- •Додаток д Приклади виконання індивідуальної роботи студентів Методика «Оптимист ли Вы?»
- •Оптимист ли вы?
- •Визначення домінуючих мотиваційних станів
- •Основи психометрії Навчально-методичний посібник
Тема 7. Дискримінативність та валідність психодіагностичної методики.
Дискримінативність – це здатність тесту розрізняти випробовуваних з різною вираженістю вимірюваного психічного явища. Інакше кажучи, – це чутливість тесту.
Поняття дискримінативності тесту можна пояснити, проводячи аналогію з кімнатним термометром. Якщо вчора вам було жарко в квартирі, сьогодні вам холодно, але ваш термометр показує +21 два дні підряд, то або ви захворіли, або ваш термометр нечутливий інструмент вимірювання кімнатної температури.
Дискримінативність вимірюється за допомогою показника δ (дельта) Фергюсона і має максимальне значення δ=1 (при рівномірному розподілі) і мінімальне δ=0 (коли всі випробовувані отримали однакові оцінки).
Формула:
,
де N – кількість випробовуваних;
n - кількість завдань;
fi - частота зустрічаємості.
Обчислюємо так:
Підрахувати, скільки разів зустрічається певне значення тесту (fi);
Звести ці числа в квадрат і підсумувати (Σfi2);
Додати одиницю до кількості завдань (n+1);
Звести в квадрат кількість випробуваних (N2);
Помножити кількість завдань на N2 (nN2)
Розрахувати всі значення по формулі.
Наприклад, якщо за результатами апробації тесту, що складається з 5 питань, отримані такі дані: «1; 2; 3; 4; 4; 3; 1; 2; 2; 3», то N =10, n=5, а Σfi2 підраховуємо так:
Оцінка |
fi |
fi2 |
1 |
2 |
4 |
2 |
3 |
9 |
3 |
3 |
9 |
4 |
2 |
4 |
Σfi2 = |
26 |
|
Тепер підставимо значення у формулу:
0,89
Інтерпретація: Чим вище значення δ Фергюсона, тим вищою є дискримінативність. Проте, оскільки дискримінативність, що дорівнює одиниці, свідчить про прямокутний, а не нормальний, розподіл, то високі показники дискримінативності є протилежними до показників надійності. Адже чим ширше перелік проявів властивості, що вивчається, тим нижче взаємна кореляція між завданнями тесту.
У цілому, значення достатньої дискримінативності варіює від 0,5 до 0,8 балів.
Валідність тесту. Найточніший еквівалент цього поняття — «обґрунтованість» (О.Г.Шмельов). Валідність є необхідною властивістю наукових вимірювальних тестів.
Кожна методика призначена для вимірювання певної властивості, що й визначає її зміст. Відомості про ступінь, в якому тест дійсно вимірює те, для чого він призначений, належать до поняття валідності (А.Анастазі).
Наприклад, методика "Кільця Ландольта" призначена для вимірювання таких властивостей уваги, як концентрація, переключення. В психології існують визначення понять концентрації уваги і його перемикається. Вважається, що висновки, сформульовані на підставі результатів тестування за допомогою "Кілець Ландольта", цілком відображають зміст визначень цих властивостей уваги. Значить, ця методика дійсно вимірює те, для чого вона призначена.
Якщо тест не валідний (або вона не доведена), то ми просто не знаємо, що він вимірює насправді.
Отже, валідність – це здатність тесту вимірювати саме те, що він повинен вимірювати за задумом творців.
Як ви вже здогадалися вимірювання ступеню валідності тесту полягає у розрахунку коефіцієнту кореляції його даних. Але кореляції з якими відомостями? Річ у тому, що існує безліч різних способів доказу валідності тесту. Ці способи розглядаються в науковій літературі як види валідності. Розглянемо їх:
1. Конкурентна валідність оцінюється за мірою корельованості результатів тестування з результатами інших тестів, спрямованих на вивчення того ж психологічного феномена, валідність яких встановлена. З іншого боку, він не повинен корелювати з тестами, що вимірюють сторонні психологічні змінні.
2. Прогностична валідність оцінюється за мірою корельованості результатів тестування з іншим критерієм, але в більш пізній час (наприклад: показники інтелекту в 11 років з шкільною успішністю в 16 років).
3. Змістовна валідність виявляє, наскільки зміст тесту вимірює всі можливі поведінкові ознаки відповідного психічного явища. Її доводять шляхом аналізу наукової літератури, присвяченої понятійним і емпіричним індикаторам вимірюваного психічного явища, з подальшим зіставленням пунктів тесту з переліком цих індикаторів.
4. Очевидна (або зовнішня) валідність, згідно з якою тест очевидно валідний, якщо про нього складається враження, що він вимірює саме те, на що він спрямований, особливо з погляду випробовуваних.
5. Конструктна валідність досягається шляхом формулювання і перевірки гіпотез про зв'язок результатів тестування з іншими тестами з урахуванням того, що відомо про даний психічний феномен (наприклад, тест повинен позитивно корелювати з ..., негативно - з.., кореляції відсутні з ... тощо).
Чи пов’язані між собою валідність і надійність?
Тест може бути надійним, але не валідним. Це буде означати, що він вимірює якусь властивість дуже точно, але яку саме – залишається невідомим. В такій ситуації необхідна більш точна валідізація тесту, як змістовна, так і конкурентна.
Питання для самоконтролю:
1. В яких випадках дослідник звертається до розрахунку коефіцієнту α Кронбаха?
2. В яких випадках дослідник звертається до розрахунку коефіцієнту δ (дельта) Фергюсона?
3. Яка властивість тесту має назву «дискримінативність»?
4. Що означає у формулах обчислення дискримінативності тесту змінні «n», «fi»?
5. Що можна сказати про тест, якщо відомо, що значення показника дискримінативності δ становить 0,543 бала?
6. Чи важливо доводити очевидну валідність тесту?
7. Які з видів валідності не обов’язково визначати при розробці тесту?
Завдання для самостійної роботи:
1. Користуючись індивідуальними результатами, отриманими по шкалі «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» В.В.Бойко (додаток Б) розрахуйте коефіцієнт δ Фергюсона.
2. Подайте характеристику дискримінативності цієї шкали.
3. Сформулюйте гіпотезу про взаємозв’язок результатів шкали «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» В.В.Бойко (додаток Б) з оцінками по шкалам методики «Діагностика емоційної зрілості» О.Я.Чебикіна (додаток А).
4. Перевірте висунуту гіпотезу. Який тип валідності тесту Ви перевіряли? Чи валідною виявилася шкала «Невміння управляти емоціями, дозувати їх»?
Література
1. Клайн П. Справочное руководство по конструированию тестов.- Киев: ПАН Лтд., 1994.- 288 с.
2. Анастази А. Психологическое тестирование. Пер. с анг. В 2 кн. /Под ред. К.М.Гуревича, В. М. Лубовского – М.: Педагогика, 1982.
3. Практикум по психодиагностике. Дифференциальная психометрика/ Под ред. В.В.Столина, А.Г.Шмелева. - М.: Изд-во МГУ, 1984
4. Миронова Е.А. Дискриминативность как показатель качества тестовых заданий //Международная конференция-выставка "ИТО-2003" – М., 2003.
5. Гильбух Ю.З. Проблема валидности эксперимента в психологии // Психологический журнал. – 1987. - № 4. – С.117-125
6. Общая психодиагностика / Под ред. Столина В. В., Бодалева А. А. - М.: МГУ, 1987. - С. 60
