Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы психометрии.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
497.81 Кб
Скачать

Тема 7. Дискримінативність та валідність психодіагностичної методики.

Дискримінативність – це здатність тесту розрізняти випробовуваних з різною вираженістю вимірюваного психічного явища. Інакше кажучи, – це чутливість тесту.

Поняття дискримінативності тесту можна пояснити, проводячи аналогію з кімнатним термометром. Якщо вчора вам було жарко в квартирі, сьогодні вам холодно, але ваш термометр показує +21 два дні підряд, то або ви захворіли, або ваш термометр нечутливий інструмент вимірювання кімнатної температури.

Дискримінативність вимірюється за допомогою показника δ (дельта) Фергюсона і має максимальне значення δ=1 (при рівномірному розподілі) і мінімальне δ=0 (коли всі випробовувані отримали однакові оцінки).

Формула:

,

де N – кількість випробовуваних;

n - кількість завдань;

fi - частота зустрічаємості.

Обчислюємо так:

  1. Підрахувати, скільки разів зустрічається певне значення тесту (fi);

  2. Звести ці числа в квадрат і підсумувати (Σfi2);

  3. Додати одиницю до кількості завдань (n+1);

  4. Звести в квадрат кількість випробуваних (N2);

  5. Помножити кількість завдань на N2 (nN2)

  6. Розрахувати всі значення по формулі.

Наприклад, якщо за результатами апробації тесту, що складається з 5 питань, отримані такі дані: «1; 2; 3; 4; 4; 3; 1; 2; 2; 3», то N =10, n=5, а Σfi2 підраховуємо так:

Оцінка

fi

fi2

1

2

4

2

3

9

3

3

9

4

2

4

Σfi2 =

26

Тепер підставимо значення у формулу:

0,89

Інтерпретація: Чим вище значення δ Фергюсона, тим вищою є дискримінативність. Проте, оскільки дискримінативність, що дорівнює одиниці, свідчить про прямокутний, а не нормальний, розподіл, то високі показники дискримінативності є протилежними до показників надійності. Адже чим ширше перелік проявів властивості, що вивчається, тим нижче взаємна кореляція між завданнями тесту.

У цілому, значення достатньої дискримінативності варіює від 0,5 до 0,8 балів.

Валідність тесту. Найточніший еквівалент цього поняття — «обґрунтованість» (О.Г.Шмельов). Валідність є необхідною властивістю наукових вимірювальних тестів.

Кожна методика призначена для вимірювання певної властивості, що й визначає її зміст. Відомості про ступінь, в якому тест дійсно вимірює те, для чого він призначений, належать до поняття валідності (А.Анастазі).

Наприклад, методика "Кільця Ландольта" призначена для вимірювання таких властивостей уваги, як концентрація, переключення. В психології існують визначення понять концентрації уваги і його перемикається. Вважається, що висновки, сформульовані на підставі результатів тестування за допомогою "Кілець Ландольта", цілком відображають зміст визначень цих властивостей уваги. Значить, ця методика дійсно вимірює те, для чого вона призначена.

Якщо тест не валідний (або вона не доведена), то ми просто не знаємо, що він вимірює насправді.

Отже, валідність – це здатність тесту вимірювати саме те, що він повинен вимірювати за задумом творців.

Як ви вже здогадалися вимірювання ступеню валідності тесту полягає у розрахунку коефіцієнту кореляції його даних. Але кореляції з якими відомостями? Річ у тому, що існує безліч різних способів доказу валідності тесту. Ці способи розглядаються в науковій літературі як види валідності. Розглянемо їх:

1. Конкурентна валідність оцінюється за мірою корельованості результатів тестування з результатами інших тестів, спрямованих на вивчення того ж психологічного феномена, валідність яких встановлена. З іншого боку, він не повинен корелювати з тестами, що вимірюють сторонні психологічні змінні.

2. Прогностична валідність оцінюється за мірою корельованості результатів тестування з іншим критерієм, але в більш пізній час (наприклад: показники інтелекту в 11 років з шкільною успішністю в 16 років).

3. Змістовна валідність виявляє, наскільки зміст тесту вимірює всі можливі поведінкові ознаки відповідного психічного явища. Її доводять шляхом аналізу наукової літератури, присвяченої понятійним і емпіричним індикаторам вимірюваного психічного явища, з подальшим зіставленням пунктів тесту з переліком цих індикаторів.

4. Очевидна (або зовнішня) валідність, згідно з якою тест очевидно валідний, якщо про нього складається враження, що він вимірює саме те, на що він спрямований, особливо з погляду випробовуваних.

5. Конструктна валідність досягається шляхом формулювання і перевірки гіпотез про зв'язок результатів тестування з іншими тестами з урахуванням того, що відомо про даний психічний феномен (наприклад, тест повинен позитивно корелювати з ..., негативно - з.., кореляції відсутні з ... тощо).

Чи пов’язані між собою валідність і надійність?

Тест може бути надійним, але не валідним. Це буде означати, що він вимірює якусь властивість дуже точно, але яку саме – залишається невідомим. В такій ситуації необхідна більш точна валідізація тесту, як змістовна, так і конкурентна.

Питання для самоконтролю:

1. В яких випадках дослідник звертається до розрахунку коефіцієнту α Кронбаха?

2. В яких випадках дослідник звертається до розрахунку коефіцієнту δ (дельта) Фергюсона?

3. Яка властивість тесту має назву «дискримінативність»?

4. Що означає у формулах обчислення дискримінативності тесту змінні «n», «fi»?

5. Що можна сказати про тест, якщо відомо, що значення показника дискримінативності δ становить 0,543 бала?

6. Чи важливо доводити очевидну валідність тесту?

7. Які з видів валідності не обов’язково визначати при розробці тесту?

Завдання для самостійної роботи:

1. Користуючись індивідуальними результатами, отриманими по шкалі «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» В.В.Бойко (додаток Б) розрахуйте коефіцієнт δ Фергюсона.

2. Подайте характеристику дискримінативності цієї шкали.

3. Сформулюйте гіпотезу про взаємозв’язок результатів шкали «Невміння управляти емоціями, дозувати їх» з методики «Що вам заважає встановлювати контакти з партнерами за допомогою емоцій» В.В.Бойко (додаток Б) з оцінками по шкалам методики «Діагностика емоційної зрілості» О.Я.Чебикіна (додаток А).

4. Перевірте висунуту гіпотезу. Який тип валідності тесту Ви перевіряли? Чи валідною виявилася шкала «Невміння управляти емоціями, дозувати їх»?

Література

1. Клайн П. Справочное руководство по конструированию тестов.- Киев: ПАН Лтд., 1994.- 288 с.

2. Анастази А. Психологическое тестирование. Пер. с анг. В 2 кн. /Под ред. К.М.Гуревича, В. М. Лубовского – М.: Педагогика, 1982.

3. Практикум по психодиагностике. Дифференциальная психометрика/ Под ред. В.В.Столина, А.Г.Шмелева. - М.: Изд-во МГУ, 1984

4. Миронова Е.А. Дискриминативность как показатель качества тестовых заданий //Международная конференция-выставка "ИТО-2003" – М., 2003.

5. Гильбух Ю.З. Проблема валидности эксперимента в психологии // Психологический журнал. – 1987. - № 4. – С.117-125

6. Общая психодиагностика / Под ред. Столина В. В., Бодалева А. А. - М.: МГУ, 1987. - С. 60