Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекц 9-10 Статис Microsoft Word.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.05 Mб
Скачать

Статистичний критерій (хі-квадрат)

- це значення показника відповідності, яке застосовується там, де треба встановити ймовірність відповідності декількох відносних величин, пов'язаних між собою будь-якою ознакою, або там, де здійснюється перевірка припущення про наявність (відсутність) зв'язку між явищами (без виміру їх величин), звичайно, якщо такий зв'язок теоретично можливий. Саме тоді оцінка близькості двох розподілів може бути виявлена шляхом обчислення показника відповідності, що позначається .

Показник відповідності вказує на те, наскільки суттєва чи неістотна різниця між числами, зафіксованими у процесі статистичного дослідження і теоретично обчисленими («очікуваними») показниками на підставі припущення про відсутність зв'язку між досліджуваними явищами (на основі так званої нульової гіпотези). Його можна визначити, як критерій, що установлює відповідність між теоретичними й емпіричними частотами розподілу відповідних показників психодіагностичних вимірів.

Показник відповідності обчислюється за формулою:

, де (32)

- фактичні дані;

- очікувані дані.

Якби , то був би рівним нулю, а значить підтверджувалась би нульова гіпотеза про відсутність закономірного впливу досліджуваного фактора на отриману різницю в даних. Чим менше р відрізняється від , тим ближче величина до 0 і, навпаки, при більшій відмінності між р і буде більше, а значить і закономірність досліджуваного зв'язку більша.

Щоб установити істотність чи випадковість різниці , величину знаходять по “Таблиці значень ” .

При порівнянні враховується число ступенів свободи , що визначається за формулою:

, де (33)

s – число граф первинної таблиці (крім графи «разом»);

r – число рядків у таблиці (крім рядка «усього»).

Приклад. Проводиться кампанія проти паління. Дані про тих, що закурили і утрималися від паління (2 місяці) після проведеного курсу психотерапії наведені в таблиці.

Закурило

Не закурило

Разом

Пройшли психотерапію

56

6759

6815

Курс не проходили

272

11396

11668

Усього

328

18155

18483

Рішення.

1. Допустимо, що психотерапія не впливає на звичку палити. Тоді, звичайно, кількість курців і тих людей, які не палять повинна відповідати % паління всього обстеженого населення, тобто

.

2. Виявилося, що серед тих, які закурили і:

  • пройшли курс психотерапії чол.;

  • не проходили курсу 328-121=207 чол.

Які не закурили:

  • серед учасників курсу психотерапії 6815-121=6694 чол.;

  • серед не охвачених курсом терапії 11668-207=11461 чол.

  1. Зведемо це все в таблицю:

Зіставлення фактичних і очікуваних чисел

Учасники курсу психотерапії

Не обхвачені курсом психотерапії

Всього

Закурило

Не закурило

Закурило

Не закурило

Закурило

Не закурило

Фактичні числа

56

6759

272

11396

328

18155

«Очікувані числа»

121

6694

207

11461

328

18155

4. Обчислюємо за формулою:

5. Знаходимо : = (2 - 1) (2 - 1) = 1

6. Порівнюємо одержану величину з табличним значенням при =1. У даному прикладі отримана величина =56,2 значно перевищує числа, що знаходяться у рядку =1.

Висновки. Результат виглядає так: Р < 0,002, тобто ймовірність підтвердження «нульової гіпотези» (про відсутність зв'язку між психотерапією і порушенням звички до паління) дуже мала – менше 0,2%. Значить ефективність курсу психотерапії на зниження прихильників до паління підтверджується з довірчою ймовірністю Р > 99,8%.

Для нетабличного орієнтування в значенні можна користуватися формулою:

Якщо отримане число більше 3, то «нульова гіпотеза» вважається не підтвердженою. Якщо отримане число менше 3, то нульова гіпотеза вважається доведеною. Якщо отримане число більше 30, то в таблиці немає чисел, що дозволяють оцінити значимість величини . У таких випадках знаходять число k:

Оцінюється k у такий спосіб: якщо k = 1,64, то Р = 0,05; якщо k = 2,33, то Р = 0,01; якщо k > 2,33, то Р < 0,01.

Записується результат так: = 0,05 чи 0,01 > > 0,002.

При наявності не дуже великих чисел можна спростити обчислювальну роботу, використовуючи формулу:

, де (34)

і - кількість спостережень у кожному з порівнюваних рядів;

і - кількість спостережень у кожній групі.

Приклад. Досліджувалася працездатність на велоергометрі в залежності від потужності навантаження у людей різного віку. При цьому виходили з припущення, що вік не впливає на виносливість до навантаження (нульова гіпотеза).

Вік

+

10-19

6

2

8

160

132

28

98

20-29

27

8

35

640

594

46

60

30-39

24

7

31

560

528

32

33

40-49

15

3

18

240

350

-90

450

50-59

8

2

10

160

176

-16

26

Всього

80

22

102

-

-

-

667

Рішення. Підставляємо значення у формулу:

.

Число ступенів свободи: =(2 – 1) (5 – 1) = 4.

По таблиці значень видно, що в рядку = 4 знаходяться числа більші фактичного значення , тобто всі вони більші 0,38. Значить імовірність нульової гіпотези дуже мала – Р > 0,05. Тому можна зробити висновок, що не вік впливає на зниження витривалості до велоергометричного навантаження.

Критерій ітерацій у статистичному аналізі психодіагностичних матеріалів

Коли потрібно оцінити випадкова чи невипадкова послідовність значень у динамічному ряду показників, тобто якщо стоїть задача перевірити випадковість (закономірність) показників в одній сукупності ознак, то вирішується вона за допомогою так званого критерію ітерацій, серійного критерію для однієї сукупності.

Приклад. Обстежуючи 2 категорії туристів на сформовані установки щодо культурно-історичних цінностей давнини Франції та України методом семантичного диференціалу були зафіксовані слідуючи кваліметричні показники відносно ряду фіксованих об’єктів (культові споруди, адміністративні та інш.).

Категорії цінностей

СД

Число ітера-цій

Р

Україна

2,1

2,5

1,9

1,8

2,4

1,6

2,2

1,7

1,5

6

>0,05

Франція

1,5

1,2

2,1

1,7

1,3

1,8

2,0

1,9

1,0

>0,05

Оцінити, випадкові чи закономірні зміни в показниках СД окремо по Україні та по Франції.

Рішення. Україна.

СД

Число ітера-цій

Р

2,1

2,5

1,9

1,8

2,4

1,6

2,2

1,7

1,5

6

>0,05

6

9

5

4

8

2

7

3

1

+

+

-

-

+

-

+

-

-

1. Нумеруємо варіанти (показники) у послідовності збільшення ознаки (ранжируємо ряд).

2. Визначаємо медіану (середню варіанту при непарному ряді, а при парному ряді – напівсуму двох серединних варіант).

У нашому прикладі Ме = 1,9.

3. Порівнюємо кожну варіанту з Ме і позначаємо знаком «+», якщо величина показника більше, ніж Ме, і, навпаки, - знаком «-». Якщо варіанта дорівнює медіані, то знак ставиться шляхом жереба, тобто підкиданням монети.

4. Варіанти зі знаком «+» дають показник , а кількість ознак з «-» дають .

У даному випадку: = 4; = 5.

5. Підраховуємо, скільки ітерацій (чергувань, серій протилежних знаків) міститься в отриманому ряді знаків.

У даному випадку: з «+» на «-» поруч знаходиться 3 ітерації, а з «-» на «+» - 2. Значить 5 ітерацій.

6. Порівнюємо отримане число ітерацій (r) із критичними значеннями числа ітерацій при ймовірності Р = 0,05 ( ) з таблиці “Критичні значення r – числа ітерацій”. Ці значення знаходяться на перетині рядків і . У таблиці наведені критичні значення , у межах яких приймається нульова гіпотеза. Якщо винайдене число ітерацій знаходиться в межах критичних значень , то розташування варіант у ряді визнається випадковим. Якщо r менше першого чи більше другого табличного значення , то з імовірністю Р < 0,05 визнається справедливою протилежна гіпотеза, тобто порядок у ряді не випадковий, а обумовлений визначальними причинами.

У нашому прикладі: r = 6, = 4, = 5, = 3/9. Знайдене r потрапляє в межі 3 – 9, значить з Р > 0,05 приймається нульова гіпотеза, тобто зниження показників СД у ряду визначених цінностей України є випадковим і не залежить від будь-яких закономірних причин.