
- •Методичні вказівки та індивідуальні завдання для самостійної роботи з дисципліни
- •1 Теоретичні відомості та приклади розв’язання задач
- •1.1 Первинна обробка вибіркових даних
- •1.2 Точкові та інтервальні оцінки параметрів розподілу
- •1.3 Перевірка статистичних гіпотез
- •1.3.1 Перевірка гіпотези про математичне сподівання нормально розподіленої сукупності
- •1.3.2 Перевірка гіпотези про рівність дисперсій двох нормально розподілених сукупностей
- •1.3.3 Критерій Пірсона
- •1.4 Елементи теорії кореляції
- •1.5 Дисперсійний аналіз
- •2 Індивідуальні завдання
- •Література
1.3.3 Критерій Пірсона
Критерій
ґрунтується на порівнянні теоретичних
і емпіричних частот. Нехай область
реалізацій випадкової величини розбито
на k
інтервалів, частоти яких дорівнюють
Якщо гіпотеза про закон розподілу в
сукупності правильна, то можна обчислити
ймовірності
тобто ймовірність потрапляння випадкової
величини на i-й
інтервал. Теоретичні частоти потрапляння
нa цей інтервал можна розглядати як
математичне сподівання компонентів
випадкової величини, розподіленої за
поліноміальним законом:
Статистичною
характеристикою гіпотези є вибіркова
функція
Якщо
,
то вибіркова функція має розподіл
з
ступенями вільності, де r
–
кількість параметрів, оцінки для яких
знайдено за вибірковими даними. Критична
область для статистичної характеристики
правостороння.
Приклад
1.3.3
При відрахунках на шкалах вимірювальних
приладів цифри показів звичайно оцінюють
лише наближено у частках шкали. За рівня
значущості
потрібно перевірити гіпотезу про
рівномірний закон розподілу, скориставшись
наведеними в таблиці даними.
Цифра показу |
Частота,
|
Теоретична
частота,
|
Відхилення,
|
|
0 |
35 |
20 |
15 |
11,25 |
1 |
16 |
20 |
–4 |
0,8 |
2 |
15 |
20 |
–5 |
1,25 |
3 |
17 |
20 |
–3 |
0,45 |
4 |
17 |
20 |
–3 |
0,45 |
5 |
19 |
20 |
–1 |
0,05 |
6 |
11 |
20 |
–9 |
4,05 |
7 |
16 |
20 |
–4 |
0,8 |
8 |
30 |
20 |
10 |
5 |
9 |
24 |
20 |
4 |
0,8 |
Сума |
200 |
200 |
— |
24,9 |
Розв’язання.
Застосуємо критерій
Пірсона. Для обчислення значення
статистичної характеристики гіпотези,
яка перевіряється, у таблиці записані
теоретичні частоти
При цьому вважалось, що довільна цифра
має однакову ймовірність
,
тому усі значення теоретичних частот
У останньому стовпці таблиці знайдено
суму, яка дорівнює значенню вибіркової
функції
За таблицями розподілу
з 9 ступенями вільності
Критична область правостороння, і
фактичне значення вибіркової функції
належить їй. Тому гіпотеза рівномірності
розподілу відхиляється, що свідчить
про систематичні помилки при знятті
показань.
1.4 Елементи теорії кореляції
Якщо розглядаються дві випадкові величини, то між ними можуть бути такі форми залежності:
а)
функціональна залежність,
б) стохастична залежність, коли зі зміною значення однієї величини змінюється розподіл другої величини;
в) кореляційна залежність, коли умовне середнє значення однієї величини функціонально залежить від другої величини.
Нехай результати вибірки із двовимірної сукупності подано в табличній формі:
Х |
|
|
… |
|
|
|
|
|
|
… |
|
|
|
|
|
|
… |
|
|
|
… |
… |
… |
… |
… |
… |
… |
|
|
|
… |
|
|
|
|
|
|
… |
|
|
— |
|
|
|
… |
|
— |
— |
Якщо
розглядати таблицю за рядками, то кожному
значенню
відповідає деякий розподіл випадкової
величини
Обчислимо для цих розподілів умовні
середні значення
Отже,
Аналогічно, розглядаючи таблицю за
стовпцями, також визначаємо умовні
середні величини
,
Знову маємо залежність виду
Рівняння, які виражають умовні середні, називаються кореляційними рівняннями або рівняннями регресії другого роду. У кореляційному аналізі розглядаються такі задачі:
визначити за кореляційною таблицею форму залежності між випадковими величинами, тобто вид функціональної залежності
оцінити тісноту залежності, тобто визначити ступінь розсіювання можливих значень однієї випадкової величини відносно лінії регресії, якщо одна із величин набуває певних значень.
Для
визначення форми залежності між X
i Y
за результатами розрахунків у кореляційній
таблиці в системі координат XOY
відкладаємо точки
Якщо ці точки розміщені на лінії, яка
близька до прямої, то можна вважати, що
залежність має лінійний характер, тобто
рівняння регресії подається у вигляді
,
або аналогічно
За допомогою методу найменших
квадратів можна визначити коефіцієнти
рівнянь регресії:
Коефіцієнти
— коефіцієнти регресії. Отже, лінійні
рівняння регресії мають вигляд:
Лінії
регресії перетинаються в точці
яка називається центром
кореляції.
Тіснота зв’язку в разі лінійної
залежності оцінюється коефіцієнтом
кореляції. Коефіцієнтом
кореляції
випадкових величин
називається середнє геометричне значення
коефіцієнтів регресії, яке має знак
останніх:
Коефіцієнти регресії виражаються через коефіцієнт кореляції за такими формулами:
аналогічно
.
Тоді рівняння регресії мають вигляд:
.
Абсолютна
величина коефіцієнта кореляції не
перевищує одиницю. Якщо
,
то величини не пов’язані лінійною
залежністю, але при цьому між ними
можливий нелінійний кореляційний
зв’язок. Якщо r
зростає за абсолютною величиною від
нуля до одиниці, то тіснота зв’язку
зростає, і, якщо
то кореляційна залежність перетворюється
на функціональну і прямі регресії
зливаються в одну пряму. Обчислення
параметрів, які входять у рівняння
регресії, спрощується, якщо перейти до
умовних змінних і умовних моментів
розподілу.
Приклад 1.4.1 У результаті обстеження одержано статистичний розподіл 100 підприємств за виробничими фондами Х, млн грн, і добовим виробітком Y, т.:
Х |
10 |
15 |
20 |
25 |
30 |
35 |
|
50 |
2 |
2 |
|
|
|
|
4 |
60 |
2 |
4 |
5 |
6 |
4 |
|
21 |
70 |
|
2 |
7 |
12 |
10 |
4 |
35 |
80 |
|
|
|
10 |
10 |
6 |
26 |
90 |
|
|
|
8 |
|
6 |
14 |
|
4 |
8 |
12 |
36 |
24 |
16 |
100 |
Визначити форму залежності між X i Y, знайти рівняння ліній регресії і тісноту зв’язку.
Розв’язання.
Знаходимо умовні середні
і
Результати обчислень
перенесемо в таблицю. У ній перейдемо
до умовних змінних, узявши
v u |
–3 |
–2 |
–1 |
0 |
1 |
2 |
|
|
–2 |
2 |
2 |
|
|
|
|
4 |
12,5 |
–1 |
2 |
4 |
5 |
6 |
4 |
|
21 |
21,4 |
0 |
|
2 |
7 |
12 |
10 |
4 |
35 |
26 |
1 |
|
|
|
10 |
10 |
6 |
26 |
29,2 |
2 |
|
|
|
8 |
|
6 |
14 |
29,3 |
|
4 |
8 |
12 |
36 |
24 |
16 |
100 |
|
|
55 |
60 |
65,8 |
75,6 |
72,5 |
81,3 |
|
|
Для
визначення форм залежності
проаналізуємо, як змінюються умовні
середні зі зміною випадкових величин.
Зі зростанням х
умовна середня
також зростає, а при зростанні
умовна середня
в основному зростає. У системі координат
XOY
відкладемо множину точок
значком «
»
а множину точок
– значком «
»
(рис. 1.6).
Рисунок 1.6 – Графіки рівнянь регресії
Із рис. 1.6 бачимо, що кожна із груп побудованих точок розміщена приблизно на деякій прямій, дещо відхиляючись від неї. Рівняння прямих шукаємо у вигляді:
За даними останньої таблиці знаходимо умовні моменти розподілу:
Щоб знайти коефіцієнт кореляції, обчислимо середнє значення добутку умовних змінних:
Знайдемо
значення решти параметрів, які входять
до рівняння регресії:
Запишемо рівняння ліній регресії: