Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка по статистике.doc
Скачиваний:
21
Добавлен:
09.02.2016
Размер:
695.3 Кб
Скачать

Запитання для самоперевірки

1. Дайте визначення середньої величини.

2. Назвіть умови правильного застосування середніх величин.

3. Які є види і форми середніх величин?

4. В яких випадках використовується та чи інша форма середньої вели­чини?

5. Назвіть умови правильного вибору виду середньої величини.

6. В яких випадках використовується середня гармонійна?

7. Що таке мода і медіана, як їх обчислюють у дискретних та інтервальних рядах розподілу?

8. Напишіть формули визначення моди і медіани у інтервальних рядах розподілу.

9. Для чого потрібно вивчати варіацію ознак?

10.Напишіть формули визначення всіх показників варіації.

11.Як треба розуміти розмах варіації?

12.У чому полягає економічній зміст середнього лінійного і середнього

квадратичного відхилення? Чому σ більше d за абсолютною вели­чиною?

13. Можна чи ні порівнювати варіацію двох ознак, що мають різні оди­ниці вимірювання з допомогою σ і d ?

14.3 якою метою обчислюють коефіцієнт варіації?

15.Як визначити дисперсію альтернативної ознаки?

16. В чому проявляється закономірність розподілу?

17. Напишіть формули визначення показників асиметрії і ексцесу, по­ясніть їх суть.

Тема5. Статистичні методи вивчення взаємозв’язків

При вивченні цієї теми насамперед потрібно добре засвоїти поняття про види і форми існуючих зв'язків між суспільно-економічними явищами. Студент повинен знати, що ознака, яка характеризує причину чи умову, є факторною -Х, а ознака, яка характеризує наслідок — результативною У.

Основною характеристикою кореляційного зв'яжу є лінія регресії, тобто функція, що зв'язує середні значення ознаки у зі значеннями ознаки х. У статистиці найпоширенішими методами вивчення кореляційних зв'язків є метод аналітичного групування та кореляційно-регресійний метод. Процес реалізації цих двох методів включає такі етапи: 1) теоретичне обгрунтування моделі; 2) оцінка лінії регресії; 3) вимірювання тісноти зв'язку між ознаками, що вивчаються; 4) перевірка істотності зв'язку.

Суть аналітичного групування полягає в тому, що одиниці сукуп­ності групують за факторною ознакою х, а потім для кожної виділеної групи підраховують число одиниць сукупності і обчислюють середнє значення результативної ознаки у. Якщо залежно від зміни значень фак­торної ознаки змінюються якимось чином і срередеі значення результа­тивної ознаки, то робиться висновок про наявність і напрям зв'язку між ними: зв'язок прямий — збільшення х приводить до збільшення у; зв'я­зок зворотній — зі збільшенням х зменшується у; відсутність будь-якої систематичності у зміні у зі зміною х свідчить про відсутність зв'язку між ними.

На першому етапі побудови аналітичного групування розв'язу­ються два питання: вибір факторної і результативної ознаки та визна­чення числа груп та їх меж. Слід пам'ятати, що типовість та сталість групових середніх залежить від числа одиниць сукупності у кожній групі.

На другому етапі проводиться оцінка лінії регресії — у кожній групі, виділеній за факторною ознакою, обчислюються середні значення

результативної ознаки.

Третій етап аналітичного групування, який полягає у вимірювати тісноти звязку між факторною і результативною ознаками, грунтується на правилі складання дисперсій: σ2 = δ2 + σ2 , тобто загальна дисперсія σ2 дорівнює сумі міжгрупової δ2 -та середньої з групових дисперсій σ2.

Загальна дисперсія, яка характеризує варіацію результативної оз­наки під впливом усіх причин чи умов, може бути обчислена за форму­лами

∑ (уі - у)2

σ2 = y2 - (y)2 або σ2 =

n

Міжгрупова дисперсія, що характеризує варіацію результативної ознаки, повязану з варіацією групувальної ознаки, обчислюється за формулою

∑(уі - у)2ƒ

δ2 =

∑ƒі

де уі,групові середні результативної ознаки.

Середню з групових дисперсій, яка вимірює варіацію результативної ознаки, пов'язану з впливом усіх факторних ознак, крім покладеної в основу групування, можна обчислити за наступною формулою

∑σ2і ƒ і

σ2 = σ2 - δ2 або σ2 =

∑ƒ і

де σ2і - внугршньосгрупові дисперсії, які обчислюються за формулою

∑(у-уі )2

σ2і =

∑ƒі

де уі,індивідуальні значення результативної ознаки в і-ій групі.

Щоб виміряти тісноту звязку, слід обчислити співвідношенняміжгрупової дисперсії та загальної, тобто кореляційне відношення:

δ2

η2 = ,

σ2

яке коливається в межах від 0 до 1 і характеризує частку варіації результативної ознаки, поясненої варіацією факторної ознаки.

На останньому етапі для перевірки істотності зв'язку слід викори­стати критичні значення η2 або критичні значення F- критерією, які наведені в додатку.

Фактичні значення F -критерію обчислюють за формулами

η2 k2 δ2 k2

F = . F= .

1- η2 k1 σ2 k1

Де k2, k1 – число ступенів вільності;

k1 = m-1, m – число груп;

k2 = n- m, n – число одиниць сукупності.

Фактичні значення η2 і F необхідно порівняти з критич­ними для рівнів істотності α= 0,05 або α= 0,01. Якщо фактичні значення η2 і F- критерію перевищують відповідні критичні, то зв'язок між озна­ками визначається істотним. Якщо фактичні значення η2 і F -критерію менше відповідних критичних, то висновок залишається невизначеним, а наявність або відсутність зв'язку - не доведеною.

В основі кореляційно-регресійного аналізу лежить припущення, що залежність між факторною і результативною ознаками може бути виражена функцією У=ƒ(х), яка називається рівнянням регресії.

За аналітичним виразом залежність може бути лінійною і нелінійною. Найбільш поширені такі рівняння регресії:

Y=a+bx – лінійне;

Y=abx - показникове;

Y=axb - степеневе;

Y=a+bx+cx2 - параболічне;

b

Y=a+ - гіперболічне,

x

де У – теоретичні значення результативної ознаки, a, b, і c – параметри рівняння регресії, які називаються коефіціентами регресії.

На першому етапі кореляційно-регресійного аналізу обгрунтуванні моделі, як і в аналітичному групуванні, розв'язуються два пи­тання: вибір факторної і результативної ознаки та вибір виду рівняння регресії.

Правильний вибір ознак і виду рівняння регресії потребує теоретичного аналізу взаємозв'язку. Для підтвердження правильності вибору виду рівняння регресії часто застосовується графічне зображення зв'язку у вигляді кореляційного поля. При його побудові на осі абсцис треба відкласти значення факторної ознаки х, а на осі ординат — результативної ознаки у. Кожній одиниці сукупності на графіку відповідає окре­ма точка. 3а формою розміщення точок на кореляційному полі робиться висновок відносно виду регресійного рівняння. При великому обсязі су­купності доцільно на графіку зображати групові середні попередньо по­будованого аналітичного групування. Лінію групових середніх назива­ють емпіричною лінією регресії.

Для визначення виду рівняння регресії застосовується також спосіб перебору функцій, коли обчислюють рівняння регресії різних видів і з них на основі статистико-математичних критеріїв вибирають найкраще.

На етапі оцінки лінії регресії визначають параметри обраного рівняння методом найменших квадратів на основі побудови і розв'язу­вання відповідної системи нормальних рівнянь. Лінійній функції відповідної системи таких рівнянь з двома невідомими:

na +b ∑x = ∑y,

a∑ x+b∑x2 =∑xy.

Особливу увагу слід звернути на інтерпретацію параметрів лінійного рівняння регресії а і Ь. Параметр b показує на скільки одиниць власного виміру змінюється середнє значення результативної ознаки зі збільшенням факторної ознаки на одиницю власного вимірювання. Па­раметр а — теоретичне значення У для х = 0, якщо 0 знаходиться в ме­жах фактичної варіації ознаки х. У противному разі параметр а не має реального змісту.

Тісноту лінійного зв'язку можна виміряти за допомогою лінійного коефіцієнта кореляції r:

xy – x . y

r= ,

σx σy

∑ ху

де ху = ;

n

х і у - середні значення факторної і результативної ознаки;

σx і σy — середні квадратичні відхилення відповідних ознак.

Цей показник коливається в межах під 1 до + 1 і характеризує не тільки тісноту, але і напрям зв'язку.

Мірою тісноти зв'язку як лінійного, так і нелінійного є коефіцієнт детермінації R2 — співвідношення факторної дисперсії σ2у і загальної σ2:

σ2у ∑(У-у )2

R2 = , де σ2у = .

σ2 n

Коефіцієнт детермінації приймає значення від 0 до 1 і характеризує частку варіацій результативної ознаки, яка пов'язана з факторною оз­накою при відповідній формі зв'язку.

Корінь квадратний з коефіцієнта детермінації є індекс кореляції R:

R=√ R2

Студет повинен знати, що при лінійній формі зв'язку абсолютна

величина лінійного коефіцієнта кореляції дорівнює індексу кореляції, тобто │r│= R.

Для якісної характеристики тісноти зв'язку використовуються такі характеристики :

Значення r і R

0,1—0,3

0,3—0,5

0,5 - 0,7

0,7- 0,9

0,9— 0,99

Оцінка тісно­ти зв'язку

слаба

помірна

помітна

значна

дуже значна

У кореляційно-регресійному аналізі істотність зв'язку перевіря­ється так само, як і в аналітичному групуванні з допомогою R2 чи F- критерію, фактичне значення якого в даному випадку обчислюється за формулою

R2 k2

F= ∙

1- R2 k1

При визначенні числа ступенів вільності дійсні ті ж формули,що і в аналітичному групуванні, але m — число параметрів в регресійному рівнянні.