Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
м.у._по_самост._работе.doc
Скачиваний:
19
Добавлен:
03.03.2016
Размер:
3.87 Mб
Скачать

Тема 6. Взаємозв'язки статистичних величин

Аналітичний матеріал

Статистичні методи вивчення залежності побудовані з врахуванням особливостей закономірностей, що вивчаються. Статистика вивчає переважно стохастичні зв'язки, коли одному значенню факторної ознаки Х відповідає група значень результативної ознаки Y. Якщо із зміною значень факторної ознаки змінюються середні групові значення результативної ознаки, то такі зв'язки називають кореляційними. Не всяка стохастична залежність є кореляційною. Якщо кожному значенню факторної ознаки відповідає строго певне значення результативної ознаки, то така залежність функціональна. Її називають ще повною кореляцією. Неоднозначні кореляційні залежності називають неповною кореляцією.

По механізму взаємодії розрізняють:

1. Безпосередні зв'язки – коли причина прямо впливає на слідство;

2. Непрямі зв'язки – коли між причиною і наслідком існують ряд проміжних ознак (наприклад, вплив віку на заробіток).

По напрямах розрізняють:

1. Прямі зв'язки – коли значення факторної і результативної ознак змінюються в одному напрямі;

2. Зворотні зв'язки – коли значення факторної і результативної ознак змінюються у різних напрямах.

Бувають:

1. Прямолінійні (лінійні) зв'язки – виражені прямою лінією;

2. Криволінійні зв'язки – виражені параболою, гіперболою.

По числу взаємозв'язаних ознак розрізняють:

1. Парні зв'язки – коли аналізується взаємозв'язок двох ознак (факторного і результативного);

2. Множинні зв'язки – характеризують вплив декількох ознак на один результативний.

По силі взаємодії розрізняють:

1. Слабкі (помітні) зв'язки;

2. Сильні (тісні) зв'язки.

Завдання статистики визначити наявність, напрям, форму і тісноту взаємозв'язку.

Вивчення стохастичних взаємозв'язків за допомогою методу паралельних рядів. Метод паралельних рядів застосовується для визначення наявності і напряму взаємозв'язку при нечисленних сукупностях (15-20 одиниць). При цьому методі значення факторної ознаки розташовується в порядку зростання або убування і паралельно з ними відбиваються відповідні значення результативної ознаки. Зіставляючи ряди значень, встановлюється залежність.

Для орієнтовного виявлення наявності зв'язку і її напряму в методі паралельних рядів використовуються коефіцієнт Фехнера і коефіцієнт кореляція рангів К.Спірмена.

Порядок визначення коефіцієнта Фехнера:

1. Обчислюються середні значення факторної і результативної ознак -

2. Для кожної пари визначається, , ,де

3. Розрахунок ,;

4. Розрахунок коефіцієнта Фехнера:

.

(6.1)

5.Визначення тісноти і напряму зв'язку, .

Якщо , то зв'язок зворотний.

Якщо , то зв'язок пряма.

Для якісної оцінки тісноти зв'язку можна скористатися співвідношеннями Чеддока:

0

[0,1-0,3]

(0,3-0,5]

(0,5-0,7]

(0,7-0,9]

(0,9-0,99]

1,0

Сила зв'язку

Відсутній

Слабка

Помірна

Помітна

Тісна

Вельми тісна

Функціо-нальна

Порядок визначення напряму і тісноти зв'язку за допомогою коефіцієнта кореляції рангів К. Спірмена:

1. Проти кожного значення відповідно факторної і результативної ознак записуються їх ранги (Rx , Ry) (порядкові номери величин ознак). В разі наявності однакових значень ознаки кожному з них привласнюється середнє арифметичне значення їх рангів;

2. Визначається відхилення між рангами відповідно результативної і факторної ознак ;

3. Розраховується коефіцієнт кореляції рангів К.Спірмена:

,

(6.2)

де n – кількість одиниць ряду, що вивчається;

4. По величині коефіцієнта кореляції рангів визначають тісноту і напрям зв'язку між ознаками, .

Якщо , то зв'язок зворотний.

Якщо , то зв'язок прямий.

Для якісної оцінки тісноти зв'язку можна скористатися співвідношеннями Чеддока, що наведені в вище приведеній таблиці.

Вивчення взаємозв'язків за допомогою методу аналітичних угрупувань. Метод аналітичного угрупування застосовується у випадках, коли сукупність досить велика і паралельні ряди не дозволяють виявити залежність.

Аби виявити залежність за допомогою цього методу, потрібно виробити угрупування одиниць сукупності за факторною ознакою і для кожної групи обчислити середнє значення результативної ознаки. Зіставляючи потім зміни результативної ознаки у міру зміни факторного, можна виявити напрям, характер і тісноту зв'язку між ними.

Порядок визначення напряму і тісноти зв'язку за допомогою Методу аналітичних угрупувань:

  1. Визначення факторної (Х) і результативної ознаки (У).

  2. Визначення середніх значень факторної і результативноїознак.

  3. Угрупування даних відповідно до факторної ознаки.

  4. Визначення середнього арифметичного значення результативної ознаки для кожної групи.

  5. Визначення середнього арифметичного значення факторної ознаки для кожної групи.

  6. Визначення напряму зв'язку між ознаками: якщо спостерігається одночасне зростання (спад) середніх групових значень результативної і факторної ознаки, то зв'язок прямий, якщо ж спостерігається зростання (спад) середніх групових значень результативної ознаки і спад (зростання) середніх групових значень факторної ознаки, то зв'язок зворотний.

  7. Визначення дисперсії результативної ознаки для кожної групи. Групові дисперсії показують варіацію результативної ознаки, викликані всіма можливими факторами, окрім відмінностей в значеннях факторної ознаки.

  8. Визначення середньої з групових дисперсій результативної ознаки .

  9. Визначення міжгрупової дисперсії результативної ознаки . Міжгрупова дисперсія характеризує варіацію групових середніх, обумовлену відмінностями груп факторної ознаки.

  10. Визначення загальної дисперсії результативної ознаки . Загальна дисперсія відображає сумарний вплив всіх можливих чинників на загальну варіацію результативної ознаки.

  11. Визначення емпіричного коефіцієнта детермінації . Емпіричний коефіцієнт детермінації – показує долю міжгрупової дисперсії в загальній дисперсії результативної ознаки і характеризує силу впливу факторної ознаки на загальну варіацію результативної ознаки.

  12. Визначення емпіричного кореляційного відношення . Емпіричне кореляційне відношення показує тісноту зв'язку між факторною і результативною ознаками.

  13. Для якісної оцінки тісноти зв'язку на основі показника емпіричного кореляційного відношення можна скористатися співвідношеннями Чеддока.

  14. Перевірка істинності зв'язку за допомогою F- критерію (критерію Фішера):

,

(6.3)

де k2 – число мір свободи середньою з групової дисперсії;

k1число мір свободи міжгрупової дисперсії:

,

де n – число елементів статистичної сукупності;

m – число груп.

Зв'язок між ознаками вважається достеменним, якщо . визначається по таблиці 1 додатку Д.

Вивчення взаємозв'язку методом регресій і кореляцій. Регресійний аналіз дозволяє виразити за допомогою рівняння форму взаємозв'язку.

Кореляційний аналіз використовується для визначення тісноти або сили взаємозв'язку ознак. Кореляційні методи ділять на:

- параметричні методи, які дають оцінку тісноти зв'язку безпосередньо на базі значень факторної і результативної ознак;

- непараметричні методи – дають оцінку на основі умовних оцінок ознак.

Оцінка тісноти криволінійних залежностей дається після розрахунку параметрів рівняння регресії. Тому такий метод називається кореляційно-регресійним. Якщо аналізується залежність однієї факторної і результативної ознак, то в цьому випадку маємо справу з парною кореляцією і регресією.

Регресія – це лінія, що характеризує найбільш загальну тенденцію у взаємозв'язку факторної і результативної ознак.

Передбачається, що аналітичне рівняння виражає справжню форму залежності, а всі відхилення від цієї функції обумовлені дією різних випадкових причин. Оскільки вивчаються кореляційні зв'язки, зміні факторної ознаки відповідає зміна середнього рівня результативної ознаки. При побудові аналітичних групувань ми розглядали емпіричну лінію регресії. Проте, ця лінія не придатна для економічного моделювання і її форма залежить від свавілля дослідника. Теоретично лінія регресії у меншій мірі залежить від суб'єктивізму дослідника, проте, тут так само може бути свавілля при виборі форми або функції взаємозв'язку. Вважається, що вибір функції повинен спиратися на глибоке знання специфіки предмету дослідження.

На практиці найчастіше застосовуються наступні форми регресійних моделей:

- лінійна ;

- логарифмічна ;

- гіпербола ;

- парабола другого порядку ;

- показова ;

- статечна .

Окрім змістовного підходу існує формальна оцінка адекватності підібраної регресійної моделі. Кращою з них вважається та, яка найменш віддалена від вихідних даних.

Дана властивість середньої, що свідчить, що сума квадратів відхилень всіх варіантів ряду від середньої арифметичної менше суми квадратів їх відхилень від будь-якого іншого числа, покладена в основу методу найменших квадратів, що дозволяє розрахувати параметри вибраного рівняння регресії так, щоб лінія регресії була в середньому найменш віддалена від емпіричних даних.

Зокрема, оцінка параметрів рівняння лінійної регресії відповідно до методу найменших квадратів має на увазі вирішення системи нормальних лінійних рівнянь:

(6.4)

Параметр а0 характеризує умовне значення результативної ознаки при нульовому значенні факторної ознаки.

Параметр а1 характеризує на скільки одиниць зміниться результативна ознака при зміні факторної ознаки на одиницю.

Для визначення тісноти зв'язку використовують коефіцієнт детермінації:

,

(6.5)

де - загальна дисперсія результативної ознаки;

- факторна дисперсія (відхилення розрахункових значень результативної ознаки від середнього значення результативної ознаки).

Коефіцієнт детермінації показує долю дисперсії результативної ознаки, яка пояснюється вибраною моделлю.

. Чим ближче значення коефіцієнта детермінації до 1, тим краще модель пояснює емпіричні дані.

Для виміру тісноти лінійного взаємозв'язку застосовується коефіцієнт кореляції, який дорівнює квадратному кореню з коефіцієнта детермінації. Базова форма коефіцієнта кореляції наступна:

.

(6.6)

Виходячи з цієї формули, можна визначити наступні способи розрахунку коефіцієнта кореляції:

Якісна оцінка тісноти зв'язку дається за допомогою шкали Чеддока.

Істинність зв'язку перевіряється за допомогою F-критерію (критерію Фішера):

,

(6.7)

де k2 – число мір свободи залишкової дисперсії

k1число мір свободи факторної дисперсії.

,

де n – число елементів статистичної сукупності;

m – число факторних змінних (для лінійної моделі m = 2).

Зв'язок між ознаками вважається достеменним, якщо . визначається по таблиці 1 додатку Д.

Непараметричні методи вивчення взаємозв'язків. Непараметричні методи застосовуються для виміру тісноти зв'язку якісних і альтернативних ознак, а так само кількісних ознак, розподіл яких відрізняється від нормального розподілу.

Для виміру зв'язку альтернативних ознак застосовується коефіцієнт асоціації Карла Пірсона. Для розрахунку цього показника застосовується наступна матриця взаємного розподілу частот.

а, b, с, d– частоти взаємного розподілу ознак.

1 ознака

2 ознака

ТАК

НЕМАЄ

ТАК

а

b

НЕМАЄ

с

d

При прямому зв'язку частоти сконцентровані по діагоналі а-d, при зворотному зв'язку по діагоналі b-с, за відсутності зв'язку частоти практично рівномірно розподілені по всьому полю таблиці.

Коефіцієнт асоціації визначається по формулі:

.

(6.8)

Напрям зв'язку вказує знак коефіцієнта асоціації.

Якісна оцінка тісноти зв'язку дається за допомогою шкали Чедока.

Перевірка істинності зв'язку може бути здійснена за допомогою критерію Пірсона, який функціонально пов'язаний з коефіцієнтом асоціації:

(6.9)

За умови істинність зв'язку доведена. Число мір свободи (k) в цьому випадку дорівнює 1.

Приклади вирішення завдань

Приклад 1.Визначте коефіцієнт Фехнера та проаналізуйте тісноту та напрямок зв’язку між розміром основних фондів та обсягом випуску продукції, використовуючи дані таблиці:

Розмір основних фондів

( ), млн. дол.

6

8

9

5

10

11

7

Обсяг випуску продукції (), тис. дол.

18

21

22

15

14

19

21

Рішення

1. Формула для розрахунку коефіцієнта Фехнера має вид:

.

2. С - знаки та () співпадають;

3. Н - знаки та () не співпадають.

4. Рішення надаємо у табличній формі:

знак

знак

1

5

15

-

-

1

2

6

18

-

-

1

3

7

21

-

+

1

4

8

21

+

+

1

5

9

22

+

+

1

6

10

14

+

-

1

7

11

19

+

+

1

56

130

5

2

5. млн. дол.;млн. дол.

6. .

Відповідь. Значення та знак розрахованого коефіцієнта Фехнера свідчить про прямий та середньої сили зв’язок між ознаками.

Приклад 2.Дайте оцінку тісноти і напрямку зв’язку між товарообігом та витратами обігу за допомогою коефіцієнта кореляції рангів (коефіцієнта Спірмена), використовуючи дані таблиці:

тис. грн.

Товарообіг (x)

580

470

450

630

610

600

520

Витрати (y)

38

27

30

40

42

35

28

Рішення

1. Формула для розрахунку коефіцієнта кореляції рангів має вид:

.

2. Рішення задачі наведемо у табличному вигляді:

||

1

450

30

I

III

2

4

2

470

27

II

I

1

1

3

520

28

III

II

1

1

4

580

38

IV

V

1

1

5

600

35

V

IV

1

1

6

610

42

VI

VII

1

1

7

630

40

VII

VI

1

1

10

3.

Відповідь. Зв’язок між товарооборотом та витратами прямий та тісний.

Приклад 3. У таблиці наведено групування підприємств галузі по вартості основних фондів. За допомогою методу групувань визначте напрямок та тісноту зв’язку між вартістю основних фондів та обсягом випуску продукції підприємства.

Групи підпри-ємств по вар-тості основних фондів, млн. грн.

Кількість під- приємств

Середня вар-тість основних фондів,

млн. грн.

Середній обсяг випуску продукції,

млн. грн.

Дисперсії обся-гу випуску про-дукції

1,2 – 2,7

9

1,8

9,3

0,17

2,7 – 4,2

11

3,2

16,9

0,09

4,2 – 5,7

7

4,8

29,3

0,25

5,7 – 7,2

3

6,9

30,2

0,14

Рішення

1. Напрямок зв’язку між ознаками можна визначити аналізуючи напрямок зміни групових середніх по факторному та результативному ознакам. Цей аналіз показує, що групові середні по обом ознакам зростають – це свідчить про прямий зв’язок між ознаками.

2. Тісноту зв’язку між ознаками визначимо за допомогою емпіричного коефіцієнта детермінації:

.

3. ;

4. ;

5. Рішення задачі наведемо у табличному вигляді:

||

()2

9,3

9

0,17

83,7

9.5

90.25

812.25

1.53

16,9

11

0,09

185,9

1.9

3.61

39.71

0.99

29,3

7

0,25

205,1

10.5

110.25

771.75

1.75

30,2

3

0,14

90,6

11.4

129.96

389.88

0.42

Усього

30

565,3

2013.59

4.69

6. ;;;

7. .

Відповідь. Зв’язок між ознаками прямий та сильний.

Приклад 4.По даним наведеним у таблиці визначте рівняння кореляційного зв’язку між ознаками (зв’язок лінійний) та проаналізуйте параметри рівняння регресії.

Балансова вартість основних фондів (X), млн. грн.

5

4

8

12

9

7

10

Обсяг випуску продукції (Y), млн. грн.

9

8

10

19

16

13

12

Рішення

1. Рівняння кореляційного зв’язку у загальному вигляді має вид:

.

2. Параметри рівняння регресії знайдемо з системи рівнянь:

,

.

3. Рішення задачі надамо у табличному вигляді:

1

5

9

25

45

8,69

2

4

8

16

32

7,38

3

8

10

64

80

12,62

4

12

19

144

228

17,86

5

9

16

81

144

13,93

6

7

13

49

91

11,31

7

10

12

100

120

15,24

Усього

55

87

479

740

87,03

4. 1) , * (-7.857)

2) .

5. ;;.

Відповідь: а) рівняння кореляційного зв’язку має вигляд – ;

б) оскільки , то параметри рівняння регресії (,) розраховані вірно.

Приклад 5. Є розподіл 300 працівників по ступеню задоволеності умовами праці і професією:

Кількість працівників по ступеню задоволеності умовами праці

Кількість працівників

Всього

які задоволені професією

які не задоволені професією

задоволені

170

30

200

не задоволені

47

53

100

Разом

217

83

300

Оцініть тісноту та напрямок зв'язку між цими альтернативними ознаками.

Рішення

1. Коефіцієнт асоціації, який використовують для оцінки тісноти та напрямку зв’язку між альтернативними ознаками, можна визначити по формулі:

.

Відповідь. Зв’язок між кількістю працівників задоволених професією та кількістю працівників задоволених умовами праці прямий (+ 0,4) та середнього ступеню тісноти.

Тести

1. Розрахункове значення критерію Фішера для прямолінійного парного кореляційного зв’язку становить 4,83. При яких з перелічених нижче критичних значень зв’язок між ознаками буде істинним:

а) 4.86;

б) 4.10;

в) 4.83;

г) 5.14.

2. Критичне значення критерію Фішера при ймовірності 95%, числі ступенів свободи міжгрупової дисперсії – 5 та числі степенів свободи середньої з групових дисперсій – 20 становить – 2,71. При яких з перелічених нижче значень розрахункового критерію зв’язок між ознаками буде відсутній:

а) 2.95;

б) 2.55;

в) 3.15;

г) 1.95.

3. Для оцінки тісноти зв′язку між ознаками в методі паралельних рядів використовують:

а) коефіцієнт асоціації;

б) коефіцієнт кореляції;

в) коефіцієнт Фехнера;

г) коефіцієнт кореляції рангів.

4. Коефіцієнт Спірмена використовують в статистиці:

а) для перевірки гіпотези про те, що емпіричний розподіл підпорядковується вибраному теоретичному розподілу;

б) для оцінки тісноти зв′язку між двома альтернативними ознаками;

в) для оцінки істинності зв′язку між ознаками в методі аналітичних групувань;

г) для оцінки тісноти зв′язку між ознаками в методі паралельних рядів.

5. При визначенні емпіричного коефіцієнта детермінації використовують:

а) міжгрупову та загальну дисперсії факторної ознаки;

б) міжгрупову та загальну дисперсії результативної ознаки;

в) загальну та середню із групових дисперсій факторної ознаки;

г) загальну та середню із групових дисперсій результативної ознаки.

6. Який з перелічених нижче показників тісноти зв′язку між ознаками може мати тільки додатні значення:

а) коефіцієнт Фехнера;

б) коефіцієнт детермінації;

в) коефіцієнт кореляції рангів;

г) коефіцієнт асиметрії.

7. Для перевірки гіпотези про те, що емпіричний розподіл підпорядковується вибраному теоретичному , використовують критерій:

а) Фішера;

б) Пірсона;

в) Спірмена;

г) Кете.

Контрольні питання

1. Наведіть класифікацію взаємозв’язків по реакції результативних ознак на зміну факторних; по напрямку; по аналітичному виразу зв’язку; по числу факторних ознак. що впливають на зміну результативної.

2. Метод паралельних рядів: сутність, показники тісноти та напрямку зв’язку.

3. Метод аналітичних групувань: показники тісноти зв’язку; порядок перевірки суттєвості (істинності) зв’язку.

4. Визначте поняття «регресія» та наведіть форми регресійних моделей, що найбільш часто використовуються на практиці.

5. Метод регресій та кореляцій: показники тісноти зв’язку; порядок перевірки суттєвості (істинності) зв’язку.

6. Вивчення взаємозв’язку між двома альтернативними ознаками: сутність; показник тісноти; оцінка суттєвості (істинності) зв’язку.

Завдання для контрольної та самостійної роботи

6.1 Згідно таблиці 1 додаток Д для свого варіанту дослідіть взаємозв'язок між ціною (факторна ознака) і об'ємами реалізації (результативна ознака) по десяти підприємствах, що випускають аналогічну продукцію, за допомогою методу паралельних рядів. Встановіть напрямок і тісноту зв'язку. Зробіть висновки. Розрахунки представте в таблиці.

6.2 Згідно таблиці 2 додаток Д для свого варіанту дослідіть взаємозв'язок між тарифним розрядом робітника (факторна ознака) і відсотком браку (результативна ознака) за допомогою методу аналітичних угрупувань. Встановіть напрямок, тісноту і істинність зв'язку. Зробіть висновки. Розрахунки представте в таблиці.

6.3 Згідно таблиці 1 додаток Д для свого варіанту дослідіть взаємозв'язок між ціною (факторна ознака) і об'ємами реалізації (результативна ознака) по десяти підприємствах, що випускають аналогічну продукцію, за допомогою методу регресій і кореляцій. Побудуйте лінійне рівняння регресії, визначте коефіцієнт кореляції, встановіть напрямок, тісноту і істинність зв'язку. Зробіть висновки. Розрахунки представте в таблиці.

6.4 Є розподіл працівників по мірі задоволеності умовами праці і своєю професією: а - кількість працівників які задоволені і професією і умовами праці; b – кількість працівників які не задоволені професією, але задоволені умовами праці; с – кількість працівників які задоволені професією, але не задоволені умовами праці; d – кількість працівників які не задоволені ні професією, ні умовами праці. Дослідіть взаємозв'язок між задоволеністю працівниками професією і умовами праці. Вихідні дані представлені в таблиці 3 додатку Д.