Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
41
Добавлен:
26.03.2015
Размер:
264.7 Кб
Скачать

9

ТЕМА 5. Показники варіації. АНАЛІЗ РЯДІВ РОЗПОДІЛУ

План

5.1. Показники варіації

5.2. Характеристики форми розподілу

Питання для самоконтролю

Література

5.1. Показники варіації

Середня величина дає узагальнюючу характеристику всієї сукупності явища, що вивчається. Проте два ряди розподілу, що мають однакову середню арифметичну величину, можуть значно відрізнятися один від одного варіацією величини ознаки, що вивчається. Якщо індивідуальні значення ознаки ряду мало відрізняються один від одного, то середня арифметична буде досить показовою характеристикою даної сукупності. Якщо ж ряд розподілу характеризується значним розсіюванням індивідуальних значень ознаки, то середня арифметична буде ненадійною характеристикою цієї сукупності і її практичне вживання буде обмежено.

Значення показників варіації полягає в наступному:

    • показники варіації доповнюють середні величини, за якими ховаються індивідуальні значення ознак варіаційного ряду;

    • показники варіації характеризують міру однорідності статистичної сукупності за ознакою, що вивчається;

    • показники варіації характеризують кордони коливання ознаки;

    • співвідношення показників варіації характеризує взаємозв'язок між ознаками.

Для виміру варіації ознаки в рядах розподілу застосовуються різні абсолютні і відносні показники. У статистиці найчастіше застосовуються наступні показники (заходи) варіації: розмах варіації, середнє лінійне відхилення, дисперсія, середнє квадратичне відхилення і коефіцієнт варіації.

Розглянемо детально кожен з перерахованих показників варіації.

Розмах варіації (розмах коливань) є різницею між максимальним і мінімальним значеннями ознаки і визначається по формулі:

(5.1)

де R – розмах варіації;

xmax – максимальне значення ознаки;

хmin – мінімальне значення ознаки.

Приклад. Спостереження показують, що швидкість руху легкових автомобілів знаходиться в діапазоні 20-90 км/г., вантажних автомобілів – в межах 20-80 км/г., маршрутних автобусів – 20-60 км/г., автобусів міжміських повідомлень – 20-90 км/г. Визначимо розмах варіації швидкостей цих видів транспорту. Розрахунок представлений в таблиці 5.1.

Таблиця 5.1

Швидкості руху транспортних засобів

Вид транспорту

Швидкість, км/год.

Швидкість км/год.

Розмах варіації

Легкові автомобілі

90

20

R=90-20=70 км/год.

Вантажні автомобілі

80

20

R=80-20=60 км/год.

Маршрутні автобуси

60

20

R=60-20=40 км/год.

Міжміські автобуси

90

20

R=90-20=70 км/год.

Безумовною позитивною якістю цього показника є простота його розрахунку, тому він не рідко використовується і в техніці і в економіці. Проте розмах варіації залежить від величини лише крайніх значень ознаки, що робить певною мірою випадковою його величину. Тому його доцільно застосовувати при вивченні досить однорідних статистичних сукупностей.

Надійніший показник – середній розмах варіації, обчислюваний як середня арифметична з ряду розмахів, отриманих в результаті обробки рівних серій спостережень. Таким показником, користуються, наприклад, при контролі якості продукції.

Середнє лінійне відхилення визначається як середня арифметична індивідуальних абсолютних відхилень значень ознаки від його середнього значення.

Індивідуальні значення ознаки в статистичній сукупності відхиляються від його середньої величини в ту або іншу сторону. Знайдемо середню міру відхилення кожного значення ознаки від його середньої величини. Позначимо значення варіюючої ознаки в окремих одиниць сукупності через , де n – кількість (число) одиниць сукупності.

Віднімаючи з кожного значення ознаки його середню величину отримаємо:

; ; ... (5.2)

Оскільки сума (сума з врахуванням знаку (±) величин) алгебри відхилень індивідуальних значень ознаки від середньої арифметичної (згідно з нульовою властивістю) завжди дорівнює нулю, то для розрахунку середнього лінійного відхилення використовується арифметична сума (сума модулів величин) відхилень, тобто підсумовуються абсолютні значення індивідуальних відхилень значень ознаки незалежно від знаку.

Середнє лінійне відхилення обчислюється для первинних, незгрупованих даних:

(5.3)

Для згрупованих даних (інтервальний ряд):

(5.4)

де хi – індивідуальне значення i-ї ознаки;

– центральне значення ознаки в i-ом інтервалі;

– середнє значення ознаки;

п - число одиниць статистичної сукупності;

fi – кількість ознак в i-ом інтервалі;

m – кількість інтервалів в інтервальному варіаційному ряду.

Приклад. Проведемо розрахунок середнього лінійного відхилення змінного вироблення токарів механічного цеху, дані про яку представлені в таблиці 5.2.

Таблиця 5.2

Змінне вироблення токарів механічного цеху заводу

Кількість деталей, що обробляються в зміну

одним робітником, шт. (х)

Число

робітників (f)

х·f

4

2

8

2

4

5

4

20

1

4

6

9

54

0

0

7

3

21

1

3

8

2

16

2

4

РАЗОМ:

20

119

-

15

Обчислюємо середню арифметичну:

Тоді середнє лінійне відхилення складе:

Це означає, що в середньому змінне вироблення кожного робітника в сукупності, що вивчається, відхилялося від середнього змінного вироблення в цілому по цеху на 0,75.

Середнє лінійне відхилення – число завжди іменоване. Його розмірність відповідає розмірності варіативної ознаки.

Простота розрахунку і інтерпретації результатів складають позитивні сторони даного показника. Проте в результаті абстрагування від знаку індивідуальних відхилень, виникають труднощі у вживанні математичних методів аналізу варіації. Математичні властивості модулів «погані»: їх не можна поставити у відповідність з яким-небудь імовірнісним законом, у тому числі і з нормальним розподілом, що зустрічається найчастіше в економіці, в техніці, в житті. З цієї причини середнє лінійне відхилення в даний час використовують рідко, але використовують. Наприклад, для оцінки однорідності товщини ниток і пряжі в текстильній промисловості.

Середнє квадратичне відхилення визначається як корінь квадратний з середнього квадратів відхилень індивідуальних значень ознаки від середньої арифметичної і розраховується по наступним формулам:

для не згрупованих даних:

(5.5)

для згрупованих даних:

(5.6)

для інтервального ряду:

(5.7)

Зведення індивідуальних відхилень в квадрат і подальше витягання квадратного кореня викликане, як вже говорилося, тим, що підсумовування відхилень в першому ступені приводить до нульового результату.

Середнє квадратичне відхилення є загальноприйнятим показником варіації: при його визначенні враховуються всі відхилення значень варіативної ознаки від середнього. Проілюструємо розрахунок середнього квадратичного відхилення для ранжируваного і інтервального варіаційних рядів.

Приклад. Випробовуються шість лампочок на продовження горіння. Результати випробування представлені в таблиці. 6.3 (дискретний варіаційний ряд).

Таблиця 5.3

Результати випробувань лампочок

Порядковий номер

випробування

Тривалість горіння

лампочки, год (х,)

1

420

+20

400

2

400

0

0

3

375

-25

625

4

405

+5

25

5

390

-10

100

6

410

+10

100

РАЗОМ:

2400

0

1250

Розрахуємо середню арифметичну і середнє квадратичне відхилення:

Це означає, що в середньому тривалість горіння лампочки в сукупності, що вивчається, відхилялася від середньої тривалості в цілому по сукупності на 14,3 години.

Приклад. Розрахуємо середнє квадратичне відхилення терміну звернення облігацій. Вихідні дані для розрахунку і проміжні обчислення представлені в таблиці. 6.4 (інтервальний варіаційний ряд).

Розрахуємо середню арифметичну величину терміну звернення акцій і середнє квадратичне відхилення:

;

Таблиця 5.4

Термін обігу облігацій

Термін обігу облігацій, міс (х)

Кількість

облігацій, шт ( f )

до 2

15

1

15

– 4,6

21,16

317,4

2 – 4

13

3

39

– 2,6

6,76

87,88

4 – 6

29

5

145

– 0,6

0,36

10,44

6 – 8

22

7

154

1,4

1,96

43,12

8 – 10

12

9

108

3,4

11,56

138,72

10 і більше

9

11

99

5,4

29,16

262,44

РАЗОМ:

100

560

71,40

860,00

У науковій статистиці широко використовується показник варіації, званий дисперсією. Дисперсія – це середній квадрат відхилень індивідуальних значень ознаки від середньої арифметичної.

Дисперсія обчислюється по наступних формулах.

Для не згрупованих даних:

. (5.8)

для згрупованих даних (дискретний ряд):

. (5.9)

для інтервального ряду:

. (5.10)

На дисперсії засновані практично всі методи математичної статистики.

Дисперсія і середнє квадратичне відхилення – найбільш широко вживані показники варіації. Пояснюється це тим, що вони входять в більшість теорем теорії вірогідності, що служить фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних чинників, що обумовлюють варіацію ознаки.

Розглянуті раніше показники варіації, за винятком дисперсії, виражалися в одиницях виміру варіативної ознаки. Так, наприклад, середнє квадратичне відхилення врожайності пшениці вимірюється в центнерах. Оскільки середньоквадратичне відхилення – число іменоване, то воно незручне для зіставлення варіації різних ознак. Наприклад, обчисливши середнє квадратичне відхилення продуктивності роботи і заробітної плати робітників, неможливо визначити, варіація якої ознаки більша, оскільки в першому випадку вона вимірюється в одиницях продукції (деталях), в другому – в гривнях.

Для порівняння варіації різних ознак найчастіше застосовується показник тієї, що відносної коливається – коефіцієнт варіації. Його використовують не лише для порівняльної оцінки варіації, але і для характеристики однорідності статистичної сукупності. Статистична сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33% (для розподілів, близьких до нормального закону).

Принцип побудови коефіцієнтів варіації такий:

(5.11)

Лінійний

коефіцієнт

варіації

Квадратичний

коефіцієнт

варіації

Коефіцієнт осциляції

Найчастіше на практиці уживається квадратичний коефіцієнт варіації.

За допомогою коефіцієнта варіації можна порівнювати розміри однієї ознаки в декількох сукупностях. Так, наприклад, за допомогою коефіцієнта варіації можна порівнювати варіацію терміну служби верстатів на різних підприємствах, варіацію зростання і ваги населення в різних регіонах країни.

Приклад. Розглянемо коефіцієнти варіації терміну служби електролампочок, що випускаються на трьох заводах. Вихідні дані представлені в табл. 5.5.

Таблиця 5.5

Термін служби електролампочок

Номер заводу

Середня тривалість

горіння лампочок, год., (х)

, %

1

800

-100

10000

10,20

2

1000

+ 100

10000

8,17

3

900

0

0

9,07

РАЗОМ -

2700

0

20000

Обчислимо середню арифметичну терміну горіння лампочок:

.

Обчислимо середнє квадратичне відхилення:

.

Обчислимо коефіцієнт варіації для кожного заводу і занесемо дані в таблицю. Найбільш низький коефіцієнт варіації в електролампочок, що випускаються на заводі № 2, що свідчить про велику однорідність його продукції (в даному випадку, однорідності якості електролампочок).

5.2. Характеристики форми розподілу

Для здобуття приблизного уявлення про форму розподілу будують графіки розподілу (полігон і гістограму). У практиці статистичних досліджень доводиться зустрічатися з самими різними розподілами. Однорідні сукупності характеризуються як правило, одновершинними розподілами. Багатовершинність свідчить про неоднорідність сукупності, що вивчається. В цьому випадку необхідне перегрупування даних з метою виділення однорідних груп.

З'ясування загального характеру розподілу передбачає оцінку міри його однорідності, а також числення показників асиметрії і ексцесу. У симетричному розподілі , а чим помітніше асиметрія, тим більше відхилення між характеристиками центру розподілу .

Стандартне відхилення називається коефіцієнтом асиметрії:

. (5.13)

В разі правосторонньої асиметрії As > 0, лівобічної – As < 0. Якщо As < 0,25, вважається, що асиметрія низька, якщо As0,5 – середня, а при As > 0,5 – висока.

Ріс. 5.1. Симетрія розподілу

Оцінювання коефіцієнта асиметрії також може вироблятися на базі центрального моменту розподілу і обчислюється за формулою:

(5.14)

де μ3 – центральний момент третього порядку: .

Алгебраїчно центральний момент розподілу – це середня арифметична к-й мірі відхилення індивідуальних значень ознаки від середньої:

(5.15)

Очевидно, що момент другого порядку – це дисперсія, яка характеризує варіацію, моменти 3-го і 4-го порядків характеризують відповідно асиметрію і ексцес.

Ексцес розподілу – міра зосередженості елементів сукупності біля центру розподілу. Показник ексцесу (островершинності) розраховується по формулі:

, (5.16)

де μ4 – центральний момент четвертого порядку .

Ріс. 5.2. Ексцес розподілу

Ексцес може бути позитивним і негативним. В островершинних розподілах показник ексцесу має позитивний знак, а в плосковершинних – негативний знак. Граничним значенням негативного ексцесу є значення Ех = – 2; величина позитивного ексцесу є величиною безконечної. У нормальному розподілі і тому .

Питання для самоконтролю

1. У чому різниця між середньою та показниками варіації?

2. У чому полягає значення показників варіації?

3. Які показники (заходи) варіації застосовуються найчастіше?

4. Назвіть основні категорії статистики?

5. У чому полягає пізнавальне значення статистики?

6. Дайте визначення поняттям «розмах варіації», «середнє лінійне відхилення», «середньоквадратичне відхилення» « коефіцієнт варіації», «дисперсія».

7. Для чого розраховується коефіцієнт асиметрії ?

8. Для чого розраховується ексцес розподілу?

Література

  1. Сигел Эндрю. Практическая бизнес-статистика.: Пер. С англ. М.: Изд. Дом "Видьямс", 2002. - 1056 с.

  2. Статистика: Підручник / а.В. Головач, а.М. Єріна, о.В. Козирєв та ін.; За ред. А.В. Головача, а.М. Єріної, о.В. Козирєва. – к.: Вища шк.., 1993. – 623 с.

  3. Теория статистики: Учебник/ Под. Ред. Проф. Р.А. Шмойловой. – 3-е изд., перераб. – м.: Финансы и статистика, 2002. – 560 с.

Соседние файлы в папке Статистика все лекции