- •1.Що таке статистика
- •Статистичні
- •За глибиною
- •За атрибутивною ознакою
- •1. Абсолютні і відносні величини
- •Загальні умови правильного використання абсолютних і відносних величин
- •2. Середні величини
- •1.Середня варіаційних рядів
- •2. Структурні середні
- •3. Показники варіації
- •4. Середня та дисперсія альтернативної ознаки
- •2. Методика проведення дисперсійного аналізу
- •3. Кореляційно-регресійний метод
- •4. Непараметричні методи вивчення
- •5. Рангова кореляція
- •Динаміка реалізації овочів на ринках міста *
- •Динаміка чисельності учнів
- •2. Характеристика
- •3. Показники аналізу рядів динаміки
- •4. Порівняльний аналіз рядів динаміки
- •5. Методи виявлення основної тенденції
- •Динаміка обсягу вантажних перевезень
- •Допоміжна розрахункова таблиця
- •Індекси
- •4. Середні індекси
- •5. Індекси середніх величин
2. Структурні середні
Розглянута середня арифметична є головною характеристикою центру групування. Але характер розподілу вивчається також і за допомогою інших характеристик варіаційного ряду. До них належать структурні середні мода та медіана, їх ще називають порядковими або розподільчими середніми .
На практиці дослідник стикається з ситуацією, коли середня величина не може бути єдиною узагальнюючою характеристикою, і тоді мода або медіана стають дійсно ілюстративними. Ці ситуації стануть зрозумілі, коли розглянути зміст та методи розрахунку цих показників.
Мода (
)
– це значення варіанти, яка
має найбільшу
частоту,
тобто яка
найчастіше зустрічається у ряду
розподілу55.
У дискретному ряді мода встановлюється точно у відповідності до наведеного визначення: серед усіх частот візуально відшукується найбільша, і модою буде та варіанта, яка має відношення до цієї частоти. Повернемося до табл. 4.2, у якій розподіл автомашин за величиною щомісячного пробігу представлено дискретним рядом. Частотою тут є саме число автомашин з тим чи іншим щомісячним пробігом. Найбільша частота дорівнює “4”. Їй відповідає варіанта – щомісячний пробіг, у розмірі 6,5 тис. км. Це й буде модальним значенням, а саме: частіше за все щомісячний пробіг однієї автомашини складав 6,5 тис. км.
В інтервальному
ряді з рівними інтервалами мода
відшукується у два етапи: перш за все,
з того ж принципу за найбільшою частотою
встановлюється модальний інтервал, і
лише потім у цьому інтервалі відшукується
мода за формулою:![]()
, (15)
де
- нижня межа модального інтервалу;
- розмір модального
інтервалу;
,
,
-
частоти модального, попереднього та
наступного за модальним інтервалів.
Визначимо моду за даними інтервального ряду з табл. 5.1. Порівнюючи між собою частоти (кількість проданих облігацій кожної групи), легко вибрати найбільшу з них – 170. З цього виходить, що саме інтервал номінальної доходності облігацій “24-28” є модальним, тому, розраховуючи моду, використаємо його нижню межу – 24, його розмір - 4 (28 - 24), його частоту 170, а також частоти попереднього (75) та наступного (120) інтервалів. Маємо:
%.
Таким чином, частіше за все серед проданих на аукціоні облігацій зустрічалася їх номінальна доходність у розмірі 26,62%.
Досить часто, даючи характеристику узагальнюючим показникам статистичної сукупності, віддають перевагу моді (перед середньою величиною). Так, наприклад, під час вивчення цін, що складаються на ринках міста, фіксують та оцінюють у динаміці частіше не середні ціни на окремі види товарів, а модальні; вивчаючи попит населення на певні розміри взуття чи одягу, перевага віддається визначенню модальних розмірів (середній розмір у даному випадку зовсім не має значення): більше виробляти та постачати у торговельну мережу слід ті розміри товарів, котрі користуються найбільшим попитом, тобто є модальними.
Крім розглянутого аналітичного способу визначення моди у інтервальних рядах розподілу її можна встановити графічно (рис. 5.1). Для цього будується стовпчикова діаграма – гістограма, на якій модальний інтервал визначається значеннями абсциси відрізка прямої, який є основою прямокутника з найбільшою висотою. Наприклад, на рис. 5.1, де наведено гістограму інтервального ряду розподілу з рівними інтервалами (за даними табл. 5.1), модальний інтервал можна побачити відразу: це інтервал 24-28, оскільки саме йому відповідає прямокутник з найбільшою висотою.
К
ількість
облігацій,
шт. 200


150
50


20-24 24-28 28-32 32-36
Номінальна доходність облігацій, %
Рис. 5.1. Графічне визначення моди за гістограмою.
Щоб знайти конкретне значення моди, необхідно від відрізка прямої на осі абсцис перейти до точки на цій самій осі, а саме до абсциси точки, на яку падає перпендикуляр, опущений з точки перетину відрізків прямих, що з’єднують два верхні кути найвищого прямокутника гістограми і протилежні верхні кути прилеглих до нього з двох сторін прямокутників. Графічне визначення моди за допомогою гістограми проілюстровано на рис. 5.1 пунктирною лінією.
Нарешті, мода має не тільки самостійне значення, але й виконує роль допоміжного показника біля середньої величини – вона характеризує типовість середньої. Якщо середня арифметична за своїм значенням наближається до моди, то з цього виходить, що сама середня є типовою та дає близьке до дійсності уявлення про середнє значення ознаки одиниць сукупності.
Медіана (
)
- це варіанта,
яка розташована
у середині ранжируваного ряду і
ділить його
на дві рівні частини.
Для визначення медіани слід встановити її порядковий номер у ряду, для чого обчислюють напівсуму частот. Якщо ранжируваний ряд містить парне число членів, то беруться два з них у середині та медіана буде дорівнювати середній арифметичній з цих двох значень варіант. Звернемося до даних табл.4.1. Число одиниць сукупності (сума частот) складає 10, тобто напівсума дорівнює 5. З цього виходить, що у середині ряду знаходяться два елементи 5-й та 6-й. Їм відповідають дві варіанти: 6,5 та 6,5. Зрозуміло, що і проста середня арифметична з них становитиме теж 6,5, яка й буде медіаною для цього ряду. Це слід розуміти так, що у половини автомашин щомісячний пробіг буде меншим, ніж 6,5, а у другій половині – більшим за 6,5 тис. км.
Якщо ранжируваний
ряд містить непарне число членів, то
для знаходження порядкового номера
медіани слід до числа членів ряду додати
одиницю і отриману суму поділити на
два. Медіаною буде значення варіанти
в одиниці сукупності, що знаходиться
на отриманому порядковому місті.
Припустимо, що у табл. 4.1 є відомості
не про 10, а про 11 автомашин. Тоді порядковий
номер медіани – шостий
,
а медіанним є щомісячний пробіг саме
шостої автомашини, тобто 6,5 тис. км.
У рядах розподілу, після встановлення порядкового номера медіани, слід визначити суму накопичених частот – це дає змогу відокремити групу, до якої належить медіана за своїм порядковим номером.
У дискретному ряді медіана встановлюється візуально (без будь-яких розрахунків) відразу після визначення медіанної групи, а в інтервальному – перш за все з того ж принципу встановлюється медіанний інтервал, та лише після цього розраховується медіана за формулою:
,
(16)
де
- нижня межа медіанного інтервалу;
- розмір медіанного
інтервалу;
- сума частот;
-
сума накопичених частот до медіанного
інтервалу;
- частота медіанного
інтервалу.
Згідно із записаною формулою, до нижньої межі медіанного інтервалу додається така частина розміру цього інтервалу, яка припадає на частку одиниць даної групи, котрих не вистачає до порядкового номера медіани. Іншими словами, розрахунок медіани будується виходячи з припущення, що накопичення ознаки серед одиниць кожної групи відбувається рівномірно.
За цих умов можливо розрахувати медіану інакше: після визначення медіанного інтервалу слід від його верхньої межі відняти ту частину інтервалу, яка припадає на частку одиниць, що перевищують порядковий номер медіани:
, (17)
де
- верхня межа медіанного інтервалу;
-
сума накопичених частот з медіанним
інтервалом.
Проілюструємо використання наведених формул ( (16) та (17)) за даними табл. 5.1. Додамо до неї ще один рядок з накопиченими частотами (табл. 5.3).
Таблиця 5.3.
Допоміжна таблиця для ілюстрації розрахунку медіани
|
Номінальна доходність облігацій, % |
до 24 |
24-28 |
28-32 |
32 та більше |
Разом |
|
Кількість проданих облігацій, шт. |
75 |
170 |
120 |
135 |
500 |
|
Накопичені частоти, шт. |
75 |
245 |
365 |
500 |
|
З величини суми частот (500) виходить, що середина ряду знаходиться між двома одиницями сукупності: 250-ою та 251-ою (500:2). Обидві з цих одиниць належать до третьої групи, тому що перші дві групи охоплюють лише 245 одиниць (див. останній рядок табл. 5.3). Таким чином, саме третій інтервал і є медіанним. Визначимо медіану за наведеними вище формулами:
або
.
Про отриманий результат слід зробити такий висновок: у половині проданих на аукціоні облігацій номінальна доходність менша, ніж 28,2%, а у другої половини – більша.
Медіану в інтервальних рядах розподілу також можна визначити графічно за допомогою кумуляти розподілу, яка ще називається кумулятивним полігоном (рис. 5.2). При побудові кумуляти на базі даних інтервального ряду розподілу на осі абсцис відкладаються межі інтервалів (при цьому за абсцису беруть верхні або нижні межі інтервалів), а на осі ординат – кумулятивні частоти або частки. Здобуті у такий спосіб координати точок з’єднують відрізками прямих і дістають відповідні кумуляти розподілу.

Накопичені 500
частоти,
шт. 400
300
200
100

20-24 24-28 28-32 32-36
Номінальна доходність облігацій, %
Рис. 5.2. Графічне визначення медіани за кумулятою.
Для встановлення медіани з точки на осі накопичених частот (або часток), що відповідає 50%, проводять паралельно осі абсцис пряму лінію до перетину із кумулятою. Після цього з точки перетину слід опустити перпендикуляр на вісь абсцис. Медіаною буде абсциса точки, у яку потрапить перпендикуляр на осі. Графічне визначення медіани за допомогою кумулятивного полігону показано за даними табл. 5.1 на рис. 5.2 пунктирними лініями.
Медіані притаманна така властивість: сума абсолютних відхилень кожної варіанти від медіани є найменшою у порівнянні з аналогічними розрахунками відносно середньої величини, або будь-якої іншої варіанти. Ця властивість медіани широко використовується у проектних роботах, коли треба забезпечити оптимальне розташування зупинок міського транспорту, бензоколонок на автостраді, підприємств побутових послуг тощо.
Де розташувати бензоколонку?56
На автостраді довжиною 100 км знаходяться 10 гаражів. Для проектування будівництва бензоколонки були зібрані відомості про передбачуване число виїздів на заправлення з кожного гаража (табл.5.4). Необхідно розташувати бензоколонку так, щоб загальний пробіг автомашин на заправлення був найменшим.
Таблиця 5.4
Розташування гаражів на автостраді та передбачуване число виїздів автомашин до бензоколонки
|
На якому км шосе розташований гараж, (х) |
7 |
26 |
28 |
37 |
40 |
46 |
60 |
78 |
86 |
92 |
Разом |
|
Число їздок, що передбачається, (f) |
10 |
15 |
5 |
20 |
5 |
25 |
15 |
30
|
10 |
65 |
200 |
|
Накопичені частоти, (S) |
10 |
25 |
35 |
50 |
55 |
80 |
95 |
125 |
135 |
200 |
|
Варіант 1. Якщо бензоколонку встановити на самому початку шосе, то загальний пробіг автомашин до неї (М) з урахуванням кількості виїздів становитиме :
= 7 · 10 + 26 · 15 + 28 · 5 + …. + 86 · 10 + 92 · 65 =
12770 (км).
Варіант 2. Якщо бензоколонку розташувати на середині автостради, тобто на 50-му км, то пробіг до неї буде складати (також з урахуванням кількості виїздів):
а) в одному напрямку:
=
(50 - 7)·10 + (50 - 26)·15+ (50 – 28)·5 + …+(50 - 46)·25 =
1310 (км);
б) у протилежному напрямку:
= (60 - 50)·15+ (78 - 50)·30 + (86 - 50)10 + (92 - 50)·65 =
4080 (км).
Загальний пробіг дорівнюватиме: 1310 + 4080 = 5390 (км).
Варіант 3. Визначимо медіану ряду, для чого в останньому рядку таблиці серед накопичених частот знаходимо групу, до якої належать серединні номери частот (це 100 та 101). У цій групі накопичена частота дорівнює 125, а відповідна їй варіанта становить 78, то це й є медіана. Так ось, якщо бензоколонку встановити на медіанному ( 78-му) кілометрі , то пробіг автомашин буде:
а) в одному напрямку:
= (78 - 7)·10 + (78 - 26)·15 + (78 - 28)·5 + …+ (78 -
60)·15= 3640 (км);
б) у протилежному напрямку:
= (86 - 78)10 + (92 - 78) · 65 = 990 (км).
Загальний пробіг становитиме 4630 км (3640 + 990), що менш ніж за іншими варіантами.
