Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lekz 4_5_6 dlia pidstrahovky.doc
Скачиваний:
6
Добавлен:
13.08.2019
Размер:
621.06 Кб
Скачать

Тема 6. Ряди розподілу. Аналіз варіацій та форми розподілу. Основні поняття та категорії

Ряд розподілу характеризує склад, структуру су­купності за певною ознакою. Елементами ряду роз­поділу є варіанти — значення ознаки хj та частоти fj. Залежно від статистичної природи варіантів ряди поділяються на атрибутивні та варіаційні. У співвідношенні варіантів та частот проявляється закономірність розподілу. Вона описується низкою статистичних характеристик, зокрема:

а) частотні характеристики;

б) характеристики центру розподілу;

в) характеристики варіації;

г) характеристики нерівномірності розподілу, асиметрії, ексцесу.

Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи — частота fj та відносна частота— частка dj.

Очевидно, що , a або 100%.

Додатковою характеристикою варіаційних рядів є кумулятивна частота Sfj (частка Sdj), яка харак­теризує обсяг сукупності із значеннями варіант, які не перевищують хj. Кумулятивні частотні характерис­тики утворюються послідовним підсумовуванням аб­солютних чи відносних частот. Так, S1 = f1 ; S2 = f 1 + f 2 ; S3= f1 +f2 + f3 і т.д. Якщо інтервали варіаційного ряду нерівні, то використовують щільність частоти (част­ки) на одиницю інтервалу g j = f j / h j aбо g j = d j / h j., де h j — ширина j-го інтервалу.

До характеристик центру розподілу відносять середню, моду та медіану. Середня величина характеризує типовий рівень ознаки в сукупності. За да­ними ряду розподілу середня розраховується як арифметична зважена:

на основі частот

на основі часток

де т — число груп;

В інтервальних рядах, припускаючи рівномірний розподіл у межах j-го інтервалу, як варіант х j вико­ристовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою ж, як і сусіднього закритого інтервалу. Так, у ряду розпо­ділу, який характеризує попит на держоблігації на вторинному ринку (табл. 4.1), середній термін обер­тання облігацій становить

= 560 / 100=5,6 міс.

Таблиця 4.1

Термін обер­тання, міс.

X

Кількість про­даних держоблігацій, тис.од

f

Кумулятивна частота, тис.од.

Sf

Xj

Xj * f

До 2

15

15

1

15

2-4

13

28

3

39

4—6

29

57

5

145

6—8

22

79

7

154

8—10

12

91

9

108

10 і більше

9

100

11

99

Разом

100

X

X

560

Мода М0 — це найпоширеніше значення озна­ки, тобто варіанта, яка в ряду розподілу має найбіль­шу частоту (частку).

У дискретному ряду Мo визначається візуально за максимальною частотою, або часткою. Наприклад, в результаті опитування населення щодо самовизна­чення матеріального стану за чотирма градаціями (добрий, задовільний, незадовільний, нестерпний) більшість респондентів визначили свій стан як неза­довільний. Або у розподілі сучасних сімей за кількістю дітей найпоширенішими є малодітні сім'ї, що мають 1 дитину. Зустрічаються ряди, що мають дві моди (бімодальний ряд) або декілька (полімодальний). Наприк­лад, на фондовому ринку однаково високим попитом користуються як найдешевші акції, так і дорогі. В інтервальному ряду за найбільшою частотою визна­чається модальний інтервал. Конкретне значення моди в інтервалі обчислюється за формулою

Мo = Х0 + h , де х0 та h — відповідно нижня межа та ширина модального інтервалу; fmo , fmo-1, fmo+1 — частоти (ча­стки) модального, передмодального та післямодаль­него інтервалу.

За даними таблиці 4.1 найбільшим попитом ко­ристуються акції з терміном обертання в інтервалі 4—6 місяців. Це модальний інтервал, ширина якого h=2, а нижня межа х0 — 4, частота fm = 29, передмодальна частота fmo-1 =13, а післямодальна fmo+1 = 22. Модальний термін обертання облігацій становить

Мo = 4+ 2 * = 5,4 міс.

Медіана Мe — це варіанта, яка припадає на се­редину упорядкованого ряду розподілу і ділить його на дві рівні за обсягом частини. Медіана, як і мода, не залежить від крайніх значень варіант, тому за­стосовується для характеристики центру в ряду роз­поділу з невизначеними межами. Для визначення Мe у ряду використовують кумулятивні частоти Sf або частки Sd . у дискретному ряду медіаною буде значення ознаки, для якої кумулятивна частота Sf дорівнює або перевищує половину обсягу сукупності , або кумулятивна частка Sdj > 0,5. В інтервальному ряду у такий спосіб визначається меді­анний інтервал. Конкретне значення медіани в інтер­валі обчислюється за формулою

Мe =x0 + h , де х0 та h — відповідно нижня межа та ширина медіанного інтервалу; fme — частота медіанного інтер­валу; Sfme-1 кумулятивна частота передмедіанного інтервалу. За даними табл. 4.1 половина обсягу cукупності проданих облігацій 0,5 = 50.

Отже, кумулятивна частота Sme3 = 57 визначає, що п'ятидесята з початку ряду облігація знаходи­тиметься в інтервалі 4—6 з частотою f me = 29. Меді­анний термін обертання проданих облігацій стано­вить

Мe =4 + 2 * = 5,5 міс.

Тож половина облігацій продавалися з терміном обертання менше, ніж півроку — 5,5 міс, а полови­на — більше 5,5 міс.

У симетричних рядах розподілу значення моди та медіани збігаються з середньою величиною ( = Ме = М0, а в помірно асиметричних вони співвідно­сяться таким чином: 3* ( - Ме) -Мo .

У наведеному прикладі з табл. 4.1 співвідношен­ня характеристик центру розподілу облігацій за тер­міном обертання свідчить про помірну асиметрію: 3*(5,6 - 5,5) 5,6 - 5,4.

Для вимірювання та оцінки варіації використо­вують абсолютні та відносні характеристики. До абсолютних відносяться: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики представлені низкою ко­ефіцієнтів варіації, нерівномірності, локалізації, кон­центрації.

Варіаційний розмах характеризує діапазон варі­ації, це різниця між максимальним і мінімальним значеннями ознаки: R = х max - x min. Якщо крайні значення ознаки не типові для сукупності, то вико­ристовують квартильні або децильні розмахи. Квар­тальний розмах RQ = Q3 Q1 охоплює 50% обсягу сукупності, децильний RD2 = D8 - D2 60%, децильний RD1 = D9 – D 1 80%.

Узагальнюючою мірою варіації є середнє відхилення індивідуальних значень ознаки від центру розподілу. Оскільки алгебраїчна сума відхилень , то в розрахунках використовують або модулі , або квадрати (xj - )2 відхи­лень. Середній з модулів відхилень називають се­реднім лінійним відхиленням ; середній квадрат відхилень — дисперсією , корінь квадратний з дис­персії середнім квадратичним відхиленням :

;

За первинними незгрупованими даними наведені характеристики варіації розраховуються за принци­пом незваженої середньої, тобто:

;

Середнє лінійне та середнє квадратичне відхилення

— іменовані числа (в одиницях вимірювання ознаки)

— за змістом ідентичні, проте через математичні влас­тивості . У симетричному, близькому до нормаль­ного, розподілі , R = 6 .

Дисперсію використовують не лише для оцінки варіації, а й при вимірюванні взаємозв'язків, для перевірки статистичних гіпотез тощо. Для ознак метричної шкали розрахунок дисперсії ведеться за формулами

.

Як і будь-яка середня, дисперсія має певні мате­матичні властивості:

а) якщо всі значення ознаки х. зменшити (збільши­ти) на певну величину, дисперсія не зміниться;

б) якщо всі значення ознаки змінити в К разів, то дисперсія зміниться в K2 разів;

в) у разі заміни частот частками дисперсія не зміниться.

Для альтернативної ознаки, варіація якої має два взаємовиключні значення — "1" та "0", а розподіл характеризується відповідно двома частками — d2 та d0, дисперсія розраховується як добуток часток

У табл. 4.2 наведено розрахунок абсолютних ха­рактеристик варіації на прикладі терміну обертан­ня облігацій.

Таблиця 4.2

Термін обертання облігацій, міс.

f

х j

х j

/х j / f

(х j ) 2 f

До 2

15

1

-4,6

69,0

317,40

2-4

13

3

-2,6

33,8

87,88

4—6.

29

5

-0,6

17,4

10,44

6—8

22

7

1,4

30,8

43,12

8—10

12

9

3,4

40,8

138,72

10 і більше

9

11

5,4

48,6

262,44

Разом

100

X

X

240,4

860,00

Середній термін обертання облігацій 5,6 міс; середнє лінійне відхилення становить = 240,4:100 -= 2,4 міс; дисперсія — = 860:100 = 8,6; середнє квадратичне відхилення — = 2,9 міс

Частка облігацій з терміном обертання менше 2 міс становить d1 = 0,15. Дисперсія частки 2 = 0,15(1-0,15) = 0,1275.

Порівнюючи варіації різних ознак або однієї озна­ки у різних сукупностях, використовують відносні характеристики варіації. Коефіцієнти варіації роз­раховуються як відношення абсолютних, іменова­них характеристик варіації ( ) до центру роз­поділу і часто виражаються процентами, отже:

1) лінійний коефіцієнт варіації V l = * 100;

2) квадратичний коефіцієнт варіації * 100;

3) коефіцієнт осциляції VR = *100.

Наприклад , за даними вибіркових обстежень домогосподарств, середньодушові витрати на харчуван­ня становили 80 гр.од.; на придбання промислових товарів — 35; дисперсії відповідно — 256 та 196. Порівняти ступінь варіації витрат домогосподарств на харчування та придбання промислових товарів можна за допомогою квадратичного коефіцієнта варіації:

витрати на харчування * 100 = 20%;

витрати на придбання промислових товарів * 100 = 40%.

Існує певне обмеження варіації ознаки у сукупності.

Якщо оцінку варіації використовують, наприклад, для оцінки ризику (нестабільності) ситуації, то у випадку 0< <30% - варіацію вважають прийнятною (тобто в допустимих межах); 30%< <60% - варіація є значною (надмірна); >60% - варіація є неприйнятною.

Отже, рекомендують обмежувати варіацію ознаки у сукупності при оцінці соціально-економічних явищ на рівні <30%.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]