Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 стат.doc
Скачиваний:
27
Добавлен:
06.02.2016
Размер:
1.52 Mб
Скачать

1 Теоретичні основи використання статистичних методів при аналізі показників діяльності підприємств

1.1 Підготовка вихідних аналітичних даних. Засоби їх графічного представлення.

Будь-яке статистичне дослідження послідовно проходить три етапи, проте перед його початком необхідно провести відповідну підготовку. Підготовча частина передбачає вивчення проблеми дослідження, розробку його напрямків, визначення понятійного апарату та низку інших питань методологічного й матеріально-технічного забезпечення дослідження.

Перший етап - збір первинного матеріалу через реєстрацію фактів або опитування респондентів.

Другий етап полягає в тому, що зібрані дані підлягають систематизації та групуванню: від характеристики окремих елементів переходять до узагальнених показників у формі абсолютних, відносних або середніх величин.

Третій етап передбачає аналіз варіації, динаміки, взаємозалежностей. За результатами аналізу висновки можуть бути описані в текстовій формі, подані у формі таблиць і графіків.

Поняття про статистичне спостереження

Початковою стадією статистичного дослідження є збір статистичної інформації про соціальні процеси в суспільстві, тобто статистичне спостереження.

Статистичне спостереження - це планомірний, науково організований процес збирання даних щодо масових явищ і процесів, які відбуваються в різних сферах життя суспільства, шляхом їх реєстрації за спеціальною програмою, розробленою на основі статистичної методології.

Статистичне дослідження неможливе без розробки плану статистичного спостереження, який містить:

- програмно-методологічні;

- організаційні питання.

Програмно-методологічна частина плану охоплює формулювання гіпотези, розробку понятійного апарату дослідження, визначення мети, встановлення об'єкта й одиниць спостереження, складання програми спостереження.

Організаційна частина плану статистичного спостереження - це перелік заходів, які забезпечують успішне виконання роботи зі збирання й обробки матеріалів. Організаційний план статистичного спостереження визначає місце, час і органи спостереження, календар спостереження, графік підготовки й інструктажу кадрів, джерела та способи одержання даних, матеріально-технічну базу спостереження, систему перевірки результатів спостереження.

Одиниця сукупності - це первинний елемент об'єкта спостереження, який існує, та ознаки якого реєструються. У кримінально-правовій статистиці одиницею сукупності буде кожний окремий злочин, кожна окрема особа, яка вчинила злочин.

Одиниця спостереження - це джерело інформації, тобто первинний заклад або установа, від якої одержують необхідні статистичні дані. У правовій статистиці одиницею спостереження є суд, відділ внутрішніх справ тощо.

Одиниця виміру характеризує, в яких одиницях обчислюється досліджувана сукупність. Скажімо, у кримінально-правовій статистиці злочинність вимірюється кількістю зареєстрованих злочинів, осіб, які їх вчинили, кількістю розкритих і нерозкритих злочинів, кримінальних справ тощо.

Cистематизація та групування вихідних даних

  1. Суть статистичного зведення

Зареєстровані у процесі статистичного спостереження значення ознак відбивають увесь діапазон варіації, яка об’єктивно існує в сукупності. При цьому у поодиноких відомостях губиться загальне, закономірне. Для встановлення закономірностей, закладених в даних, необхідна їх систематизація. Така систематизація відбувається завдяки зведенню. Статистичне зведення - це впорядкування, систематизація і наукова обробка даних.

Суть статистичного зведення полягає в тому, що матеріали спостереження класифікують та агрегують. Елементи сукупності за певними ознаками об’єднують у групи, класи, типи, а інформацію про них агрегують як у межах груп, так і в цілому по сукупності. Основне завдання зведення - виявити типові риси та закономірності масових явищ чи процесів. Зведення є основою подальшого аналізу статистичної інформації.

Складові статистичного зведення такі:

1) розробка програми систематизації та групування даних;

2) обґрунтування системи показників для характеристики груп і сукупності в цілому;

3) проектування макетів таблиць, в яких подаються результати зведення;

4) визначення технологічних схем обробки інформації, программного забезпечення;

5) підготовка даних до обробки на комп’ютері, формування автоматизованих банків даних;

6) безпосереднє зведення, узагальнення, розрахунок показників.

Тобто, програма систематизації та групування даних передбачає вибір групувальних ознак і правил формування груп. Результати статистичного зведення подаються у формі статистичних таблиць, макети яких розроблюються разом з програмою обробки даних. За формою обробки даних зведення бувають централізованими та децентралізованими.

У статистичній практиці інформація обробляється переважно децентралізовано. Так, у разі обробки статистичної звітності зведення здійснюється від нижчої до вищої ланки управління: звіти підприємств зводяться регіональними статистичними органами, підсумки по регіонах передаються в Держкомстат, де узагальнюються в цілому по країні. Матеріали переписів, одноразових статистичних обстежень, соціологічних опитувань надходять до єдиного центру, де й обробляються. Така форма зведення називається централізованою.

2. Класифікації та групування.

Групування полягає в розділенні сукупності на групи по істотним для них ознаках. Традиційно цей поділ виконують за такою схемою: із множини ознак, які

описують явище, добирають розмежувальні, а потім сукупність поділяють на групи та підгрупи відповідно до значень цих ознак.

Головний принцип будь-якого поділу ґрунтується на двох положеннях:

1) в один клас, групу об’єднуються елементи певною мірою подібні між собою;

2) ступінь подібності між елементами, які належать до одного класу, значно вищий, ніж між елементами, що належать до різних класів.

Основою групування може бути будь-яка атрибутивна чи кількіcна ознака, що має градації. Таку ознаку називають групувальною. Залежно від складності масового явища (процесу) та мети дослідження групувальних ознак може бути одна, дві й більше.

У статистичній практиці часто вдаються до розбиття сукупностей за атрибутивними ознаками — класифікації та номенклатури. Їх розробляють міжнародні й національні статистичні органи.

У міжнародній статистиці відома галузева класифікація видів економічної діяльності, стандартна класифікація занять, стандартна торговельна класифікація. Різновидом класифікації є товарні номенклатури, наприклад Брюссельська митна номенклатура. Кожній класифікаційній позиції надається код (шифр), який замінює її назву і є постійним засобом ідентифікації під час передавання інформації по каналах зв’язку, комп’ютерної обробки тощо.

Поряд з класифікацією використовують групування, на які покладаються такі аналітичні функції:

1) вивчення структури та структурних зрушень;

2) визначення типів соціально-економічних явищ, виокремлення однорідних груп і підгруп;

3) виявлення взаємозв’язків між ознаками.

Згідно з цими функціями розрізняють три види групувань: структурне, типологічне, аналітичне.

Структурне групування характеризує склад якісно однорідної сукупності за певними ознаками, оскільки у межах такої сукупності значення ознак варіюються. Різновидом структурних групувань є ряди розподілу.

Ряд розподілу складається з двох елементів: варіант та частот. Варіантами є окремі значення груповочної ознаки, а частотами - числа, які показують, скільки разів повторюються окремі значення варіант. Замість частоти може бути використана частість (частка або відсоток від загальної чисельності одиниць).

Типологічне групування — це поділ якісно неоднорідної сукупності на класи, соціально-економічні типи, однорідні групи. Основне завдання такого групування - ідентифікація типів. Вибір групувальної ознаки та кількісних міжгрупових меж ґрунтується на всебічному теоретичному аналізі суті явища, його характерних рис та особливостей формування в конкретних умовах часу та простору.

Для графічного подання рядів розподілу використовують три види графіків: гістограму, полігон та кумуляту.

Гістограма — це послідовність стовпчиків, розміщених вертикально (вертикальна гістограма) чи горизонтально (горизонтальна гістограма). Кожний стовпчик має висоту (або довжину), пропорційну кількості (або частці, або відсотку) об'єктів, що мають відповідне значення ознаки.

Якщо центри верхніх горизонтальних ліній стовпчиків гістограми з'єднати відрізками прямої, то вийде фігура, яку називають "полігон розподілу".

Кумулята призначена для графічного подання рядів розподілу з нагромадженими частотами. Це може бути стовпчикова діаграма (для дискретного та атрибутивного рядів розподілу – лінійний графік). 

Аналіз варіації

У статистиці під варіацією розуміють мінливість, коливання значень ознак у одиниць сукупності. В результаті зведення та групування одержують ряди розподілу, які характеризують склад або структуру сукупності за певною варіюючою ознакою. Однак варіацію можна вивчати не тільки на основі рядів розподілу, але й по індивідуальних, незгрупованих даних.

Варіація зумовлена дією багатьох факторів, які поділяються на систематичні та випадкові.

При вивченні варіації вирішуються три головних завдання  (відповідно існує й  три групи показників):

- характеристика центру розподілу (середня, мода і медіана);

- характеристика розміру та ступеня варіації;

- характеристика виду та типу розподілу.

Вивчення варіації має велике значення з точки зору аналізу диференціації соціально-економічних явищ та процесів. Показники варіації покладено в основу вивчення взаємозв’язку між ознаками (дисперсійний аналіз), а також вибіркового спостереження. Варіація є також характеристикою однорідності сукупності за певною ознакою: чим менше є варіації, тим більш однорідною є сукупність.

Види взаємозв’язків між явищами та процессами

Одним із найважливіших завдань статистичного аналізу є вивчення та кількісна оцінка взаємозв’язків між соціально-економічними явищами та процесами. Статистичні закономірності взаємозв’язків між ознаками є причинно-наслідковими. Для виникнення певного наслідку необхідні причини та умови, які називають факторами. Ознака, яка характеризує наслідок дії фактора або факторів, має назву результативної. Відповідно, ознака, яка характеризує причину або умову називається факторною.

Усі багато чисельні взаємозв’язки між ознаками, котрі характеризують соціально-економічні явища і процеси, можна поділити на дві  групи: функціональні (детерміновані) і стохастичні (ймовірносні або кореляційні) зв’язки.

Функціональні (детерміновані) зв’язки характеризуються тим, що одному значенню факторної ознаки (Х) відповідає одне строго визначене (детерміноване) значення результативної ознаки (Y).  Ці зв’язки завжди є повними, тобто значення результативної ознаки на 100% залежить від факторної. Наприклад, тарифний денний заробіток (Y) при фіксованій годинній тарифній ставці залежить від кількості відпрацьованих годин (Х).

При стохастичному (кореляційному) зв’язку одному значенню факторної ознаки (Х) може відповідати декілька значень результативної ознаки (Y).

Важливою особливістю цих зв’язків є те, що вони мають риси статистичної закономірності та проявляються у масі спостережень, при достатньо великій чисельності сукупності. Названі зв’язки є неповними, тому що завжди існують невраховані фактори,  отже значення Y залежить від значень Х менше, ніж на 100%.

За напрямком зміни факторної та результативної ознак зв’язки поділяються на прямі  та обернені. При прямому зв’язку обидва показники змінюються в одному напрямку, тобто при збільшенні Х зростає також й Y. При оберненому зв’язку напрямок зміни показників протилежний, тобто при зростанні Х зменшується Y.

За аналітичним виразом зв’язки поділяються на лінійні та нелінійні. В залежності від числа факторних ознак розрізняють одно факторні (парні) та багатофакторні (множинні) зв’язки. Для різних-видів взаємозв’язків використовуються відповідні методи їх статистичного дослідження та оцінки.

Поняття про ряди динаміки

Ряди статистичних величин, які характеризують зміну явищ у часі, мають назву рядів динаміки. Вони складаються з двох елементів – показника часу (t) та рівнів ряду динаміки (у). Рівні ряду динаміки – це числові значення показника,  котрі розташовані у хронологічній послідовності та відносяться до відповідного моменту або періоду часу.

Ряди динаміки мають велике значення для дослідження закономірностей зміни соціально-економічного розвитку у часі (закономірностей динаміки), для прогнозування та статистичного моделювання.

Найважливішою умовою побудови рядів динаміки є співставність усіх рівнів. Неспівставність може виникнути з багатьох причин: територіальні та адміністративні зміни, перегляд методики розрахунку показників, їх одиниць виміру, зміна цін тощо. 

1.2. Використання середніх величин та характеристик варіації при аналізі економічних показників.

Середня величина є узагальнюючою мірою ознаки, що варіює, у статистичній сукупності. Показник у формі середньої характеризує рівень ознаки в розрахунку на одиницю сукупності. В середній взаємно компенсуються індивідуальні відмінності елементів та узагальнюються типові риси. Вона відображає характерний рівень ознаки, властивої всім елементам сукупності. Середня характеризуватиме типовий рівень лише за умови, що сукупність якісно однорідна. Крім того, типовий рівень ознаки проявляє себе лише у разі узагальнення масових фактів.

Середня дозволяє здійснювати порівняльний аналіз декількох сукупностей. Зокрема, можливо порівняння однотипних підприємств по рівню середньомісячного (середньорічного) обсягу виробництва, або аналіз динаміки середнього рівня обсягу виробництва одного підприємства за ряд періодів. Не слід змішувати середні з відносними величинами інтенсивності. Середня завжди узагальнює кількісну варіацію ознаки, яка в тій чи іншій мірі властива всім без виключення елементам сукупності. Відносна величина інтенсивності має зовсім інший характер. Наприклад, з розрахунку на одну сім'ю за матеріалами спостережень за рік виготовлено 4,6 л плодово-ягідних вин. Це, природно, не означає, що кожна з обстежених сімей обов'язково виготовляла якусь кількість вина. В даному випадку виробництво вина як ознака не є властивим всім сім'ям. Це відносна величина інтенсивності.

У кожному конкретному випадку використовується певний вид середньої, зокрема: середня арифметична; середня гармонічна; середня геометрична; середня квадратична і т. д. Середня вимірюється в тих самих одиницях, що й ознака. Залежно від характеру первинної інформації середня будь-якого виду може бути простою чи зваженою.

Середня арифметична величина є найбільш поширеним видом середньої. Вона використовується у тому випадку, коли обсяг варіюючої ознаки одержується як сума індивідуальних значень.

У великих за обсягом сукупностях окремі значення ознаки (варіанти) можуть повторюватись. Такий процес множення у статистиці називають зважування. Вагами можуть бути частоти або частки (відносні величини структури), іноді інші величини.

Функціонально середня зважена більш навантажена ніж проста середня, оскільки враховує повторюваність кожної варіанти і певною мірою відображує склад сукупності. Значення середньої зваженої залежить не лише від значень варіант, а й від структури сукупності. Чим більшу вагу мають малі значення ознаки, тим менша середня, і навпаки.

У структурованій сукупності при розрахунку середньої зваженої варіантами можуть бути як окремі значення ознаки, так і групові середні, кожна з яких має відповідну вагу у вигляді групових частот. Таку середню називають загальною середньою.

В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більш надійні й типові характеристики центра розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова аналізу закономірностей розподілу.

Для вимірювання та оцінювання варіації використовуються абсолютні та відносні характеристики. До абсолютних належать: розмах варіації, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики подаються низкою коефіцієнтів.

Розмах варіації - це різниця між найбільшим та якнайменшим значеннями ознаки R = хmax - xmin.

В інтервальному ряді розподілу розмах варіації визначають як різницю між верхньою межею останнього інтервалу й нижньою межею першого або як різницю між середніми значеннями цих інтервалів.

Перевагою варіаційного розмаху є простота його обчислення й тлумачення. Проте, коли частоти крайніх варіант надто малі, варіаційний розмах неадекватно характеризує варіацію. У таких випадках використовують квартильні або децильні розмахи. Квартильний розмах охоплює 50% обсягу сукупності RQ= Q3 - Q1.

Інші абсолютні характеристики варіації базуються на відхиленнях індивідуальних значень ознаки від середньої величини. Маємо наступні характеристики варіації: середнє лінійне та середнє квадратичне відхилення та дисперсію.

Середнє лінійне та середнє квадратичне відхилення є безпосередніми мірами варіації. Розглянуті абсолютні характеристики варіації мають одиниці вимірювання ознаки. При порівнянні варіації різних ознак або варіації однієї ознаки в різних сукупностях використовують відносні характеристики - коефіцієнти варіації (лінійний, квадратичний, осциляції, квартильний). Для оцінки однорідності сукупності та порівняння варіацій найбільш часто використовують квадратичний коефіцієнт варіації. В економічних розрахунках вважають, що сукупність є однорідною, а середня - типовою, якщо коефіцієнт варіації не перевищує 10-15% (в математиці ця величина складає 33%).

Дисперсія посідає особливе місце у статистичному аналізі соціально-економічних явищ. На відміну від інших характеристик варіації завдяки своїм математичним властивостям вона є невіддільним і важливим елементом інших статистичних методів, зокрема дисперсійного аналізу.

Для ознак метричної шкали дисперсія — це середній квадрат відхилень індивідуальних значень ознаки від середньої.

Загальна дисперсія характеризує варіацію ознаки у навколо загальної середньої. Групова дисперсія характеризує варіацію відносно групової середньої.

Оскільки в групи об’єднуються певною мірою схожі елементи сукупності, то варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо причинні комплекси, що формують варіацію в різних групах, неоднакові, то й групові дисперсії різняться між собою.

Узагальнюючою мірою внутрішньогрупової варіації є середня з групових дисперсій.

Різними є й групові середні. Мірою варіації їх навколо загальної середньої є міжгрупова дисперсія.

1.3. Статистичні методи вимірювання взаємозв'язків та їх роль у прогнозуванні економічних показників

Метод аналітичного групування полягає у тому, що сукупність розбивається на групи за факторною ознакою (Х), далі по кожній групі та по сукупності визначаються середні значення Х та Y. Порівняння середній значень факторної та результативної ознак дозволяє зробити певні висновки про наявність та напрямок взаємозв'язку між ними. Крім цього можна визначити показники співвідношення між приростами середніх за формулою:

(1.1)

де  - середні значення факторної та результативної ознаки по групах (групові середні).

Якщо наведене співвідношення по групах приблизно стале, між показниками існую взаємозв'язок.

Для оцінки тісноти взаємозв'язку між ознаками визначається емпіричне кореляційне відношення :

                                             

                                              (1.2)

де - міжгрупова дисперсія результативної ознаки;

     - загальна дисперсія результативної ознаки;

     - середня із внутрішньо групових дисперсій результативної ознаки.

Емпіричне кореляційне відношення змінюється в межах від 0 до 1. Чим ближче його значення наближається до 1, тим сильнішим є взаємозв'язок між ознаками. При  зв'язок вважається функціональним. Крім цього, визначається коефіцієнт детермінації (D), який показує, на скільки відсотків варіація Y зумовлена варіацією Х:

                                                        D=    (1.3)

Для перевірки суттєвості взаємозв'язку між Х та Y часто використовують запропонований Р.Фішером показник, який має назву F-критерія та визначається

за формулою :

                                                       (1.4)

де К2 = n-m, K1 = m-1 - число ступеней волі при кількості одиниць n та кількості груп m.

Критичні значення F-критерія для рівнів значимості 0,05 та 0,01 занесені у спеціальні таблиці. Із цих таблиць у відповідності зі значеннями К1 та К2 визначається так зване табличне значення F-критерія (Fтабл). Якщо виконується умова F>Fтабл , зв'язок між показниками можна вважати суттєвим, (невипадковим).

Стохастичні зв'язки, котрі характеризуються взаємодією середніх значень факторної та результативної ознак, називаються кореляційно-регресійними. Такі зв'язки досліджуються з допомогою кореляційно-регресійного аналізу.

Найважливішою характеристикою кореляційного зв'язку є ліній регресії, тобто функція, котра пов'язує середні значення Х та Y . Кореляційно-регресійна модель взаємозв'язку являє собою рівняння регресії, яке у загальному вигляді записується наступним чином:

                                                  (1.5)

де ух – теоретичні значення Y ;

     - лінія регресії;

     - залишкова компонента.

У парному кореляційно-регресійному аналізі переважно використовуються наступні функції (рівняння регресії):

  • лінійна                     

  • параболічна                

  • кубічна                       

  • степенева                           

  • гіперболічна            

Як відомо, більшість соціально-економічних показників формується  під впливом не одного, а багатьох факторів. Метод побудови моделі такого зв'язку має назву багатофакторного кореляційно-регресійного аналізу. В цьому випадку результативна ознака (Y ) пов'язується з допомогою рівняння множинної регресії з двома або більше факторними ознаками (Х1, Х2, Х3, . . . , Хm).

Найважливішими умовами побудови багатофакторної моделі зв'язку є достатня кількість одиниць у сукупності ( як мінімум у 8 разів більше, ніж число факторів) та відсутність мультиколінеарності факторів (близького до функціонального зв'язку між ними). В тому випадку, якщо два факторних показники мультиколінеарні, один з них повинен бути виключений з моделі.

На практиці використовуються два види рівнянь множинної регресії:

- лінійне (адитивне):                                    

- нелінійне (мультиплікативне):  ,                                    

де а0, а1, а2, ... , аm – параметри рівняння множинної регресії;

     Х1, Х2,Х3,. . ., Хm  - факторні ознаки.

Оцінка параметрів рівняння множинної регресії здійснюється методом найменших квадратів. Параметри а1, а2 , . . . , аm  називаються коефіцієнтами регресії та показують, на скільки одиниць змінюється у при збільшенні х на одиницю, при умові, що інші фактори є сталими. Наприклад, рівняння залежності ціни (Y) від рівня продуктивності праці (X1) та якості сировини (X2):

Ух = 10,2+12,6х1+0,7 х2 .

Для вимірювання тісноти взаємозв'язку між двома ознаками, що включені у модель, визначають парні коефіцієнти кореляції (ryx1, ryx2, rx1x2). Тісноту зв'язку між результативною ознакою (Y) та факторною (при спільному впливі всіх факторів) характеризують часткові коефіцієнти кореляції (Ryx1, Ryx2).

Тісноту взаємозв'язку між результативною ознакою та сукупністю всіх факторних ознак визначають на основі коефіцієнта множинної кореляції R. Величина D = R2 називається коефіцієнтом детермінації, що показує, на скільки процентів варіація Y обумовлюється варіацією всіх факторних ознак, включених у модель.

Висновки по розділу 1

1. Статистичне спостереження - це планомірний, науково організований процес збирання даних щодо масових явищ і процесів, які відбуваються в різних сферах життя суспільства, шляхом їх реєстрації за спеціальною програмою, розробленою на основі статистичної методології.

Будь-яке статистичне дослідження послідовно проходить три етапи,.Перший етап - збір первинного матеріалу через реєстрацію фактів або опитування респондентів.

Другий етап полягає в тому, що зібрані дані підлягають систематизації та групуванню: від характеристики окремих елементів переходять до узагальнених показників у формі абсолютних, відносних або середніх величин.

Третій етап передбачає аналіз варіації, динаміки, взаємозалежностей. За результатами аналізу висновки можуть бути описані в текстовій формі, подані у формі таблиць і графіків.

2. Середня величина є узагальнюючою мірою ознаки, що варіює, у статистичній сукупності. Середня дозволяє здійснювати порівняльний аналіз декількох сукупностей. У кожному конкретному випадку використовується певний вид середньої, зокрема: середня арифметична; середня гармонічна; середня геометрична; середня квадратична і т. д. Середня вимірюється в тих самих одиницях, що й ознака. Залежно від характеру первинної інформації середня будь-якого виду може бути простою чи зваженою.

3. Метод аналітичного групування полягає у тому, що сукупність розбивається на групи за факторною ознакою (Х), далі по кожній групі та по сукупності визначаються середні значення Х та Y. Найважливішими умовами побудови багатофакторної моделі зв'язку є достатня кількість одиниць у сукупності ( як мінімум у 8 разів більше, ніж число факторів) та відсутність мультиколінеарності факторів (близького до функціонального зв'язку між ними). В тому випадку, якщо два факторних показники мультиколінеарні, один з них повинен бути виключений з моделі. Тісноту взаємозв'язку між результативною ознакою та сукупністю всіх факторних ознак визначають на основі коефіцієнта множинної кореляції R. Величина D = R2 називається коефіцієнтом детермінації, що показує, на скільки процентів варіація Y обумовлюється варіацією всіх факторних ознак, включених у модель.