Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5 стат.docx
Скачиваний:
2
Добавлен:
03.03.2016
Размер:
510.47 Кб
Скачать

2 Методологічні основи статистичного аналізу соціально-економічних явищ і процесів

2.1 Методологія статистичних групувань. Оформлення статистичного угрупування у вигляді ряду розподілу та його графічне зображення.

Якщо статистична сукупність потребує розподілу на групи за кількісною ознакою, то необхідно визначити величину інтервалу. При цьому розкривають різні підходи до її визначення. Серед методів визначення ширини рівних інтервалів розглядають метод Стреджеса та метод середнього квадратичного відхилення.

За методом Стреджеса ширину кожного інтервалу визначають за формулою

(2.1)

де Хmax, Хmin - найбільше та якнайменше значення ознаки,

m - кількість груп.

Кількість груп визначається або самостійно, або за формулою:

m = 1 + 2,30259 lg n, (2.2)

де n — обсяг сукупності;

m — число інтервалів (груп).

Визначаючи межі інтервалів, ширину h доцільно округлювати.

Надалі, шляхом добавлення величини інтервалу до мінімального значення ознаки у групі («нижньої границі»), одержують групи об'єктів за розміром аналізованої ознаки. Результати такого угрупування надаються у таблиці за формою таблиці 2.1

Таблиця 2.1 - Схема угрупування

№ групи

Межі групи

Кількість одиниць сукупності

в абсолютному вираженні

% до підсумку

….

Разом

100,0

Таким чином, на основі групування одиниць спостереження за однією ознакою та підрахунків числа одиниць в кожній групі одержують ряд розподілу, який складає'ться з двох елементів: варіант (окремі значення ознаки, що варіює) та частот.

Ряд розподілу за величиною груповочної ознаки можливо представити графічно у вигляді полігону або гістограми.

Для побудови графіків розподілу за варіаційними рядами застосовують, як правило, прямокутну систему координат, при цьому на осі абсцис відкладають значення варіюючої ознаки, а на осі ординат – відповідні частоти або частки, чи щільності розподілу.

Для графічного зображення дискретного варіаційного ряду використовують полігон розподілу. Його зображують у прямокутній системі координат, де на осі абсцис відкладають значення варіант x, а на осі ординат – частоти f. Одержані точки з координатами xi та fi з’єднують прямими лініями. Для замикання полігону кінцеві вершини з’єднують з точками на осі абсцис, які відстоять на одну поділку від xmax і xmin.

Рисунок 2.1 – Полігон розподілу студентів фінансового факультету за курсами

Графічне зображення інтервального варіаційного ряду будується у вигляді гістограми.

При побудові гістограмми для інтервального ряду з рівними інтервалами на осі x відкладаються межі інтервалів та, використовуючи відрізки, що представляють інтервали, як підстави, будують на них прямокутники з висотою, рівній частоті даного інтервалу [5].

На рис.2.1 представлена гістограмма наведеного вище (табл.2.1) розподілу робітників за розміром місячної заробітної плати.

Рисунок 2.2 - Гістограма розподілу працівників сільськогосподарського підприємства за розміром заробітної плати

2.2 Розрахунок середньої та характеристик варіації. Оцінка довірчих меж для середньої.

Найбільш поширеною формою статистичних показників, що використовуються в соціально-економічних дослідженнях, є середня величина. Вона представляє собою узагальнюючу кількісну характеристику ознаки в статистичній сукупності. Показник в формі середньої величини відображає типові риси і надає узагальнюючу характеристику однотипних явищ за однією варіативною ознакою. Він відбиває рівень цієї ознаки, віднесений до одиниці сукупності.

У статистичній практиці середні величини поділяють на два великі класи:

  • ступеневі середні;

  • структурні середні.

До ступеневих середніх відносять такі найбільш відомі види як середня геометрична, середня арифметична та середня квадратична. Як структурні середні розглядаються мода і медіана.

Ступеневі середні в залежності від форми надання вихідних даних можуть бути простими або зваженими.

Проста середня величина розраховується за не згрупованими даними і має наступний загальний вигляд:

, (2.3)

де xi – індивідуальне значення варіативної ознаки (варіанта);

m – показник ступеня середньої;

n – число варіант.

Зважена середня розраховується за згрупованими даними і має загальний вигляд:

(2.4)

де xi – варіанта (значення) варіативної ознаки або серединне значення інтервалу, в якому вимірюється варіанта;

m – показник ступеня середньої;

fi – частота, яка показує скільки разів зустрічається і-те значення ознаки.

В залежності від того, яке значення приймає показник ступеня (m), розрізняють наступні види ступеневих середніх (табл. 2.3).

Таблиця 2.2 - Види ступеневих середніх

Вид ступеневої середньої

Показник ступеня

Формула розрахунку

Проста

Зважена

Середня гармонійна

m= - 1

, m=xf

Середня геометрична

m→0

Середня арифметична

m=1

Середня квадратична

m=2

Середня кубічна

m=3

При вивченні закономірностей розподілу застосовують середню арифметичну, варіації – середню квадратичну, інтенсивності розвитку – середню геометричну. Різні види середніх, обчислені для одних і тих же даних, мають різну величину. Співвідношення між ними має наступний вигляд і називається правилом мажорантності середніх (тобто при збільшенні показника ступеня т збільшується і відповідна середня величина):

.

В статистичній практиці частіше, ніж інші види середніх, використовують середню арифметичну та середню гармонійну.

Середня арифметична – одна з найбільш поширених, застосовується в тих випадках, коли обсяг варіативної ознаки для всієї сукупності є сумою індивідуальних значень її окремих елементів.

Середня хронологічна розраховується при аналізі показників, які задані дискретно, тобто у формі величин, що характеризують явище на пені моменти часу, певні дати.

Якщо показники характеризують аналізоване явище за період, розбитий на рівні проміжки часу, то середня величина у таких випадках визначається як середня хронологічна за формулою:

, (2.5)

де п – число моментів.

Середня гармонійна застосовується в тих випадках, коли нам не відомі самі варіанти, а відомі або їхні обернені числа (тоді використовується середня гармонійна проста), або добуток одиниць сукупності на значення ознаки (тобто m=x*f) (тоді використовують середню гармонійну зважену).

Середню гармонійну використовують, наприклад, для визначення середніх затрат праці, часу, матеріалів на одиницю продукції, на одну деталь за двома (трьома тощо) підприємствами, робітниками, які зайняти виготовленням одного й того ж виду продукції, однієї й тієї ж деталі.

Середня геометрична найчастіше використовується для розрахунку середнього значення за індивідуальними відносними показниками динаміки.

Середня геометрична визначається як добуток відносних величин динаміки хі, які є кратним співвідношенням і-го значення показника до попереднього (і-1). Формула середньої геометричної:

, (2.6)

де п – число осереднюваних величин.

Для осереднення ознак рангової шкали застосовують нормований середній бал. Спочатку слід ранжирувати значення ознаки в порядку зростання якості.

Нормований середній бал обчислюється за формулою:

, (2.7)

де - середньозважений ранг відповідей (, дех – ранг, - частка відповідей, %);

- середина шкали рангів ();

- розмах шкали рангів ()

Структурні середні. Особливий вид середніх величин – структурні середні – використовують для вивчення внутрішньої побудови рядів розподілу. Найчастіше використовують показники моди й медіани.

Мода (Мо) – це значення варіанти, яка найчастіше повторюється в ряді розподілу. У дискретному ряді моду легко відшукати візуально за максимальною частотою, або часткою. Наприклад, в результаті опитування населення щодо самовизначення матеріального стану за чотирма градаціями (добрий, задовільний, незадовільний, нестерпний) більшість респондентів визначили свій стан як незадовільний. Або у розподілі сучасних сімей за кількістю дітей найпоширенішими є малодітні сім’ї, що мають одну дитину. Зустрічаються ряди, що мають дві моди (бімодальний ряд) або декілька (полімодальний). Наприклад, на фондовому ринку однаково високим попитом користуються як найдешевші акції, так і дорогі. В інтервальному ряді легко відшукати модальний інтервал, а приблизне значення моди обчисляють за формулою:

(2.8)

де хМо – нижня межа модального інтервалу;

іМо – велична (розмір) модального інтервалу;

fMo – частота модального інтервалу;

fMо-1 – частота передмодального інтервалу;

fMo+1 – частота післямодального інтервалу.

Медіана (Ме) – варіанта, яка припадає на середину упорядкованого ряду розподілу і ділить його на дві рівні за обсягом частини. Так, якщо в ряді розподілу робітників за віком Ме=34, то це означає, що половина з них менші за цей вік, половина – старші цього віку. У дискретному ряді для знаходження медіани обчислюють півсуму частот, і визначають значення ознаки, для якої накопичена частота (частка) дорівнює або перевищує половину обсягу сукупності. В інтервальному ряду в такий спосіб визначається медіанний інтервал, а значення медіани в інтервалі визначається за формулою:

, (2.9)

де xMe – нижня межа медіанного інтервалу;

iMe – величина (розмір) медіанного інтервалу;

- півсума частот;

SMe-1 – сума накопичених частот перед медіанного інтервалу;

fMe – частота медіанного інтервалу.

У симетричних рядах розподілу значення моди та медіани збігаються з середньою величиною ().

Варіація ознаки є властивістю статистичної сукупності і зумовлена дією безлічі взаємопов’язаних причин, серед яких є основні і другорядні. Основні формують центр розподілу, другорядні – варіацію ознаки, сукупна їх дія – форму розподілу.

Конкретні умови, в яких знаходиться кожний з об’єктів, що вивчається, а також особливості їхнього власного розвитку (соціальні, економічні тощо) виражаються відповідними числовими рівнями статистичних показників. Таким чином, варіація, тобто незбіг (несовпадение) рівнів одного й того ж показника у різних об’єктів, має об’єктивний характер і допомагає пізнати сутність явища, що вивчається.

Дослідження варіації в статистиці та соціально-економічних дослідженнях має велике значення, тому що величина варіації ознаки в статистичній сукупності характеризує її однорідність [6].

В статистичній практиці для вивчення та вимірювання варіації використовують різноманітні показники варіації в залежності від поставленого завдання. До них відносяться розмах варіації, середнє лінійне відхилення, середній квадрат відхилень (дисперсія), середнє квадратичне відхилення і коефіцієнт варіації.

Розмах варіації (R) є найпростішим вимірювачем варіації ознаки. Це різниця між найбільшим і найменшим значенням ознаки:

, (2.10)

Однак розмах варіації показує лише крайні значення ознаки. Повторюваність проміжних значень не враховується.

Середнє лінійне відхилення () представляє собою середню величину із відхилень варіантів ознаки від їхньої середньої. Його можна розрахувати за формулою середньої арифметичної простої або зваженої в залежності від відсутності або наявності часток в ряду розподілу.

- просте середнє лінійне відхилення,

- зважене середнє лінійне відхилення,

де xs – і-тий варіант ознаки;

fs – питома вага і-того варіанту;

n – кількість варіантів;

- середня арифметична величина.

Показник середнього лінійного відхилення знайшов широке застосування на практиці. За його допомогою аналізуються, наприклад, склад працюючих, ритмічність виробництва, рівномірність постачань матеріалів, розробляються системи матеріального стимулювання.

Треба пам’ятати, що алгебраїчна сума відхилень від середнього рівня дорівнює нулеві, тобто середнє значення відхилення для будь-якої випадкової величини прямує к нулю. Тому в статистичних наукових дослідженнях для виміру варіації частіше використовують показник дисперсії.

Дисперсія (- сігма-квадрат) представляє собою середній квадрат відхилень індивідуальних значень ознаки від її середньої величини. Дисперсія розраховується за формулами простої середньої незваженої і зваженої відповідно:

, (2.11)

(2.12)

На практиці застосовують більш просту формулу для розрахунку дисперсії:

, (2.13)

Середнє квадратичне відхилення (σ) – це корінь другого ступеню із середнього квадрата відхилень певних значень ознаки від їх середньої:

(для незгрупованих даних) (2.14);

(для згрупованих даних) (2.15).

Для порівняння варіації різних ознак або однієї ознаки в різних сукупностях використовують відносні показники варіації. Коефіцієнти варіації розраховуються як відношення абсолютних характеристик варіації () до центру розподілу і часто виражаються процентами. Отже:

  1. Коефіцієнт осциляції: (2.16)

  2. Лінійний коефіцієнт варіації: (2.17)

  3. Квадратичний коефіцієнт варіації: (2.18)

В статистиці сукупності, що мають коефіцієнт варіації (Vσ) більший 30-35%, вважаються неоднорідними.

Враховуючи, що аналіз показників буде проводитися за вибірковими даними, визначають поняття довірчих меж показника, у тому числі наводять відповідні формули. Так межі довірчого інтервалу для середньої визначаються на основі точкової оцінки та граничної помилки вибірки . Наприклад, для факторного показника визначення довірчих меж ввідбувається наступним чином:

; (2.19)

де — стандартна (середня) помилка вибірки;

t— квантиль розподілу ймовірностей (коефіцієнт довіри, що відповідає ймовірності).

Величину стандартної помилки можна визначити за формулою для відбору:

повторного

(2.20)

безповторного

(2.21)

де n - обсяг вибірки,

D – частка вибіркової сукупності в генеральній

2.3 Методологія побудови та аналізу моделі парної регресії

Оскільки статистичні явища пов'язані між собою та обумовлюють одне, то необхідні спеціальні статистичні методи аналізу, які дозволяють вивчити форму, близькість та інші параметри статистичних взаємозв'язків. Одним з таких методів є кореляційний аналіз. На відміну від функціональних залежностей, при яких зміна будь-якої ознаки – функції – повністю та однозначно визначається зміною іншої ознаки-аргументу, при кореляційних формах зв'язку змінам одного або декількох факторів відповідає зміна середнього значення результативної ознаки. При цьому фактори, що розглядаються визначають результативну ознаку повністю.

За даними курсової роботи на рівень продуктивності праці впливають не тільки показники фондомісткості, стажу та інші, але й багато інших: технічний рівень виробництва, характер організації праці і т.д. У тому випадку, якщо досліджується зв'язок між одним фактором та однією ознакою, зв'язок має назву однофакторного та кореляція є парною. Якщо досліджується зв'язок між декількома факторами та однією ознакою, зв'язок має назву багатофакторного та кореляція є множинною.

На першому етапі дослідження взаємозв'язків між факторами необхідно з множини факторів, які сформовані шляхом інтуїтивних міркувань, відібрати ті, які дійсно вагомі з точки зору їхнього впливу на показник. Рішення завдань такого виду здійснюється за допомогою дисперсійного аналізу – однофакторного, якщо перевіряється істотність впливу того чи іншого фактора, або багатофакторного у випадку вивчення впливу на нього комбінації факторів.

Для вивчення зв'язку між явищами та їх ознакам будують кореляційну таблицю та аналітичне угрупування.

Кореляційна таблиця – це спеціальна комбінаційна таблиця, в якій наведено групування за двома пов'язаними ознаками: факторною та результативною. Концентрація частот біля діагоналей матриці свідчить про наявність кореляційного зв'язку між ознаками.

Аналітичне угрупування дозволяє вивчити взаємозв'язок факторної та результативної ознаки. Основні етапи проведення такого угрупування:

1. Обґрунтування факторної та результативної ознаки.

2. Підрахунок кількості одиниць в кожній з груп, що утворені.

3. Визначення обсягу ознак, що варіюють, в границях створених груп.

4. Розрахунок середніх значень результативної ознаки.

Результати групування оформлюються у таблиці (див. табл. 2.3).

Кількість груп можна визначити за формулою Стреджесса, методом «сігм» або прийняти самостійно.

Таблиця 2.3- Схема аналітичного угрупування

Межі угрупування по факторній ознаці, хj

Кількість одиниць сукупності,

fi

Середнє значення результативної ознаки у групі j, уj

f1

у1

f2

у2

::

::

Разом

fi

х

Відомо, що якщо сукупність розбито на групи за певною ознакою х, то для будь-якої іншої ознаки у можна обчислити середню як у цілому по сукупності, так і в кожній групі. Центром розподілу сукупності в цілому є загальна середня

або або(2.22)

центром розподілу в j-й групі — групова середня

або (2.23)

де fi – частота і-го елементу сукупності,

nj = fj - обсяг j-ї групи,

n - обсяг сукупності

Для перевірки істотності зв'язку можна використовувати характеристику F-критерій (критерій Фішера), який визначається за формулою:

, (2.24)

де ,- відповідно факторна (міжгрупова) та залишкова дисперсія

k1, k2 - число ступенів свободи відповідно факторної та залишкової дисперсії

= m - 1;

= n – m (2.25)

де n, m - відповідно число одиниць сукупності та кількість груп.

(2.26)

(2.27)

Тобто

, (2.29)

де

(2.30)

(2.31)

де уij – значення показника у, якій відповідає і-му елементу в j–й групі

- середнє значення показника у в j–й групі

Надалі одержане розрахункове значення F порівнюється за табличним (критичним), для визначеного рівня істотності  (звичайно 0,05 або 0,01) та ступенів свободи k1 та k2 .

Якщо Fрозр ≤ F табл, то вплив відповідного фактора визнається неістотним. Якщо, навпаки, Fрозр ≥ Fтабл – вплив істотний. Сформований у результаті процедури, що описана, набір істотних факторів використовується на наступних етапах дослідження: при побудові відповідних парних моделей регресії або рівняння множинної регресії.

Надалі проведемо дослідження зв'язку між одним фактором та однією ознакою, тобто аналіз моделі парної регресії. Рівняння регресії будемо досліджувати у вигляді Y=| (де Y — розрахунковий (теоретичний) рівень результативної ознаки).

Розрахунок коефіцієнтів рівняння можна здійснити за формулами

(2.32)

Необхідно побудувати кореляційне поле за емпіричними (вихідними) даними та «наложити» на нього лінію регресію, що побудована за визначенним рівнянням регресії, що дозволяє зробити попередні висновки про відповідність рівняння вихідним даним.

Вплив та напрямок однофакторного зв'язку характеризує лінійний коефіцієнт кореляції, який можна визначити за формулою

(2.33)

Зауважимо, що за формулою лінійного коефіцієнту розраховуються також парні коефіцієнти кореляції, які характеризують тісноту зв'язку між парами змінних, що розглядаються (без урахування їх взаємодії з іншими змінними).

Показником тісноти зв'язку між результативною та факторною ознакою є коефіцієнт детермінації (множинної кореляції)

(2.34)

де — загальна дисперсія ознакиy;

- факторна дисперсія;

σ- залишкова дисперсія

(2.35)

(2.36)

(2.37)

де Y, у|в| - відповідно розрахункові та фактичні значення результативної ознаки.

Тобто

(2.38)

Якщо , це свідчить про лінійний зв'зок міжхтау.

Для встановлення адекватності моделі можна також використовувати F-критерійФішера

(2.39)

Тобто у випадку парної кореляції для лінійної моделі розрахункове значення Fможна знайти за формулою

(2.40)

Як і в методі аналітичних групувань, надалі одержане розрахункове значення F порівнюється за табличним (критичним) для визначеного рівня істотності  (звичайно 0,05 або 0,01), тобто з Fα(1, n-2). Якщо Fрозр ≤ F табл, то вплив відповідного фактора визнається неістотним. Якщо, навпаки, Fрозр ≥ Fтабл – вплив істотний.

Необхідно також здійснювати оцінку статистичної значущості коефіцієнтів b0таb1.Така оцінка здійснюється за допомогоюt-критерію Ст'юдента. При цьому визначають розрахункові (фактичні) значення:

- для параметру b1

(2.41)

- для параметру b0

(2.42)

де S(b)– середньоквадратичне відхилення відповідного параметру

(2.43)

(2.44)

де S2(b)– дисперсія відповідного параметру

Розрахункові значення t-критерію Ст'юдента порівнюють з табличними, які обираються в залежності від рівня істотностіта числа ступенів свободи

n-m-1 (деn– обсяг вибірки,m- кількість факторних ознак, що включено до моделі, тобто для однофакторної моделі число ступенів свободи дорівнюєn-2). Критичні значення можна визначити за додатком 3 (наприклад, для одностороньої критичної областіt0,05;14=1,76). Параметр визнається істотним, якщо розрахункове значення більше табличного [7].

За відповідними розрахунками можливо також одержати прогноз довірчого інтервалу для значення yn+1та для його математичного очікуванняMyn+1.

Для значення yn+1границі довірчих меж визначаються за формулою

(2.45)

Для значення Myn+1границі довірчих меж визначаються за формулою

, (2.46)

де S2- незсунена оцінка для залишкової вибіркової дисперсії

, (2.47)

2.4. Методологія множинного регресійного аналізу.

Економічні явища залежать від великої кількості факторів. Тому на практиці часто використовують рівняння множинної|факторів| регресії, коли на величину результативної ознаки впливають два і більш фактори.

Одна з умов кореляційного аналізу - однорідність досліджуваної інформації. Критерієм однорідності інформації служать коефіцієнти варіації, які розраховуються по кожному факторному й результативному показнику. Коефіцієнт варіації показує відносну міру відхилення окремих значень від середньоарифметичної.

Після|потім| відбору факторів і оцінки початкової|вихідної| інформації важливим|поважним| завданням|задачею| є|з'являється| моделювання зв'язку між факторним|факторами| і результативним показником. На практиці найчастіше використовують багатофакторні лінійні моделі |факторів| і моделі, які приводяться|наводять| до лінійного вигляду|виду| відповідними перетвореннями, тобто|цебто|

(2.48)

Рішення задачі багатофакторного кореляційного аналізу передбачає визначення парних коефіцієнтів кореляції, які характеризують тісноту зв'язку між парами змінних, що розглядаються (без врахування їхньої взаємодії з іншими змінними). Парні коєфіцієнти кореляції можна розрахувати за формулою лінійного коефіцієнту (див. формулу 2.16).

Показником тісноти зв'язку між результативною та факторними ознаками є коефіцієнт множинної кореляції. У випадку лінійного двохфакторного зв'язку він може бути розрахован за формулою

(2.49)

де r– лінійні (парні) коефіцієнти кореляції.

Значення цього коефіцієнту змінюється від 0 до 1. Коефіцієнт R2має назву множинного коефіцієнту детермінації та показує, яка частка варіації результативної ознаки обумовлена впливом факторів, що враховано.

Наступним етапом кореляційно регресійного аналізу є побудова рівняння множинної регресії та визначення невідомих параметрів b0, b1 ,b2 ,….,bmобраноїх функції. Наприклад, рівняння двохфакторної лінійної регресії має вигляд

(2.50)

де Y- розрахункові значення результативної ознаки,

хі– значення факторних ознак,

b0, b1 ,b2параметри рівняння регресії

Для визначення параметрів ,... необхідно скласти і вирішити систему нормальних рівнянь.При двох факторах система рівнянь набуває вигляду

(2.51)

Рівняння лінійної множинної регресії можна також одержати, використовуючи програму «Microsoft Excel – Статистические функции – ЛИНЕЙН». Функція ЛИНЕЙН повертає масив {bm; bm-1; ... ; b1;b}, де m - кількість факторних ознак, що включено до моделі Синтаксис функції ЛИНЕЙН (відомі_значення_y;відомі_значення_x;конст;статистика)

Відомі_значення_y - це безліч значень y, що уже відомі для співвідношення y = b1x1 + b2x2 + ... + b

  • Якщо масив відомі_значення y має один стовпець, то кожний стовпець масиву відомі значення x інтерпретується як окрема змінна.

  • Якщо масив відомі значення y має один рядок, то кожний рядок масиву відомі значення x інтерпретується як окрема змінна.

  • Відомі значення x - це необов'язкова множина значень x, що уже відомі для співвідношення y = b1x1 + b2x2 + ... + b

  • Масив відомі значення x може містити одне або декілька множин змінних. Якщо використовується тільки одна змінна, то відомі значення y і відомі значення x можуть бути масивами будь-якої форми за умови, що вони мають однакову розмірність. Якщо використовується більш однієї змінної, то відомі значення y повинні бути вектором (тобто інтервалом висотою в один рядок або шириною в один стовпець).

  • Якщо відомі значення x опущені, то передбачається, що це масив {1;2;3;... } такого ж розміру як і відомі значення y.

  • Конст - це логічне значення, що вказує, чи потрібно, щоб константа b дорівнювала 0.

  • Якщо конст має значення ИСТИНА або опущена, то b обчислюється звичайним способом.

  • Якщо конст має значення ЛОЖЬ, то b покладається рівним 0 і значення bі підбираються так, щоб виконувалося співвідношення y = bx.

  • Статистика - це логічне значення, що вказує, чи потрібно повернути додаткову статистику по регресії.

  • Якщо статистика має значення ЛОЖЬ або опущена, то функція ЛИНЕЙН повертає тільки коефіцієнти bі і постійну b.

У цьому випадку регресійна статистика повертається за формою таблиці 2.4

Таблиця 2.4 – Регресійна статистика

bm

bm-1

.

b2

b1

b

  • Якщо статистика має значення ИСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику (див. табл. 2.5)

Таблиця 2.5 – Додаткова регресійна статистика

bm

bm-1

.

b2

b1

b

….

R2

- стандартна помилка для оцінки у

F-критерій

df (ступені свободи)

Наступним етапом є розрахунок та перевірка статистичної значущості коефіцієнту детермінації, що відповідає визначеному теоретичному рівнянню, та значущості коефіцієнтів регресії.

Коефіцієнт детермінації, який надає оцінку загальної якості моделі, розраховується за формулою

(2.52)

де

Перевірку статистичної істотності коефіцієнту детермінації можна здійснити за допомогою критерію Фішера, розрахункове значення якого визначається за формулою

(2.53)

де n– обсяг вибірки,

m- кількість факторних ознак, що включено до моделі (кількість змінних у рівнянні)

Одержане розрахункове значення F порівнюється з табличним для визначеного рівня істотності , тобто з Fα (m; n -m -1). Якщо Fрозр ≥ Fтабл – коефіцієнт детермінації статистично значущ.

Оцінка істотності коефіцієнтів регресії здійснюється за допомогою t-критерію Ст'юдента. При цьому визначають розрахункові (фактичні) значення

(2.54)

де - оцінка стандартної помилки коефіцієнту

Розрахункові значення t-критерію Ст'юдента порівнюють з табличними, які обираються в залежності від рівня істотностіта числа ступенів свободи

n-m-1. Параметр визначається істотним, якщо розрахункове значення перевищує табличне [8].

Висновки по розділу 2

1.До основних методологічних основ статистичного аналізу соціально-економічних явищ та процесів належать методологія статистичних групувань, методологія середніх величин та показників варіації, методологія рядів динаміки та методологія статистичних прийомів вивчення взаємзв’язків.

2. Методологія статистичних групувань залежить від виду ознаки, що групується, на основі проведеного групування можливо робити висновки про наявність зв’язку між ознаками. В результаті спостереження та групування статистичних матеріалів, отримують цифрові показники, які характеризують чи зміну явища в динамиці, чи розподілення одиниць сукупності за тими чи іншими вар’їруючими ознаками у статиці. При рівності фінтервалів існує формула Стреджеса, за допомогою якої визначають кількість груп при відомій чисельності сукупності.

3. За допомогою середніх можливо зрівнювати між собою різні сукупності за вар’їруючими ознаками. Середні показники широко використовуються для характеристики закономірностей розвитку явищ а процесів. Для того, щоб середня була достовірною, сукупність повинна бути якісно однорідною по відношеннь до ознаки, що осереднюється. Вибіркові характеристики дають можливість визначити межу зміни показників, що аналізуємо, генеральної сукупності. В роботі наведені формули основних видів середніх величин, формули середнього лінійного відхилення, дисперсії, середнього квадратичного відхилення, коефіцієнта варіації, формули оцінки середніх та стандартних помилок.

4.Для дослідження взаємозв'язків між факторами необхідно з множини факторів, які сформовані шляхом інтуітивних міркувань, відібрати ті, які дійсно вагомі з точки зору їхнього впливу на показник. Рішення завдань такого виду здійснюється за допомогою дисперсійного аналізу – однофакторного, якщо перевіряється істотність впливу того чи іншого фактора, або багатофакторного у випадку вивчення впливу на нього. комбінації факторів. Для вивчення зв'язку між явищами та їх ознакам будують кореляційну таблицю та аналітичне угрупування.