Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бакалавр.робота(2010).doc
Скачиваний:
2
Добавлен:
09.09.2019
Размер:
8.3 Mб
Скачать

2.3 Використання комп’ютерних технологій при обробленні статистичної інформації.

Важливим способом вивчення і оцінки результатів діяльності організації є економіко-математичне моделювання.

Виконання бакалаврської випускової роботи передбачає використання студентами комп'ютерних технологій та економіко-математичних методів і моделей, як інструментів економічних досліджень та аналізу.

Доцільно щоб даний підрозділ включав:

  • Формування вхідної інформаційної бази та специфікація моделі;

  • Попередній економетричний аналіз моделі;

  • Розрахунок параметрів моделі та її оцінювання.

Формування вхідної інформаційної бази та економіко-математичної моделі починається з постановки задачі. Для цього формується мета дослідження та формуються економічні змінні (показники).

Цілями економетричного моделювання можуть бути: економічний аналіз об’єкта або процесу; прогнозування економічних показників; імітація розвитку об’єкта.

Вибір економічних показників пов’язаний із темою роботи. Зокрема, відбираються залежна або пояснювана змінна (Y) та незалежні або пояснюючі змінні (Х1, Х2,…, Хр). При виборі змінних слід здійснити економічне обґрунтування кожної з них. Не доцільно включати у модель велику кількість незалежних змінних, як правило, їх кількість у початковій моделі не повинна перевищувати трьох-чотирьох. Здійснюючи вибір незалежних змінних необхідно уникати мультиколінеарності (пояснюючі змінні не повинні бути пов’язані між собою лінійною залежністю та тісною кореляційною залежністю).

Наприклад, на прибуток до оподаткування від експортної продукції деревообробного підприємства (залежна змінна, Y) впливають такі економічні показники (незалежні змінні) як:

  • витрати на 1 грн. виготовленої продукції на експорт (Х1);

  • фондовіддача (Х2);

  • фондоозброєність (Х3);

  • виробіток експортної продукції на одного працівника (Х4).

Очевидно, що показники Х1, Х2 та Х4 лінійно пов’язані між собою (через показник „товарної продукції” на експорт). Крім того, лінійно пов’язані показники Х2 та Х3 (через „середньорічну вартість основних засобів”, що приймають участь у виготовленні продукції на експорт). Х3 та Х4 (через „середньооблікову чисельність працівників”, що беруть участь у виготовленні експортної продукції та її реалізації ).

Зрозуміло, що модель з такими незалежними змінними буде мультиколінеарною, що призведе до неможливості правильної оцінки її параметрів. Тому для уникнення строгої мультиколінеарності доцільно вищезазначені незалежні змінні замінити аналогічними за змістом економічними показниками, використавши для цього більш повно первинну інформацію.

Зокрема, показник Х1 можна замінити на близький за економічним змістом показник “витрати на 1 грн. реалізованої на експорт продукції” (Х'1), показник Х2 доцільно вилучити, показник Х3 можна модифікувати у “фондоозброєність робітників”, що виготовляють продукцію на експорт (позначивши його як Х'2), а показник Х4 можна залишити без змін (лише позначивши його як Х'3).

Тепер можна провести специфікацію економетричної моделі (тобто виразити у математичній формі економічні співвідношення).

Припустимо, що “істинну” залежність прибутку до оподаткування експортної продукції підприємства від економічних показників його діяльності можна представити такою економетричною моделлю:

Y = β0 – β1Х'1 + β2Х'2 + β3Х'3 + ε, (2.1)

де β0, β1, β2, β3 – “істинні” коефіцієнти регресії, які необхідно оцінити;

ε – неспостережуваний випадковий член.

Далі необхідно сформувати інформаційну базу для даної моделі. Для проведення мінімально достовірних та обґрунтованих розрахунків кількість спостережень не може бути менша за 10-12. Для одержання вибірки даного обсягу можливі такі варіанти:

  1. річні показники за 10 років;

  2. піврічні показники за 5-6 років;

  3. квартальні показники за 3 роки.

У випадку неможливості формування вибірки на основі реальних матеріалів підприємства – об’єкта бакалаврської роботи, дозволяється за рішенням наукового керівника використати в якості інформаційної бази дані інших підприємств галузі, або умовні дані.

На основі даних спостережень за діяльністю підприємства (підприємств) (або умовних даних) можна побудувати вибіркову економетричну модель:

yі = b0 - b1х'і1 + b2х'і2 + b3х'і3 + eі, і = 1,2,...,n, (2.2)

де b0,b1,b2, b3 – оцінки коефіцієнтів регресії;

eі – оцінка випадкового члена;

n – обсяг вибірки (кількість спостережень).

Попередній економетричний аналіз може містити:

  • побудову кореляційних полів для кожної пари змінних (х1), (х2, у), (х3, у);

  • розрахунок рівнянь парної регресії, побудову ліній трендів та визначення коефіцієнтів детермінації для кожної пари змінних; оцінку адекватності відповідних рівнянь парної регресії;

  • розрахунок коефіцієнтів кореляції для кожної пари змінних та оцінку їх значущості; оцінку тісноти зв’язку між кожною незалежною та залежною змінною окремо;

  • розрахунок парних коефіцієнтів кореляції між незалежними змінними (х1, х2), (х1, х3), (х2, х3). Попередні висновки щодо наявності нестрогої мультиколінеарності у моделі.

Побудова кореляційних полів для кожної пари включає виділення області числових значень відповідної незалежної та залежної змінних. Несуміжні області виділяють наступним чином: виділіть одну область, наприклад х1, натисніть клавішу Ctrl і, не відпускаючи її, виділіть область у. Далі виберіть майстер діаграм, вкажіть тип діаграми – точкову, дайте назву діаграмі та осям. Якщо потрібно змінити шкалу діаграм кореляційного поля, то двічі натисніть ліву кнопку миші на позначці шкали потрібної осі. У вкладці ШКАЛА вкажіть мінімальне чи максимальне значення потрібної осі.

Проаналізуйте характер зв’язку між кожною незалежною змінною та у на основі розташування точок кореляційного поля та економічної суті показників, що досліджуються.

Розрахунок рівнянь парної регресії, побудова ліній трендів та визначення коефіцієнтів детермінації, оцінка адекватності рівнянь парної регресії здійснюються у наступній послідовності.

На відповідній точковій діаграмі (кореляційному полі) станьте на будь-яку точку (вкажіть «мишею»), виберіть у контекстному меню (права кнопка «миші») ДОБАВИТЬ ЛИНИЮ ТРЕНДА, вкажіть тип залежності – лінійна, задайте параметри – ПОКАЗЫВАТЬ УРАВНЕНИЕ та ПОМЕСТИТЬ ВЕЛИЧИНУ ДОСТОВЕРНОСТИ АППРОКСИМАЦИИ. Результати розрахунків зобразіть у роботі у вигляді графічних ілюстрацій (рис. 2.1)

Фондоозброєність, тис. грн./особу

Рис. 2.1 Залежність прибутку від фондоозброєності

Оцініть адекватність відповідних рівнянь парної регресії за допомогою коефіцієнтів детермінації R2j, j = 1,2,3. Оцініть значущість рівнянь парної регресії за F-критерієм Фішера-Снедекора:

. (2.3)

Величина R2 показує, яка частка варіації залежної змінної обумовлена варіацією пояснюючої змінної. Чим ближче R2 до одиниці, тим краще регресія апроксимує емпіричні дані.

Для застосування F-критерію необхідно обрати рівень довірчої ймовірності p, нехай p = 0,95. За статистичними таблицями F-розподілу визначається табличне значення на рівні p при ступенях свободи k1 = 1, k2 = n-2Fp,k1,k2 (див. [9, с.188-191]). Якщо F>Fp,k1,k2, то відповідне рівняння парної регресії вважається значущим (адекватним реальній дійсності) з довірчою ймовірністю p.

Розрахунок коефіцієнтів кореляції для кожної пари, оцінка їх значущості та тісноти зв’язку.

Розрахуйте коефіцієнти кореляції для кожної пари змінних за допомогою функції КОРРЕЛ:

  • викличте майстер функцій (ƒ*);

  • виберіть серед функцій – статистичні;

  • виберіть функцію – КОРРЕЛ;

  • у вікні Массив1 вкажіть область х1;

  • у вікні Массив2 вкажіть область у.

Аналогічні розрахунки здійснюються також для кожної пари змінних 2,у), (х3,у).

Оцініть тісноту кореляційного зв’язку між кожною парою досліджуваних показників за допомогою відповідних коефіцієнтів кореляції: ryx1, ryx2, ryx3. Прийнято вважати, що якщо: |r| < 0,25 ÷ 0,3, то залежність слабка; |r| < 0,4 ÷ 0,6, то залежність середня; |r| < 0,7 ÷ 0,8, то залежність сильна, її необхідно враховувати; |r| > 0,8, то залежність є достатньо щільною щоби дослідити її форму.

Оцініть значущість відповідних парних коефіцієнтів кореляції за допомогою t-критерію Ст'юдента

. (2.4)

Для перевірки значущості обирається певний рівень довірчої ймовірності p = 0,95. Далі визначається табличне значення t-статистики tp,k з k = n-2 ступенями свободи (див. [9, с.187]). Якщо |t| > tp,k, то з довірчою ймовірністю p можна вважати, що величини хj та у є лінійно кореляційно залежними (прямо або обернено).

Розрахунок парних коефіцієнтів кореляції між незалежними змінними (х12), (х13), (х23).

Розрахуйте парні коефіцієнти кореляції між незалежними змінними rх1х2, rх1х3, rx2x3 за допомогою функції КОРРЕЛ. Оцініть тісноту кореляційного зв’язку між незалежними змінними. Якщо існують пари незалежних змінних, які мають високі значення коефіцієнтів кореляції (rxixj > 0,8), то це може свідчити про наявність нестрогої мультиколінеарності. Проте, такий висновок може бути лише попереднім, тому що висока кореляція незалежних змінних є достатньою, але не необхідною умовою існування мультиколінеарності.

Розрахунок параметрів моделі та її оцінювання здійснюється наступним чином.

Провести розрахунок параметрів економетричної моделі в електронних таблицях Microsoft Excel можна двома способами.

1. За допомогою інструментів пакету АНАЛИЗ ДАННЫХ.

2. За допомогою статистичної функції ЛИНЕЙН.

Спочатку за допомогою інструментів пакету «Аналіз даних» виконайте команди у такій послідовності: СЕРВИС АНАЛИЗ ДАННЫХ → РЕГРЕССИЯ. Якщо інструменти пакету відсутні в меню, встановіть їх так:

  • виконайте команди СЕРВИС → НАДСТРОЙКИ;

  • активізуйте ПАКЕТ АНАЛИЗА і натисніть кнопку ОК;

  • знову виконайте команди СЕРВИС → АНАЛИЗ ДАННЫХ → РЕГРЕССИЯ.

Відкрийте діалогове вікно РЕГРЕССИЯ. У вікно „Входной интервал Y” введіть діапазон даних залежної змінної. Діапазон повинен складатись з одного стовпця. У вікно „Входной интервал X” введіть діапазон даних незалежних змінних.

Опція МЕТКИ активізується лише якщо перший рядок вхідних інтервалів Y та Х містить заголовки. Якщо вхідні інтервали містять лише числові дані, то опція МЕТКИ повинна бути знята.

Опція УРОВЕНЬ НАДЕЖНОСТИ активізується, якщо Ви хочете використати надійність, додаткову до рівня 95%, який використовується програмою автоматично.

Активізуйте селективну кнопку ВЫХОДНОЙ ИНТЕРВАЛ. У вікні вихідного інтервалу вкажіть ліву верхню комірку вихідного діапазону. Відведіть не менше семи стовпців для вихідного підсумкового діапазона, який буде містити: результати дисперсійного аналізу; коефіцієнти регресії; стандартну похибку у; стандартні похибки коефіцієнтів регресії; t-статистики для коефіцієнтів регресії; довірчі інтервали з рівнем надійності 95% для коефіцієнтів регресії.

Для проведення додаткового більш глибокого аналізу моделі можна також активізувати кнопки ОСТАТКИ, ГРАФИК ОСТАТКОВ, СТАНДАРТИЗОВАННЫЕ ОСТАТКИ, ГРАФИК ПОДБОРА, ГРАФИК НОРМАЛЬНОЙ ВЕРОЯТНОСТИ (погоджується з науковим керівником).

Для одержання результатів розрахунків натисніть кнопку ОК.

Якщо програмне забезпечення Вашого комп'ютера не дозволяє використати пакет АНАЛИЗ ДАННЫХ, провести розрахунки параметрів моделі можна за допомогою статистичної функції ЛИНЕЙН.

На вільному місці виділіть діапазон із чотирьох стовпців (якщо незалежних змінних – 3) і п'яти рядків.

Викличіть майстер функцій (f*) і виберіть статистичну функцію ЛИНЕЙН.

У вікно „Известные значения у” введіть діапазон даних залежної змінної (один стовпець).

У вікно „Известные значения х” введіть діапазон даних залежних змінних.

У вікно „Конст” запишіть ИСТИНА (при цьому розраховується константа b0, якщо ж записати ЛОЖЬ, то b0 приймається рівним нулю).

У вікно „Статистика” запишіть ИСТИНА (при цьому розраховуються додаткові регресійні статистики). Якщо аргумент „Статистика” має значення ЛОЖЬ, або не заповнений, то функція ЛИНЕЙН розраховує тільки коефіцієнти регресії b0, b1,... bр.

Формула функції ЛИНЕЙН повинна бути введена як формула масиву. Для цього натисніть клавішу F2, а далі – клавіші Ctrl + Shift + Enter (клавіші Ctrl та Shift утримуються). Якщо формула не буде введена як формула масиву (кнопка ОК), то буде виведене лише одне число.

Якщо формула вводиться як формула масиву, то розраховуються такі параметри економетричної моделі (табл. 2.1).

Таблиця 2.1

Параметри економетричної моделі

 

А

В

С

D

1

b3

b2

b1

b0

2

Sb3

Sb2

Sb1

Sb0

3

R2

S

-

-

4

F

k

-

-

5

ESS

RSS

-

-

Умовні позначення до табл. 2.1:

b0, b1, b2, b3 – оцінки коефіцієнтів регресії;

Sb0, Sb1, Sb2, Sb3стандартні похибки оцінок коефіцієнтів регресії;

R2 – коефіцієнт детермінації;

S – стандартна похибка оцінки у;

F – значення F-статистики Фішера-Снедекора;

k – кількість ступенів свободи;

ESS – сума квадратів, пояснена регресією;

RSS – залишкова сума квадратів.

Оцінювання моделі.

Мірою тісноти кореляційного зв'язку всіх незалежних змінних із залежною є коефіцієнт множинної кореляції R.

Якщо розрахунки парметрів були проведені за допомогою функції ЛИНЕЙН, то коефіцієнт множинної кореляції визначається як арифметичне значення кореня квадратного з коефіцієнта множинної детермінації (використайте математичну функцію КОРЕНЬ):

(2.5)

Коефіцієнт множинної кореляції лежить у межах 0 ≤ R ≤ 1.

Оцініть тісноту зв'язку за допомогою коефіцієнта множинної кореляції та перевірте його значущість на основі t-критерію Ст'юдента з k = n-p-1 ступенями свободи:

, (2.6)

де n –обсяг вибірки;

р – кількість незалежних змінних.

Коефіцієнт множинної кореляції R між залежною та незалежними змінними буде статистично значущим (тобто між Х1, Х2, ... , Хр та Y існує лінійний кореляційний зв'язок), якщо

t > tp , n - p - 1 (2.7)

де tp , n - p - 1 – табличне значення t-розподілу для довірчої ймовірності p = 0,95 з k = n-p-1 ступенями свободи.

Оцініть значущість рівняння множинної регресії в цілому за допомогою F-критерію Фішера-Снедекора. Рівняння множинної регресії вважається значущим (адекватним) з довірчою ймовірністю p =0,95 , якщо

F > FP ,k1, k2, (2.8)

де k1 = р(кількість незалежних змінних);

k2 = n - р - 1;

FP ,k1, k2 – табличне значення F-критерію з k1 = р та k2= n - р - 1 ступенями свободи для заданого рівня довірчої ймовірності.

Оцініть значущість коефіцієнтів регресії, за допомогою t-статистик. Якщо Ви використали інструмент РЕГРЕССИЯ, то t-статистики вже розраховані, якщо функцію ЛИНЕЙН – то розрахуйте їх за формулою:

(2.9)

Якщо |tj| > tp, n – p – 1, то оцінка bj відповідного параметра βj є статистично значущою з довірчою ймовірністю p.

Для того, щоби визначити як оцінки коефіцієнтів регресії bj пов'язані з „істинними” параметрами βj, необхідно розглянути довірчі інтервали для цих параметрів. Якщо Ви провели розрахунки за допомогою інструмента РЕГРЕССИЯ, то довірчі інтервали вже розраховані. Дайте оцінку їх межам.

Якщо розрахунки проведені за допомогою функції ЛИНЕЙН, то довірчі інтервали можна розрахувати за формулою:

bj - tp, n – p–1 · Sвj < βj < bj + tp,n–- p – 1 · Sвj, j = 0,1,2,…, р. (2.10)

Зробіть висновки щодо результатів оцінювання економетричної моделі. Можна використовувати дані моделі для визначення факторів впливу на рентабельність і т.п., а також використовувати інші методи і моделі залежно від об’екту дослідження.