Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
моя шпора емм.docx
Скачиваний:
27
Добавлен:
20.02.2016
Размер:
887.86 Кб
Скачать

Лаба 1

Розв’язок.

Для розрахунку параметрів рівняння лінійної регресії будуємо розрахункову таблицю 2.

Таблиця 2

Среднее значение

85,6

155,8

13484,0

7492,3

24531,4

5,7

12,84

16,05

164,94

257,76

Примітка: - дисперсія факторної ознаки;- середнє значення факторної ознаки;- кількість спостережень;- дисперсія результативної ознаки;- середнє квадратичне відхилення факторної і результативної ознаки, відповідно.

;

.

Одержане рівняння регресії: .

Отже, зі збільшенням середньодушового прожиткового мінімуму (х) на 1 грн., середньодобова заробітна (у) плата зростає в середньому на 0,89 грн.

Тісноту лінійного зв'язку оцінимо за допомогою коефіцієнту кореляції:

; .

Це означає, що 51% варіації заробітної плати (() пояснюється варіацією фактора – середньодушового прожиткового мінімуму.

Якість моделі визначає середня помилка апроксимації:

.

Якість побудованої моделі оцінюється як добра, оскільки не перевищує 8-10%.

Оцінку значущості рівняння регресії в цілому проведемо за допомогою -критерію Фішера. Фактичне значення -критерію:

.

Табличне значення критерію при п'ятипроцентному рівні значущості і ступенях свободи і складає . Оскільки , те рівняння регресії вважається статистично значущим.

Оцінку статистичної значущості параметрів регресії проведемо за допомогою -статистики Стьюдента і шляхом розрахунку довірчого інтервалу кожного з показників.

Табличне значення -критерію для числа ступенів свободи і складе .

Визначимо випадкові помилки , , :

;

;

.

Тоді

;

.

Фактичні значення -статистики перевершують табличне значення:

;

;

,

тому параметри , і не випадково відрізняються від нуля, а статистично значущі.

Розрахуємо довірчі інтервали для параметрів регресії і . Для цього визначимо граничну помилку для кожного показника:

;

.

Довірчі інтервали

Аналіз верхньої і нижньої меж довірчих інтервалів надає можливість зробити висновок про те, що з імовірністю параметри і , знаходячись у вказаних межах, не приймають нульових значень, тобто не є статистично незначущими і істотно відмінні від нуля.

Одержані оцінки рівняння регресії дозволяють застосувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму складе: грн., тоді прогнозне значення заробітної плати складе: грн.

Помилка прогнозу складе:

Гранична помилка прогнозу, яка в випадків не буде перевищена, складе

Довірчий інтервал прогнозу:

грн.;

грн.;

Виконаний прогноз середньодобової заробітної плати є надійним (() і знаходиться в межах від 131,66 грн. до 190,62 грн

Побудуємо на одному графіку початкові дані і теоретичну пряму (рис.1):

Лаба 2

За даними 20 підприємств вивчається залежність випуску продукції на одного робітника Y (тис. грн.) від введення у дію основних фондів Х1 (% від вартості фондів на кінець року) і від питомої ваги робочих високої кваліфікації загальною кількістю працівників Х2 (%).

Вхідні дані для побудови моделі

Розв’язання

Для зручності будемо проводити проміжні розрахунки у вигляді таблиці:

Сумма

192

123,8

446

1276,3

4581

2997,4

837,74

10828,0

1958,0

Ср. знач.

9,6

6,19

22,3

63,815

229,05

149,87

41,887

541,4

97,9

  1. Побудувати лінійну модель множинної регресії. Записати стандартизоване рівняння множинної регресії. На основі стандартизованих коефіцієнтів регресії і середніх коефіцієнтів еластичності ранжувати фактори за ступенем їх впливу на результат.

Для знаходження параметрів лінійного рівняння множинної регресії необхідно розв’язати таку систему лінійних рівнянь відносно невідомих параметрів,,:

або скористатися готовими формулами:

; ;. Оберемо другий шлях. Розрахуємо спочатку середньоквадратичні відхилення ознак:

;

;

.

Знайдемо парні коефіцієнти кореляції:

Матимемо:;. Таким чином, рівняння множинної регресії набуде вигляду: .

Коефіцієнти істандартизованого рівняння регресіїзнаходять за формулами:

;

.

Тобто рівняння набуде вигляду:

.

Так як стандартизовані коефіцієнти регресії можна порівнювати між собою, можна сказати, що ведення нових основних фондів здійснює більш значний вплив на випуск продукції, ніж питома вага робочих високої кваліфікації.

Порівнювати вплив факторів на результат можна також за допомогою коефіцієнтів еластичності:

.

Обчислимо:

;.

Тобто, збільшення тільки основних фондів (від свого середнього значення) або тільки питомої ваги робочих високої кваліфікації на 1% збільшує у середньому випуск продукції на 0,61% або 0,20% відповідно. Таким чином, підтверджується більший вплив на результат фактора, ніж фактора.

  1. Знайти коефіцієнти парної, частинної та множинної кореляції. Проаналізувати їх.

Коефіцієнти парної кореляції ми вже знайшли.

; ;.

Вони показують вельми сильний зв’язок кожного фактора з результатом, а також високу міжфакторну залежність (фактори іявно колінеарні, так як). За умов такої сильної міжфакторної залежності рекомендується один з факторів виключити з розгляду.

Частинні коефіцієнти кореляції характеризується щільність зв’язку між результатом і відповідним фактором при елімінуванні (виключенні впливу) інших факторів, що включені у рівняння регресії.

При двох факторах часткові коефіцієнти кореляції розраховуються таким чином:

;

.

Якщо порівнювати коефіцієнти парної і часткової кореляції, то можна побачити, що висока міжфакторна залежність дає підвищені оцінки тісноти зв’язку. Саме з цієї причини рекомендується за наявності сильної колінеарності (взаємозв’язку) факторів виключати з дослідження той фактор, у якого тіснота парної залежності менше, ніж тіснота міжфакторного зв’язку.

Коефіцієнт множинної кореляції визначаємо через матрицю парних коефіцієнтів кореляції:

,

де - – визначник матриці парних коефіцієнтів кореляції;

–визначник матриці міжфакторної кореляції.

;

.

Коефіцієнт множинної кореляції:

.

Аналогичний результат отримаємо при використанні інших формул:

- залишкова дисперсія;

;

.

Коефіцієнт множинної кореляції показує досить сильний зв’язок всього набору факторів з результатом.

  1. Нескоригований коефіцієнт множинної детермінації оцінює долю варіації результату за рахунок представлених у рівнянні факторів у загальній варіації результату. У цьому прикладі ця доля складаєі вказує на вельми високий ступінь обумовленості варіації результату варіацією факторів, іншими словами – на вельми тісний зв’язок факторів з результатом.

  2. Знайти скоригований коефіцієнт множинної детермінації. Порівняти його з нескоригованим (загальним) коефіцієнтом детермінації.

Скоригований коефіцієнт множинної детермінації

визначає щільність зв’язку з врахуванням ступенів свободи загальної та залишкової дисперсій. Він дає таку оцінку щільності зв’язку, яка не залежить від кількості факторів і тому може порівнюватись по різних моделях з різною кількістю факторів. У даному прикладі обидва коефіцієнти вказують на досить високою (більше 94%) детермінованість результату у моделі факторамии.

  1. За допомогою -критерію Фішера оцінити статистичну значущість рівняння регресії та коефіцієнта детермінації.

Оцінку надійності рівняння регресії в цілому і показника щільності зв’язку дає-критерій Фішера:

.

У нашому випадку експериментальне значення -критерія Фішера:

.

Отримали, що (при), тобто, ймовірність отримати таке значення-критерія не перевищує припустимий рівень значущості 5%. Відповідно, отримане значення не випадкове, воно сформувалось під впливом суттєвих факторів, тобто підтверджується статистична значущість усього рівняння і показника щільності зв’язку.

  1. За допомогою часткових -критеріїв Фішера оцінити доцільність включення у рівняння множинної регресії факторапісля фактораі факторапісля фактора.

Часткові -критерії Фішера розраховуються за формулами:

;

.

Знайдемо і.

Маємо:

;

.

Отримали, що . Отже, включення у модель факторапісля того, як у модель включений фактор, статистично недоцільно: приріст факторної дисперсії за рахунок додаткової ознакиє незначним, несуттєвим; факторвключати у рівняння після факторане слід.

Якщо змінити початковий порядок включення факторів у модель і розглянути варіант включення після, то результат розрахунку часткового-критерію длябуде іншим., тобто ймовірність його випадкового формування менше прийнятого стандарту. Отже, значення часткового-критерія для додатково включеного факторане випадково, є статистично значущим, надійним, достовірним: приріст факторної дисперсії за рахунок додаткового факторає суттєвим. Фактормає бути у рівнянні, в тому числі у варіанті, коли він додатково включається після фактора.

Загальний висновок: множинна модель з факторами ізмістить неінформативний фактор.

  1. Скласти рівняння парної лінійної регресії, обравши тільки один значущій фактор (побудувати рівняння аналогічно лабораторній роботі 1).

Якщо виключити фактор , то можна обмежитись рівнянням парної регресії:,.

Лаба 3

Обчислимо середні значення та стандартні відхилення пояснюючих змінних . Для цього можна скористатись стандартними функціями MS Excel. В майстрі функцій знайдемо категорію “статистичні” і в ній функції “СРЗНАЧ” та “СТАНДОТКЛ”.

Дані величини можна також розрахувати за формулами:

, (1)

, (2)

де середнє значення-тої пояснюючої змінної;

індивідуальне значення -тої пояснюючої змінної;

–номер пояснюючої змінної;

–номер точки спостереження (місяця);

стандартне відхилення -тої пояснюючої змінної;

–число спостережень.

Додаткові розрахунки наведено в табл.1.

Таблиця 1 – Проміжні розрахунки

Місяць

Всього

937

361

192

396

344,95

298,80

175.21

; ;.

; ;.

2. Нормалізуємо пояснюючі змінні. Серед статистичних функцій MS Excel знайдемо функцію “НОРМАЛІЗАЦІЯ” та нормалізуємо .

Для цього можна також скористатись формулою:

(3)

=

-1,41989

-1,15996

-1,58071

-0,24643

-0,65563

-0,59276

-1,1852

-0,9078

-1,25139

-0,9505

-0,65563

0,92208

-0,48112

-0,9078

0,065963

-0,71581

-1,15996

-1,58071

-0,9505

-0,9078

-1,25139

-0,24643

-0,1513

-0,59276

-1,41989

-1,15996

-0,26345

-0,01173

0,100866

0,065863

0,45765

0,353032

0,72449

-0,24643

0,100866

0,395176

-0,01173

0,605198

0,395176

0,222958

-0,40347

0,065863

0,45765

-0,1513

0,72449

0,927034

1,10953

1,053804

1,396419

1,361696

1,383117

0,692342

0,857364

0,065863

1,631111

1,613862

1,383117

2,100496

2,118194

1,712431

Транспонуємо матрицю (нормалізовану) в матрицю

=

-1,4199

-0,2464

-1,1852

-0,9505

-0,4811

-0,7158

-0,9505

-1,16

-0,6556

-0,9078

-0,6556

-0,9078

-1,16

-0,9078

-1,5807

-0,5928

-1,2514

-0,9221

0,06596

-1,5807

-1,2514

Продовження матриці

-0,2464

-1,4199

-0,0117

0,45765

-0,2464

-0,0117

0,22296

0,45765

-0,1513

-1,16

-0,10087

0,35303

0,10087

0,6052

-0,4035

-0,1513

-0,5928

-0,2635

0,06586

0,72449

0,39518

0,39518

0,06586

0,72449

Закінчення матриці

0,92703

1,39642

0,69234

1,63111

2,1005

1,10953

1,3617

0,85736

1,61386

2,11819

1,0538

1,38312

0,06586

1,38312

1,71243

Перемножимо матриці та:

=

19

17,8964552

16,9413894

17,8964552

19

16,6415575

16,9413894

16,6415575

19

3. Знайдемо кореляційну матрицю .

Для знаходження кореляційної матриці необхідно кожний елемент матриціпомножити на(у нашому випадку):

1

0,941918693

0,891652074

0,941918693

1

0,875871449

0,891652074

0,875871449

1

4. Знайдемо визначник матриці .

Для знаходження необхідно серед математичних функцій MS Excel знайти функцію “МОПРЕД”. Скориставшись нею, дістанемо:= 0,02182033.

Оскільки наближається до нуля, то в масиві пояснюючих змінних може існувати мультиколінеарність.

Прологарифмуємо визначник матриці := -3,824913185

5. Обчислимо критерій Пірсона за формулою:

, (4)

.Знайдене значення порівняємо з табличним значенням, коли маємоступенів свободи та при рівні значущості.

Оскільки , то в масиві пояснюючих змінних (продуктивність праці, питомі інвестиції та фондовіддача) існує мультиколінеарність.

6. Обчислимо критерій.

Для визначення критеріїв необхідно знайти матрицю, яка є оберненою до матриці:

10,67120467

-7,375970017

-3,05460023

-7,375970017

9,392918454

-1,65019013

-3,054600232

-1,65019013

5,168995053

Безпосередньо критерій обчислюється за формулою:

, (5)

де – діагональний елемент матриці.

;;

.

Обчислені критерії порівнюються з табличним значенням , коли єступенів свободи та при рівні значущості.

У розглядуваному випадку ,,. Це означає, що кожна з пояснюючих змінних мультиколінеарна з іншими.

7. Визначимо частинні коефіцієнти кореляції .

Частинні коефіцієнти кореляції показують тісноту зв’язку між двома пояснюючими змінними за умови, що всі інші змінні не впливають на цей зв’язок і обчислюються за формулою:

. (6)

;

;

.

Отже, спираючись на здобуті нами значення окремих (частинних) коефіцієнтів кореляції, можна сказати, що зв’язок між фондовіддачею та продуктивністю праці є тісним, якщо не враховувати вплив питомих інвестицій, зв’язок між фондовіддачею та питомими інвестиціями є слабким, якщо не брати до уваги вплив продуктивності праці. Зв’язок між продуктивністю праці та питомими інвестиціями також є слабким, якщо не враховувати фондовіддачу.

8. Визначимо критерій.

Ці критерії застосовуються для визначення мультиколінеарності двох пояснюючих змінних і обчислюються за формулою:

.(7)

;

;

.

Обчислені критерії порівнюються з табличним значенням, коли маємоступенів свободи та при рівні значущості.

Оскільки , то продуктивність праці та фондовіддача є відповідно мультиколінеарними між собою;

, тому відповідно продуктивність праці та питомі інвестиції є мультиколінеарними між собою;

, тому продуктивність праці та питомі інвестиції не є мультиколінеарними між собою.

Висновок. Дослідження, проведені за алгоритмом Фаррара-Глобера показали, що мультиколінеарність між пояснюючими змінними даного прикладу існує. Отже, для того, щоб можна було застосувати метод 1МНК для оцінювання параметрів моделі за цією інформацію, необхідно в першу чергу звільнитися від мультиколінеарності.

Лаба 4

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]