Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metod_praktichnikh_robit_NPMUR.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
8.87 Mб
Скачать

Порядок виконання роботи

Для розрахунку параметрів лінійної регресії = , розв’язуємо систему нормальних рівнянь.

Для розв’язання системи необхідно знати ∑У; ∑X; ∑Х*У; ∑X2, ∑У2 розрахунок яких проводиться в табл. 16.

Таблиця 16 – Дані розрахунку

n

y

x

yx

х2

y2

1

69

45

3105

2025

4761

69,06

-0,06

0,08

2

61

60

3660

3600

3721

58,47

2,53

4,14

3

60

57

3420

3249

3600

60,59

-0,59

0,98

4

57

62

3534

3844

3249

57,06

-0,06

0,11

5

55

59

3245

3481

3025

59,18

-4,18

7,60

6

67

47

3149

2209

4489

67,64

-0,64

0,96

7

65

55

3575

3025

4225

62,00

3,00

4,61

Разом, ∑

434

385

23688

21433

27070

434

-0,01

18,49

Середнє значення

62

55

3384

3061,857

3867,143

-

-

2,64

δ2

23,14

36,86

 

 

 

-

-

-

δ

4,81

6,07

 

 

 

-

-

-

Розраховуються коефіцієнти :

= ( ) / ( - ), -0,71,

100,8.

Тоді, рівняння набуде вигляду: = 100,80-0,71х.

Розрахуємо коефіцієнт парної кореляції:

r = х/ δу) = - 0,71х(6,07/4,81) = –0,89.

Для нашого прикладу зв'язок обернений, тісний.

Визначимо коефіцієнт детермінації, коли R2 = r2:

R2 = (–0,89)2 = 0,79.

Варіація (дисперсія) результативності ознаки на 79 % пояснюється варіацією фактора Х. Підставляючи в рівняння фактичні значення Хі визначаємо теоретичні (розрахункові) значення . Знаходимо величину середньої похибки апроксимації за формулою:

.

Тоді, = 2,64 %. Тобто, в середньому розрахункові значення відхиляються від фактичних на 2,64 %, що знаходиться в допустимих межах.

Оцінимо значущість рівняння регресії за допомогою F-критерію Фішера.

Для нашого прикладу: k=n-m – число ступенів свободи; m – число параметрів рівняння ( x та y ) =2;n – обсяг вибірки, - середнє значення x.

Знайдемо фактичне значення F= . Розрахуємо , для цього заповнимо допоміжну розрахункову таблицю 17.

Таблиця 17

№ пор.

1

69

45

100

69,05

0,00

49,76

2

61

60

25

58,47

6,39

12,44

3

60

57

4

60,59

0,35

1,99

4

57

62

49

57,06

0,00

24,38

5

55

59

16

59,18

17,46

7,96

6

67

47

64

67,64

0,41

31,85

7

65

55

0

62

9,00

0,00

Разом, Σ

434

385

258

434

33,61

128,39

Визначимо розрахункове значення F-критерію Фішера:

F= = = .

Так як 19,098 > = 6,61, то отримане рівняння є статистично значущим. Знайдемо прогнозні значення для індивідуальних значень при = 75 грн. Знаходимо точкове значення прогнозу:

= + = 100,8 – 0,71 × 75 = 47,55 (%)

Для лінійної моделі число параметрів m = 2, тому не зміщена оцінка дисперсії залишків:

= .

Знаходимо дисперсію індивідуальних значень при x =

= .

.

За таблицями знаходимо:

t(1 – a, k) = t(1 – 0,05; n – m) = t(0,95; 7 – 2) = 2,57.

За формулою +

47,55 – 2,57 4,25 ≤ ≤ 47,55 + 2,57 4,25

Отже, з ймовірністю 0,95 витрати на придбання продовольчих товарів будуть знаходитися в інтервалі: 36,63 ≤ 58,47.

Завдання № 8 Статистичний аналіз. Лінійна регресія

Мета: вивчити і вміти застосовувати функції прогнозування

Завдання до роботи: Необхідно розв'язати запропоновану задау за даним зразком. Початкові дані для розрахунку задачі наведено в задачі +N, де N – останні дві цифри номера залікової книжки студента.

Короткі теоретичні відомості

Місrоsоft Ехсеl надає кілька функцій для роботи з лінійною реґресією, деякі з них (ЛИНЕЙН (LINEST), ТЕНДЕНЦИЯ (TREND), ПРЕДСКАЗ (FORECAST)) будуть розглянуті при вивчення даної теми. Ці функції вносяться у вигляді формули масиву і повертають масив результатів. Кожну з цих функцій можна використовувати з однією або кількома змінними.

Регресія – це статистичний метод, який дозволяє знайти рівняння, яке найкращим чином описує множину даних. Регресійний аналіз ґрунтується на складних рівняннях і дозволяє аналізувати великі сукупності даних з побудовою відповідних кривих залежності. Раніше регресійний аналіз був малодоступний через великий обсяг необхідних розрахунків. Але з появою засобів роботи з електронними таблицями, таких як Місrоsоft Ехсеl, які пропонують вбудовані регресійні функції, регресійний аналіз стає все більш популярним.

Лінійна регресія (linеаr regression) визначає пряму, яка найкращим чином зображує множину даних. Ґрунтуючись на даних про обсяги реалізації продукції за поточний рік, лінійна регресія дає можливість визначити обсяг реалізації, що прогнозується, за березень наступного року. Лінійна регресія повертає нахил і у-перетин (точку, у якій пряма перетинає вісь У) для прямої, апроксимуючої дані з реалізації. Продовжуючи цю лінію для майбутніх значень часу і передбачаючи лінійне зростання, можна оцінити майбутні обсяги реалізації.

Експоненційна регресія (ехponential regression) визначає експоненційну криву, яка найкращим чином зображує множину даних, для яких передбачається нелінійна залежність від часу.

Багатовимірна регресія (multiple regression) виконує аналіз для кількох множин даних; це часто дає більш реалістичний прогноз.

При багатовимірному регресійному аналізі лінія регресії відображає вклад ряду незалежних змінних в очікуваний результат. Рівняння лінії регресії в цьому відображається у формулі (8).

y = m1x1 + m2x2 + … + mnxn + b, (8)

де у – незалежна змінна; х1, ... , хn - це n незалежних змінних; m1, , mn – коефі-цієнти при незалежних змінних; b - константа (вільний член).

Функція ЛИНЕЙН використовує наведене вище рівняння і повертає коефіцієнти для заданих множин відомих значень у і кожної незалежної змінної. Ця функція має наступний синтаксис:

ЛИНЕЙН (известные_значения_у; известные_значения_х; конст;

статистика)

Аргумент известные_значения_у – це множина відомих значень залежної змінної. Цей аргумент може бути одним стовпчиком, одним рядком чи прямокутним діапазоном клітинок. Якщо аргумент известные_значения_у складається з одного стовпчика чи з одного рядка, то, відповідно, кожний стовпчик чи рядок в аргументі известные_значения_х розглядається як незалежна змінна. Якщо аргумент известные_значения_у є прямокутним діапазоном, то в рівнянні використовується тільки одна незалежна змінна. У цьому випадку аргумент известные_значения_х повинен бути прямокутним діапазоном такого самого розміру і форми, як аргумент известные_значения_ у.

Якщо аргумент известные_значения_х опущений, Ехсеl використовує послідовність 1, 2, 3, 4 і т. д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]