- •6. Статистичний аналіз даних
- •2. Розрахунок багатофакторних моделей з використанням Excel
- •Застосування стандартних статистичних функцій Microsoft Excel
- •Застосування пункту меню Пошук рішення
- •Синтаксис (лінійна) :
- •Примітки
- •Вид повертаних функцією линейн|() значень:
- •Логарифмічна (лгрфприбл)
- •Синтаксис (логарифмічна):
- •Синтаксис (логарифмічна)
- •Лінія тренда
- •Прогнозування і регресійний аналіз
- •Зауваження
Синтаксис (лінійна) :
ЛИНЕЙН(известные_значения_y;известные_значения_x;конст;статистика)
Известные_значения_y - це безліч значень у, які вже відомі для співвідношення у = mx + b.
Известные_значения_x - це необов'язкова безліч значень x, які вже відомі для співвідношення у = mx + b.
Конст - це логічне значення, яке указує, чи потрібний, щоб константа b була рівна 0.
Статистика - це логічне значення, яке указує, чи потрібно повернути додаткову статистику по регресії.
Примітки
Известные_значения_y - це безліч значень у, які вже відомі для співвідношення у = mx + b.
· Якщо масив известные_значения_y має один стовпець, то кожен стовпець масиву известные_значения_x інтерпретується як окрема змінна.
· Якщо масив известные_значения_y має один рядок, то кожен рядок масиву известные_значения_x інтерпретується як окрема змінна.
Известные_значения_x - це необов'язкова безліч значень x, які вже відомі для співвідношення у = mx + b.
· Масив известные_значения_x може містити одне або декілька безлічі змінних. Якщо використовується тільки одна змінна, то известные_значения_y і известные_значения_x можуть бути масивами будь-якої форми за умови, що вони мають однакову розмірність. Якщо використовується більше однієї змінної, то известные_значения_y повинні бути вектором (тобто інтервалом висотою в один рядок або вширшки в один стовпець).
· Якщо известные_значения_x опущені, то передбачається, що це масив {1;2;3;...} такого ж розміру як і известные_значения_y.
Конст - це логічне значення, яке указує, чи потрібний, щоб константа b була рівна 0.
· Якщо конст має значення ІСТИНА або опущено, то b обчислюється звичайним способом.
· Якщо конст має значення БРЕХНЯ, то b вважається рівним 0 і значення m підбираються так, щоб виконувалося співвідношення у = mx.
Статистика - це логічне значення, яке указує, чи потрібно повернути додаткову статистику по регресії.
· Якщо статистика має значення ІСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику, так що повертаний масив матиме вигляд: {mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid}.
· Якщо статистика має значення БРЕХНЯ або опущена, то функція ЛИНЕЙН повертає тільки|лише| коефіцієнти m і постійну b.
Вид повертаних функцією линейн|() значень:
-
mn
Mn-1
.
M1
B
sen
Sen-1
.
Se1
Seb
R2
Sey
F
Df
ssreg
ssresid
m, n – коефіцієнти;
se - стандартні значення помилок;
r2 – коефіцієнт детермінованої;
F- статистика. Використовується для визначення того, чи є спостережуваний взаємозв'язок між залежною і незалежною змінними випадкової чи ні
ssreg - регресійна сума квадратів;
ssresid - залишкова сума квадратів.
df – міри свободи корисні для знаходження F-критичних значень в статистичній таблиці. Для визначення рівня надійності моделі потрібне сравнивнить значення в таблиці з F- критичною, повертаною функцією ЛИНЕЙН|.
seb - стандартне значення помилки для постійної b (seb=#Р/Д, якщо конст має значення БРЕХНЯ).
Коефіцієнт детермінованої – проводячи регресійний аналіз, Excel обчислює для кожної крапки квадрат різниці між прогнозованим значенням Y і фактичним значенням Y. Сума цих квадратів різниць називається залишковою сумою квадратів. Потім Excel підраховує суму квадратів різниць між фактичними значеннями Y і середніми значеннями Y, яка називається загальною сумою квадратів (регресійна сума квадратів + залишкова сума квадратів). Чим менше залишкова сума квадратів в порівнянні із загальною сумою квадратів, тим більше значення коефіцієнта детермінованої R2, який показує, наскільки добре рівняння, одержане за допомогою регресійного аналізу, пояснює взаємозв'язки між змінними.
Порівнюються фактичні значення Y і значення, що одержуються з рівняння прямої; за наслідками порівняння обчислюється коефіцієнт детермінованої, що нормується від 0 до 1. Якщо він рівний 1, то має місце повна кореляція з моделлю – немає відмінності між фактичним і оцінним значеннями Y. Інакше, якщо коефіцієнт детермінованої рівний 0, то рівняння регресії невдало для прогнозу значення Y.
Розрахувати Yрасчетное для лінійної функції, використовуючи одержані коефіцієнти і дані (Х) з таблиці. Порівняти значення Y і Yрасчетное. Зробити висновок, чи існує залежність даних різниця Y і Yрасч (прагнути до нуля). Одержати бракуючі дані, розповсюдивши формулу у відповідні комірки.