- •Регрессионный анализ
- •Регрессионный анализ данных по диаграмме (Трендовые модели)
- •Инструмент «Регрессия»
- •4) Расчетные (предсказанные) значения y и остатки (разность между фактическим и расчетным y ).
- •Статистические функции определения параметров регрессии, их оценки, прогнозирования
- •Структура результата, возвращаемого функцией лгрфприбл
Структура результата, возвращаемого функцией лгрфприбл
тп |
тп-1 |
… |
т1 |
b |
ln [тп ] |
ln [тп-1 ] |
… |
ln [т1 ] |
ln [b] |
R2 |
ln [y] |
#н/д |
#н/д |
#н/д |
F |
df |
#н/д |
#н/д |
#н/д |
SSreg |
SSresid |
#н/д |
#н/д |
#н/д |
В первой строке таблицы выводятся значения коэффициентов mi и b; во второй — натуральные логарифмы среднеквадратических отклонений коэффициентов при независимых переменных ln [тi ] и константы ln [b]; затем располагаются следующие величины:
коэффициент детерминированности R2;
натуральный логарифм среднеквадратического отклонения зависимой переменной ln [y] ;
F-статистика, используемая для оценки достоверности полученного уравнения;
число степеней свободы df ;
регрессионная SSreg и остаточная SSresid суммы квадратов.
Функция FРАСП возвращает F-распределение вероятности и используется, чтобы определить, имеют ли два множества данных различные степени разброса результатов. В регрессионном анализе с помощью этой функции оценивается достоверность уравнения — F.
При заполнении аргументов функции FРАСП используются данные полученные с помощью функции ЛИНЕЙН или ЛГРФПРИБЛ:
1) X = F;
2) Степени_свободы1 (числитель степеней свободы) = n;
3) Степени_свободы2 (знаменатель степеней свободы) = df.
Тогда F = 1 – FРАСП (F; n; df )
Функция СТЬЮДРАСП возвращает вероятность для t-распределения Стьюдента. В регрессионном анализе с помощью двустороннего распределения Стьюдента оценивается достоверность коэффициентов — t .
При заполнении аргументов функции СТЬЮДРАСП используются данные полученные с помощью функции ЛИНЕЙН или ЛГРФПРИБЛ:
1) X = t , причем значение t-статистики предварительно вычисляется для каждого коэффициента по формулам:
a) для линейной и полиномиальной регрессии
b) для экспоненциальной регрессии
2) Степени_свободы = df ;
3) Хвосты = 2.
Тогда t = 1 – СТЬЮДРАСП (| t | ; df ; 2)
Функция ТЕНДЕНЦИЯ аппроксимирует прямой линией (по методу наименьших квадратов) массивы известные_значения_у (1 арг.) и известные_значения_х (2 арг.) и возвращает предсказанные значения у, в соответствии с этой прямой для заданного массива новые_значения_х (3 арг). 4 арг. Конст = 1. Используется для линейного прогнозирования.
Если 1 арг. имеет один столбец, то каждый столбец 2 арг. интерпретируется как отдельная переменная.
Если 2 арг опущен, то предполагается, что это массив {1;2;3;...} такого же размера, как и 1 арг. Если 3 арг, опущен, то предполагается, что он совпадает с арг. 2.
Функция РОСТ рассчитывает прогнозируемый экспоненциальный рост на основании имеющихся массивов значений Y и X. Смысл аргументов и правила заполнения как и для функции ТЕНДЕНЦИЯ.
Пример 4.1. Определить, используя соответствующую функцию, уравнение линейной зависимости затрат на ремонт от возраста оборудования и дополнительную регрессионную статистику по данным, расположенным в диапазоне А3:В12. Спрогнозировать по полученному уравнению величину затрат на ремонт для данного возраста оборудования.
Решение:
1) Для вычисления коэффициентов линейной регрессии и дополнительной регрессионной статистики используется функция ЛИНЕЙН, которая возвращает массив результатов. Необходимо поэтому:
выделить 2 столбца, так как одна независимая переменная, и 5 строк (E2:F6);
вставить функцию ЛИНЕЙН и заполнить ее аргументы (см. стр. 21). Диапазон зависимой переменной — В3:В12; диапазон независимой переменной А3:А12;
не нажимая кнопку ОК, нажать комбинацию клавиш Ctrl + Shift + Enter. Диапазон E2:F6 будет заполнен данными (см. рисунок), по которым можно составить линейное уравнение —
2) Для прогнозирования затрат на ремонт (Yпр) нужно подставить имеющиеся значения возраста оборудования (Х) в полученное уравнение (см. формулу и значения на рисунке в столбце С).
Пример 4.2. Оценить степень взаимосвязи, достоверность уравнения и коэффициентов, найденных в примере 4.1.
Решение:
1) Из результатов предыдущего примера видно, что R2 = 0,889. По шкале Чеддока (см. стр. 21) это соответствует высокой силе связи между переменными.
2) Для оценки достоверности уравнения используется величина F = 64,04 (ячейка Е5) и df = 8 (ячейка F5). Результат вычисления достоверности уравнения и формула (см. стр. 22) приведены на рисунке в ячейках F8 и G8.
3) t-статистика для коэффициентов вычисляется в ячейках E11:F11 как отношение значения коэффициента к его среднеквадратическому отклонению.
4) Для оценки достоверности коэффициентов используется t-статистика и df. Результат вычисления достоверности коэффициентов и формула (см. стр. 22) приведены на рисунке в ячейках Е12:G12.
5) Из полученных результатов следует, что уравнение и коэффициенты имеют высокую достоверность, так как значения F и t близки к 1.
Пример 4.3. Построить линейную трендовую модель зависимости затрат на ремонт от возраста оборудования по исходным данным примера 4.1.
Решение:
1) Выделить диапазон А3:В12 и построить точечную диаграмму зависимости затрат на ремонт от возраста оборудования с помощью мастера диаграмм.
2) В контекстном меню диаграммы выбрать команду Добавить линию тренда.
3) В открывшемся окне выбрать тип аппроксимации — линейная и задать параметры линии тренда, как показано на рисунке:
4) В результате на диаграмме появится линия тренда, коэффициент детерминированности R2 и линейное уравнение, совпадающее с полученным в примере 4.1.
Пример 4.4. Определить уравнение линейной регрессии, оценить степень взаимосвязи, достоверность уравнения и коэффициентов (исходные данные примера 4.1), используя инструмент Регрессия.
Решение:
1) Нажать кнопку Анализ данных на закладке Данные, выбрать инструмент Регрессия и заполнить открывшийся диалог:
2) После нажатия ОК, начиная с ячейки А17, будут выведены 4 таблицы, которые более компактно представлены на рисунке:
3) столбцы F и t с помощью инструмента не выводятся и вычислены дополнительно по формулам F = 1 – Значимость F и t = 1 – Р-значение.