
- •Применение программы ms excel для регрессионного анализа производственных процессов
- •Оглавление введение. Сущность регрессионного анализа и цели работы .......4
- •1. Подготовка к проведению работы. …….................................6
- •2. Однофакторный регрессионный анализ…………………………8
- •3. Многофакторный регрессионный анализ……………………
- •Введение. Сущность регрессионного анализа и цели работы
- •1. Подготовка к проведению работы
- •2. Однофакторный регрессионный анализ
- •2.1. Инструмент анализа «Регрессия»
- •2.1.1. Основные опции инструмента «Регрессия»
- •2.1.2. Опции инструмента «Регрессия», связанные с оценкой дисперсии относительно рассматриваемой математической модели
- •2.2. Статистические функции ms Excel, основанные на линейной регрессии
- •2.3. Статистические функции ms Еxcel, основанные на экспоненциальной регрессии
- •2.4. Графические опции, предназначенные для анализа регрессионной модели
- •2.4.1. Построение регрессионной зависимости и освоение способов её аппроксимации
- •2.4.2. Выбор вида аппроксимирующей функции
- •2.4.3. Анализ влияния вида аппроксимирующей функции (степени полинома) на точность аппроксимации
- •2.5. Определение коэффициентов уравнения регрессии с помощью надстройки Excel «Поиск решения»
- •3. Многофакторный регрессионный анализ
- •3.1. Анализ и оценка достоверности модели в рамках инструмента «Регрессия»
- •3.2. Оценка значимости коэффициентов регрессии и совершенствование математической модели
- •3.3. Статистические функции ms Еxcel, предназначенные для многофакторного регрессионного анализа
- •Библиографический список
- •Применение программы ms excel для регрессионного анализа производственных процессов
2.1.2. Опции инструмента «Регрессия», связанные с оценкой дисперсии относительно рассматриваемой математической модели
2.1.2.1. Для установления и исследования несоответствий между экспериментальными и теоретическими значениями Y, определяемыми уравнением регрессии, поставить «Галочки» в опции «Остатки», «График остатков», «График подбора» или «Стандартизированные остатки». В результате появятся таблицы:
- «Вывод остатка»,
- «Вывод вероятности».
А также графики:
- «График остатков»,
- «График подбора»,
- «График нормального распределения».
Примечания:
А. «Остаток» представляет собой разницу между фактическим и теоретическим значениями Y.
Б. «Стандартизированный остаток» представляет собой отношение «остатка» к «стандартной ошибке единичного наблюдения регрессионной статистики» (см. выше).
В. «График остатков» располагается в координатах x - величина остатка. По нему наглядно видны значения «остатка» для различных точек, что позволяет обнаружить «выбросы» - отклонения от теоретической модели, превышающие случайную составляющую отклика ε, которые могут свидетельствовать о каком-то сбое, ошибке в получении результата. Процедура устранения таких «выбросов» называется «цензурированием».
2.1.2.2. Установить величины максимальных положительных и отрицательных остатков по полученному «Графику остатков».
2.1.2.3. Проверить, не являются ли установленные по п. 2.1.2.2. максимальные остатки результатом «выбросов», используя «Стандартные остатки» в таблице «Вывод остатка». В соответствии с критерием Райта для результата, не являющегося «выбросом», стандартный остаток по абсолютной величине не должен превышать 3.
2.1.2.4. При обнаружении «выброса» исключить его из Ваших данных и произвести регрессионный анализ заново.
2.2. Статистические функции ms Excel, основанные на линейной регрессии
2.2.1. Выделить массив из расположенных рядом не менее пяти строк и не менее двух столбцов и открыть статистическую функцию ЛИНЕЙН (рис. 3), рассчитывающую коэффициенты m и b линейного уравнения y = mx + b.
Рис. 3. Аргументы функции ЛИНЕЙН
2.2.2. Ввести в качестве аргументов независимо от расположения в строках или в столбцах (без наименований строк или в столбцов):
- «Известные значения x»,
- «Известные значения у», точно соответствующие этим значениям x.
Примечания:
А. Аргумент «Конст» (см. рис. 3) - логическое значение, которое указывает, требуется ли, чтобы константа b в уравнении (4) была равна 0. Если «Конст» имеет значение ИСТИНА или отсутствует, то b вычисляется обычным образом. Если «Конст» имеет значение ЛОЖЬ (ставится значение 0), то m подбирается так, чтобы выполнялось b = 0.
Б. Аргумент «Статистика» - логическое значение, которое указывает, требуются ли дополнительные статистические данные по регрессии. Если аргумент «Статистика» имеет значение 0 («ЛОЖЬ») или отсутствует, то функция ЛИНЕЙН подсчитает только коэффициенты регрессии. (В этом случае достаточно предварительно выделить, см. п. 2.2.1, две ячейки, расположенные рядом в одной строке.) Если в качестве аргумента «Статистика» представлено любое другое число («ИСТИНА»), то кроме коэффициентов m и b производится расчёт дополнительной статистики в форме таблицы ячеек (табл. 1).
Таблица 1. Форма представления данных по результатам расчёта коэффициентов регрессии и дополнительной статистики
m |
b |
Стандартная ошибка коэфф. m |
Стандартная ошибка коэфф. b |
Коэффициент детерминации |
Стандартная ошибка для оценки y |
F-статистика (F-расчётное) |
Число степеней свободы для нахождения F-критических значений |
Сумма квадратов отклонений, обусловленных регрессией |
Сумма квадратов остатков |
В. К недостаткам дополнительной статистики относится то, что выводимые в указанном порядке результаты никак не обозначены. Поэтому для получения всеобъемлющих результатов регрессионного анализа в виде, доступном для недостаточно искушённых пользователей, рекомендуется пользоваться инструментом «Регрессия» [5].
2.2.3. Набрать комбинацию клавиш CTRL+SHIFT+ENTER, в результате чего в порядке, представленном в табл. 1, будут выведены коэффициенты регрессии и регрессионной статистики. (При нажатии «ОК» будет подсчитан только коэффициент m).
2.2.4. Проверить соответствие полученных коэффициентов регрессии m, b и регрессионной статистики коэффициентам b0, b1, и другим результатам, рассчитанным с использованием инструмента «Регрессия», п.п. 2.1.1, 2.1.2.
2.2.5. Открыть функцию «ТЕНДЕНЦИЯ» (рис. 4), которая для заданного массива новых значений x определяет значения y в соответствии с линейным трендом, рассчитанным для массивов известных значений y и известных значений x в виде уравнения y = mx + b.
Рис. 4. Аргументы функции ТЕНДЕНЦИЯ
2.2.6. Рассчитать значения функции ТЕНДЕНЦИЯ, введя следующие аргументы:
- «Известные значения x»;
- соответствующие им «Известные значения у»;
- в качестве аргумента «Новые значения x» - величины x, равные удвоенному и утроенному значению максимального известного значения x, ставя задачу узнать, какими должны быть при имеющейся линейной регрессии значения отклика, соответствующие этим новым значениям x;
- в качестве аргумента «Конст» - любое ненулевое число и нажать «ОК».
2.2.7. Открыть функцию ПРЕДСКАЗ (рис. 5), сходную с функцией ТЕНДЕНЦИЯ, но рассчитывающую в соответствии с линейным уравнением регрессии лишь одно прогнозируемое значение отклика по одному значению аргумента «x».
Рис. 5. Аргументы функции ПРЕДСКАЗ
2.2.8. Рассчитать с помощью функции ПРЕДСКАЗ значение отклика, соответствующее значению x, равному удвоенному максимальному известному значению x. (Результат расчёта этой и других функций, определяющих одно значение, появляется в окне аргументов сразу после внесения данных до нажатия «ОК».)
2.2.9. Открыть статистическую функцию НАКЛОН (рис. 6), устанавливающую наклон линии линейной регрессии для точек данных, образованных известными значениями yi и известными значениями xi, иначе говоря, коэффициент m в уравнении y = mx + b.
Рис. 6. Аргументы функции НАКЛОН
2.2.10. Рассчитать коэффициент m в уравнении y = mx + b с помощью функции НАКЛОН и сравнить с коэффициентом m, рассчитанным с помощью функции ЛИНЕЙН, см. п. 2.2.3, и с коэффициентом b0, рассчитанным с помощью инструмента Регрессия, см. п. 2.1.1.3. для тех же исходных данных.
2.2.11. Открыть статистическую функцию ОТРЕЗОК, имеющую те же аргументы, что и функция НАКЛОН и вычисляющую точку пересечения линии регрессии с осью y,т.е. приx= 0, иначе говоря, коэффициент b в уравнении регрессии y = mx + b.
2.2.12. Рассчитать коэффициент b в уравнении с помощью функции ОТРЕЗОК и сравнить с коэффициентом b, рассчитанным с помощью функции ЛИНЕЙН, см. п. 2.2.3, и с коэффициентом b1, рассчитанным с помощью инструмента Регрессия, см. п. 2.1.1, для тех же исходных данных.