Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мои лекции ИВТ на АТ(для Раи).doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.84 Mб
Скачать

2.1.4 Определение уравнений регрессии с помощью функций excel

Для определения коэффициентов эмпирической функции регрессии используются функции Excel, которые находятся в категории «Статистические»

а) НАКЛОН(известные значения_у; известные значения_х) – определяет коэффициент наклона (m).

б) ОТРЕЗОК(известные значения_у; известные значения_х) – определяет точку пересечения линейного уравнения с осью ординат (в)

в) ЛИНЕЙН(известные значения_у; известные значения_х; константа; статистика) – функция определяет коэффициенты для прямой линии имеющей следующий вид:

  • y = mx + b или

  • y = m1 x1 + m2 x2 + ... + b для многофакторной задачи,

Здесь :

  • известные значения_у – массив известных значений зависимой наблюдаемой величины;

  • известные значения_х – массив известных значений независимой наблюдаемой величины;

  • константа – логическое значение, которое указывает, требуется ли, чтобы константа «в» была равна нулю.

Если константа = истина или опущена, то «в» вычисляется обычным образом;

Если константа – ложь, то «в» считается равной нулю

  • статистика – логическое значение, которое указывает, требуется ли вывести дополнительную статистику по регрессии.

Если статистика = истина, то функция возвращает дополнительную регрессионную зависимость.

Если статистика = ложь или опущена, то функция возвращает только значение коэффициентов.

г) ЛГРФПРИБЛ (известные значения_у; известные значения_х; константа; статистика) – функция определяет коэффициенты для уравнения вида для однофакторной зависимости или для многофакторной задачи

Здесь :

  • известные значения_у – массив известных значений зависимой наблюдаемой величины;

  • известные значения_х – массив известных значений независимой наблюдаемой величины;

  • константа – логическое значение, которое указывает, требуется ли, чтобы константа «в» была равна единице.

Если константа = истина или опущена, то «в» вычисляется обычным образом;

Если константа – ложь, то «в» считается равной единице

  • статистика – логическое значение, которое указывает, требуется ли вывести дополнительную статистику по регрессии.

Если статистика = истина, то функция возвращает дополнительную регрессионную зависимость.

Если статистика = ложь или опущена, то функция возвращает только значение коэффициентов.

Для работы с функцией ЛИНЕЙН и функцией ЛГРФПРИБЛ необходимо выделить диапазон ячеек, состоящий из числа строк = 5 (обязательно всегда) и числа столбцов = N+1, где N – количество неизвестных параметров Х

Т.е. для однофакторной задачи y=f(x) – число строк = 5. а число столбцов = 2, т.к. N=1.

Если задача многофакторная, т.е. e=f(x1,x2,x3), то нужно выделить 5 строк и (3+1) столбцов.

В приведенной ниже таблице видно, в каком порядке возвращается дополнительная регрессионная статистика.

A

B

C

D

E

1

mn

mn-1

m2

m1

b

2

sen

sen-1

se2

se1

seb

3

r2

sey

4

F

df

5

ssper

ssjcn

Поскольку функции ЛИНЕЙН И ЛГРФПРИБ возвращают массив значений, функции должны задаваться в виде формулы массива, т.е. для завершения ввода функций ЛИНЕЙН, ЛГРФПРИБЛ необходимо нажать комбинацию клавиш Ctrl+Shift+Enter.

  • Функции аппроксимации ЛИНЕЙН и ЛГРФПРИБЛ могут вычислить прямую или экспоненциальную кривую, наилучшим образом описывающую данные. Однако они не дают ответа на вопрос, какой из двух результатов в наибольшей степени подходит для решения поставленной задачи. Можно также вычислить функцию ТЕНДЕНЦИЯ(известные_значения_y; известные_значения_x) для прямой или функцию РОСТ(известные_значения_y; известные_значения_x) для экспоненциальной кривой. Эти функции, если не задавать аргумент новые_значения_x, возвращают массив вычисленных значений y для фактических значений x в соответствии с прямой или кривой. Теперь можно сравнить вычисленные значения с фактическими значениями. Можно также построить диаграммы для визуального сравнения.

  • Проводя регрессионный анализ, Microsoft Excel вычисляет для каждой точки квадрат разности между прогнозируемым значением y и фактическим значением y. Сумма этих квадратов разностей называется остаточной суммой квадратов (ssresid). Затем Microsoft Excel подсчитывает общую сумму квадратов (sstotal). Если const = TRUE или значение const не указано, общая сумма квадратов будет равна сумме квадратов разностей действительных значений y и средних значений y. При const = FALSE общая сумма квадратов будет равна сумме квадратов действительных значений y (без вычитания среднего значения y из частного значения y). После этого регрессионную сумму квадратов можно вычислить так: ssreg = sstotal - ssresid. Чем меньше остаточная сумма квадратов, тем больше значение коэффициента детерминированности r2, который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Коэффициент r2 равен ssreg/sstotal.

Дополнительная регрессионная статистика:

Очень важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается величиной R2 (коэффициент детерминированности) находящейся в пределах

0<= R2<=1

При R2 =0 величины, для которых определяются уравнения регрессии, являются независимыми; при R2 =1 имеет место функциональная зависимость. Принято считать R2>=0,7

Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y

Величина

Описание

se1,se2,...,sen

Стандартные значения ошибок для коэффициентов m1,m2,...,mn.

seb

Стандартное значение ошибки для постоянной b (seb = #Н/Д, если конст имеет значение ЛОЖЬ).

r2

Коэффициент детерминированности. Сравниваются фактические значения y и значения, получаемые из уравнения прямой; по результатам сравнения вычисляется коэффициент детерминированности, нормированный от 0 до 1. Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y.

Очень важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается величиной R2 (коэффициент детерминированности) находящейся в пределах

0<= R2<=1

При R2 =0 величины, для которых определяются уравнения регрессии, являются независимыми; при R2 =1 имеет место функциональная зависимость. Принято считать R2>=0,7

Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y

sey

Стандартная ошибка для оценки y.

F

F-статистика, или F-наблюдаемое значение. F-статистика используется для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет.

df

Степени свободы. Степени свободы полезны для нахождения F-критических значений в статистической таблице. Для определения уровня надежности модели нужно сравнить значения в таблице с F-статистикой, возвращаемой функцией ЛИНЕЙН. Сведения о вычислении величины df см. ниже в разделе «Замечания». Далее в примере 4 показано использование величин F и df.

ssreg

Регрессионная сумма квадратов.

ssresid

Остаточная сумма квадратов. Сведения о расчете величин ssreg и ssresid см. ниже в разделе "Замечания" данного документа.

Пример решения многофакторной задачи в Excel с помощью функции ЛИНЕЙН.

Необходимо определить эмпирическое уравнение регрессии, устанавливающее зависимость цены изделия от:

  1. производительности (кол-во операций в час)

  2. время наработки на отказ в днях (качественная характеристика)

A

B

C

D

1

Исходные данные

2

Модель

Производ.

Качество

Цена

3

 

х1

х2

у

4

1

120

450

4500

5

2

200

960

8000

6

3

300

145

3000

7

4

400

212

5500

8

5

500

265

5400

9

6

860

312

6500

10

11

m2

m1

b

12

5,69

3,88

1721,33

13

1,257851

1,413534

933,3291

14

0,877787

768,7874

#Н/Д

15

10,77369

3

#Н/Д

16

12735231

1773102

#Н/Д

17

18

y=5,69*x2+3,88*x1+1721,33

В обязательном порядке поставить и решить многофактурную задачу из книги Техническая диагностика – стр.220

Дальше на лекции не рассказывать

Функция Microsoft Excel «Поиск решения»

Элементы диалогового окна «Поиск решения»

Установить целевую ячейку

Служит для указания целевой ячейки, значение которой необходимо максимизировать, минимизировать или установить равным заданному числу. Эта ячейка должна содержать формулу.

Равно

Служит для выбора варианта оптимизации значения целевой ячейки (максимизация, минимизация или подбор заданного числа). Чтобы установить число, введите его в поле.

Изменяя ячейки

Служит для указания ячеек, значения которых изменяются в процессе поиска решения до тех пор, пока не будут выполнены наложенные ограничения и условие оптимизации значения ячейки, указанной в поле Установить целевую ячейку.

Предположить

Используется для автоматического поиска ячеек, влияющих на формулу, ссылка на которую дана в поле Установить целевую ячейку. Результат поиска отображается в поле Изменяя ячейки.

Ограничения

Служит для отображения списка граничных условий поставленной задачи.

Добавить

Служит для отображения диалогового окна Добавить ограничение.

Изменить

Служит для отображения диалоговое окна Изменить ограничение.

Удалить

Служит для снятия указанного ограничения.

Выполнить

Служит для запуска поиска решения поставленной задачи.

Закрыть

Служит для выхода из окна диалога без запуска поиска решения поставленной задачи. При этом сохраняются установки сделанные в окнах диалога, появлявшихся после нажатий на кнопки Параметры, Добавить, Изменить или Удалить.

Параметры

Служит для отображения диалогового окна Параметры поиска решения, в котором можно загрузить или сохранить оптимизируемую модель и указать предусмотренные варианты поиска решения.

Восстановить

Служит для очистки полей окна диалога и восстановления значений параметров поиска решения, используемых по умолчанию.

Диалоговое окно "Параметры"

Элементы диалогового окна «Параметры поиска решения»

Можно изменять условия и варианты поиска решения для линейных и нелинейных задач, а также загружать и сохранять оптимизируемые модели. Значения и состояния элементов управления, используемые по умолчанию, подходят для решения большинства задач.

Максимальное время

Служит для ограничения времени, отпускаемого на поиск решения задачи. В поле можно ввести время (в секундах) не превышающее 32767; значение 100, используемое по умолчанию, подходит для решения большинства простых задач.

Число итераций

Служит для управления временем решения задачи, путем ограничения числа промежуточных вычислений. В поле можно ввести время (в секундах) не превышающее 32767; значение 100, используемое по умолчанию, подходит для решения большинства простых задач.

Точность

Служит для задания точности, с которой определяется соответствие ячейки целевому значению или приближение к указанным границам. Поле должно содержать десятичную дробь от 0 (нуля) до 1. Чем больше десятичных знаков в задаваемом числе, тем выше точность — например, число 0,0001 представлено с более высокой точностью, чем 0,01.

Допустимое отклонение

Служит для задания допуска на отклонение от оптимального решения, если множество значений влияющей ячейки ограничено множеством целых чисел. При указании большего допуска поиск решения заканчивается быстрее.

Сходимость

Когда относительное изменение значения в целевой ячейке за последние пять итераций становится меньше числа, указанного в поле Сходимость, поиск прекращается. Сходимость применяется только к нелинейным задачам, условием служит дробь из интервала от 0 (нуля) до 1. Лучшую сходимость характеризует большее количество десятичных знаков — например, 0,0001 соответствует меньшему относительному изменению по сравнению с 0,01. Лучшая сходимость требует больше времени на поиск оптимального решения.

Линейная модель

Служит для ускорения поиска решения линейной задачи оптимизации.

Показывать результаты итераций

Служит для приостановки поиска решения для просмотра результатов отдельных итераций.

Автоматическое масштабирование

Служит для включения автоматической нормализации входных и выходных значений, качественно различающихся по величине — например, максимизация прибыли в процентах по отношению к вложениям, исчисляемым в миллионах рублей.

Значения не отрицательны

Позволяет установить нулевую нижнюю границу для тех влияющих ячеек, для которых она не была указана в поле Ограничение диалогового окна Добавить ограничение.

Оценка

Служит для указания метода экстраполяции — линейная или квадратичная — используемого для получения исходных оценок значений переменных в каждом одномерном поиске.

Линейная. Служит для использования линейной экстраполяции вдоль касательного вектора.

Квадратичная. Служит для использования квадратичной экстраполяции, которая дает лучшие результаты при решении нелинейных задач.

Производные

Служит для указания метода численного дифференцирования — прямые или центральные производные — который используется для вычисления частных производных целевых и ограничивающих функций.

Прямые. Используется в большинстве задач, где скорость изменения ограничений относительно невысока.

Центральные. Используется для функций, имеющих разрывную производную. Данный способ требует больше вычислений, однако его применение может быть оправданным, если выдается сообщение о том, что получить более точное решение не удается.

Метод

Служит для выбора алгоритма оптимизации— метод Ньютона или сопряженных градиентов — для указания направление поиска.

Метод Ньютона. Реализация квазиньютоновского метода, в котором запрашивается больше памяти, но выполняется меньше итераций, чем в методе сопряженных градиентов.

Метод сопряженных градиентов. Реализация метода сопряженных градиентов, в котором запрашивается меньше памяти, но выполняется больше итераций, чем в методе Ньютона. Данный метод следует использовать, если задача достаточно велика и необходимо экономить память, а также если итерации дают слишком малое отличие в последовательных приближениях.