- •Основания теории оптимизации (теоремы о необходимости и достаточности существования экстремума функции многих переменных).
- •5.2.Достаточные условия экстремума.
- •Матрица Гессе и вектор-градиент функции многих переменных. Привести пример определения (функцию многих переменных задать самостоятельно).
- •Методы одномерного поиска экстремума. Метод золотого сечения.
- •Методы одномерного поиска экстремума. Метод поиска с использованием чисел Фибоначчи.
- •Методы одномерного поиска экстремума. Метод квадратической интерполяции.
- •Графический метод решения задач квадратичного программирования.
- •Метод множителей Лагранжа.
- •Алгоритм обобщенного метода множителей Лагранжа.
- •Градиентные методы решения задач нелинейного программирования.
- •Метод тяжелого шарика.
- •Эвристические методы поиска экстремума. Метод Монте-Карло.
- •Гомеостат Эшби и его связь со случайным поиском.
- •Методы случайного поиска.
- •Алгоритм случайного спуска с линейной тактикой
- •Алгоритмы эволюционной оптимизации. Муравьинный алгоритм.
- •Алгоритмы эволюционной оптимизации. Роевой алгоритм.
- •В чем состоит смысл когнитивной составляющей алгоритма поиска с роевым интеллектом?
- •Виды игр (безкоалиционные, кооперативные, дифференциальные и другие).
- •Игра двух участников с нулевой суммой. Решение игры двух участников с нулевой суммой в смешанных стратегиях.
- •Графо-аналитический метод решения матричной игры 2 х n и m х 2.
- •Решение игр вида 2хn и mх2
5.2.Достаточные условия экстремума.
Так же как и для функции одной переменной, необходимый признак экстремума в случае многих переменных не является достаточным. Это значит, что из равенства нулю частных производных в данной точке вовсе не следует, что этаточка обязательно является точкой эксремума.
Достаточные условия экстремума для функций нескольких переменных носит значительно более сложный характер, чем для функции одной переменной.
Пусть функция f(x 1 ,x 2 ,…,x n ) определена, непрерывна и имеет непрерывные производные первого и второго порядковокрестности некоторой стационарной точки (x 1 0 ,x 2 0 ,…,x n 0 ).Разлагая разность
= f(x 1 ,x 2 ,…,x n )-f(x 1 0 ,x 2 0 ,…,x n 0 )
по формyле Тейлора, получим
= { f x ’’ x 1 2 +f x ’’ x 2 2 +…+f x ’’ x n 2 +2f x1x2 ’’ x 1 x 2 + +2f x1x3 ’’ x 1 x 3 +…+2f xn-1xn ’’ x n-1 x n }= f xixj ’’ x i x j
где x= x i -x i 0 ; производные все вычеслены в некоторой точке
(x 1 0 +0 x 1 , x 2 0 +0 x 2 ,…, x n 0 +0 x n ) (0<0<1)
Введём и здесь значения
f xixj ’’ (x 1 0 ,x 2 0 ,…,x n 0 )=a ik (i,k=1,2,…,n) (5.2)
так что
f xixj ’’ (x 1 0 +0 x 1 , x 2 0 +0 x 2 ,…, x n 0 +0 x n )= a ik + ik
и
ik 0 при x 1 0,…, x n 0 (5.3)
Теперь интеесующее нас выражение можно написать в виде:
= { a ik x i x k + ik x i x k } (5.4)
На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке : он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных x 1 ,…, x n . От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса.
В высшей алгебре квадратичную форму
a ik y i y k (a ik = a ki ) (5.5)
от переменных y 1 ,…,y n называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю.
Необходимое и достаточное условие для того, чтобы форма (5.5) была определенной и положительной принадлежит ,как было уже сказано выше , Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:
Матрица Гессе и вектор-градиент функции многих переменных. Привести пример определения (функцию многих переменных задать самостоятельно).
Гессиан функции — симметрическая квадратичная форма описывающая поведение функции во втором порядке.
Для
функции
,
дважды дифференцируемой в точке
или
где
(или
)
и функция
задана
на
-мерном вещественном пространстве
(или комплексном пространстве
)
с координатами
(или
).
В обоих случаях гессиан — квадратичная
форма, заданная на касательном
пространстве,
не меняющаяся при линейных
преобразованиях переменных. Гессианом также
часто называют и определитель матрицы
Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то
Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе.
Основания теории оптимизации. Теорема о достаточности существования экстремума функции многих переменных.
Если
дважды
дифференцируема в стационарной точке
,
то
--
точка минимума (максимума), если
квадратичная форма
положительно
(отрицательно) определена. Если эта
форма не определена, то экстремума в
этой точке нет. Если она вырождена, то
неизвестно, является ли
точкой
экстремума.
Положительно (отрицательно) определенные квадратичные формы. Критерий Сильвестра.
Вещественная
квадратичная форма
называется положительно
(отрицательно) определенной,
если
для
любых
.
Положительно и отрицательно определенные
квадратичные формы называются определенными
(знакоопределенными).
Если неравенство
выполняется
для любых значений
,
то квадратичная форма называетсянеотрицательно
(неположительно) определенной.
В этом случае говорят, что квадратичная
форма полуопределенная.
Если же квадратичная форма принимает
как положительные, так и отрицательные
значения, то она называется неопределенной
(знакопеременной).
Определенность, полуопределенность и
неопределенность квадратичных форм
обозначается неравенствами
соответственно.
Поскольку
каждой вещественной квадратичной форме
соответствует ее матрица, то эта
терминология переносится на действительные
симметрические матрицы. Например,
симметрическая матрица
называется положительно
определенной,
если такой является квадратичная
форма
.
Определенность, полуопределенность и
неопределенность симметрической матрицы
обозначаются неравенствами
соответственно.
Критерий Сильвестра определяет, является ли симметричная квадратная матрица положительно (отрицательно, неотрицательно) определённой.
Пусть квадратичная форма имеет в каком-то базисе матрицу
Тогда
эта форма положительно определена,
тогда и только тогда когда все её главные
(угловые) миноры
положительны.
Форма отрицательно определена, если и
только если знаки
чередуются,
причём
.
Здесь главными минорами
матрицы
называются
определители вида
Теорема
(критерий
Сильвестра). Для того чтобы квадратичная
форма
была положительно определённой,
необходимо и достаточно чтобы все
угловые миноры матрицы квадратичной
формы были положительны, то есть, чтобы
Здесь
- угловые миноры матрицы квадратичной
формы.
Следствие.
Для того чтобы квадратичная форма
была отрицательно определённой,
необходимо и достаточно, чтобы знаки
угловых миноров матрицы квадратичной
формы чередовались следующим образом:
Методы одномерного поиска экстремума. Общий поиск.
Методы одномерного поиска экстремума. Метод бисекции.
Это один из простейших методов нахождения корней нелинейных уравнений. Он состоит в следующем. Допустим, что нам удалось найти отрезок [a,b], в котором расположено искомое значение корня x = c, т. е. a<c<b. В качестве начального приближения корня c принимаем середину этого отрезка, т. е. c0 = (a + b)/2. Далее исследуем значения функции F(x) на концах отрезков [a,c0] и [c0,b], т. е. в точках a, c0, b. Тот из них, на концах которогоF(x) принимает значения разных знаков, содержит искомый корень;
поэтому его принимаем в качестве нового отрезка. Вторую половину отрезка [a,b], на которой знак F(x) не меняется, отбрасываем. В качестве первой итерации корня принимаем середину нового отрезка и т. д. Таким образом, после каждой итерации отрезок, на котором расположен корень, уменьшается вдвое, т. е. после nитераций он сокращается в 2n раз.
Рис. 1.
Пусть для определенности F(a)<0, F(b)>0 (рис. 1). В качестве начального приближения корня примем c0 = (a + b)/2. Поскольку в рассматриваемом случае F(c0)<0, то c0 < c < b, и рассматриваем только отрезок[c0,b]. Следующее приближение: c1 = (c0 + b)/2. При этом отрезок [c1,b] отбрасываем, посколькуF(c1)>0 и F(b)>0, т. е. c0 < c < c1. Аналогично находим другие приближения: c2 = (c0 + c1)/2 и т. д.
Итерационный
процесс продолжаем до тех пор, пока
значение функции F(x) после n-й
итерации не станет меньшим по модулю
некоторого заданного малого числа e ,
т. е.
.
Можно также оценивать длину полученного
отрезка: если она становится меньше
допустимой погрешности, то счет
прекращается.
Метод деления отрезка пополам довольно медленный, однако он всегда сходится, т. е. при его использовании решение получается всегда, причем с заданной точностью. Требуемое обычно большее число итераций по сравнению с другими методами не является препятствием к применению этого метода, если каждое вычисление значения функции F(x) несложно.
