
- •Глава 1
- •§1. Сравнительная характеристика методов решения задач оптимизации.
- •§2. Методы исследования функций классического анализа
- •Глава 2
- •§1. Примеры составления задач лп
- •Формулировка задачи о рациональном питании [2].
- •Формулировка транспортной задачи
- •§2. Методы исследования функций численного анализа.
- •§ 3. Геометрическая интерпретация решения задачи лп.
- •§4. Алгоритм решения канонической задачи лп симплексным методом.
- •1) Найдется хотя бы одна положительная (отрицательная) оценка и в каждом столбце с такой оценкой найдется хотя бы один положительный элемент, то можно улучшить решение, выполнив следующую итерацию;
- •2) Найдется хотя бы одна положительная (отрицательная) оценка, столбец которой не содержит ни одного положительного элемента, то функция не ограничена в области допустимых решений;
- •§ 5. Решение почти канонических задач.
- •0 1 0 -1 0
- •§ 6. Вырожденная задача лп.
- •Глава 3 Решение основной задачи линейного программирования.
- •§1 Сведение основной задачи к двум каноническим.
- •Метод искусственного базиса
- •§2. Задача о диете
- •Глава 4. Целочисленное линейное программирование.
- •§1 Метод Гомори
- •§2.Пример постановки задачи рационального раскроя [4, c.176].
- •Задачи.
- •Глава 5. Теория двойственности в лп
- •§ 1. Симметричные двойственные задачи
- •I и II задачи имеют решение.
- •§2. Несимметричные двойственные задачи.
- •Глава 6. Нелинейное программирование
- •§ 1. Задачи нелинейного программирования с линейной целевой функцией и нелинейной системой ограничений.
- •§ 2. Задачи нелинейного программирования с линейной системой ограничений, но нелинейной целевой функцией.
- •§ 3. Задачи нелинейного программирования с нелинейной системой ограничений и нелинейной целевой функцией.
- •§4. Градиентный метод нелинейного программирования
- •§5. Выпуклое программирование.
- •Геометрическая интерпретация и графический способ решения задачи квадратичного программирования
- •§6. Параметрическое программирование.
- •Глава 7. Динамическое программирование.
- •Глава 8. Метод случайных испытаний.
- •Глава 9. Геометрическое программирование.
§2. Методы исследования функций классического анализа
Применение понятия «производной функции» при решении
практических экстремальных задач
При решении многих экстремальных задач часто используют различные частные приемы. Однако существует достаточно общий прием решения таких задач, основанный на методах математического анализа. Интересно напомнить, что одна из причин возникновения математического анализа (особенно дифференциального исчисления) связана с необходимостью решения практических экстремальных задач. Из курса «Алгебра и начала анализа» для IX. класса известно, что для нахождения наибольшего и наименьшего значений функции у = f (х), дифференцируемой в ] а;b [, можно поступить следующим образом:
Найти все критические точки функции, принадлежащие [а; b],
Найти значения функции в этих точках и на концах промежутка. Наибольшее и наименьшее из этих чисел будут соответственно наибольшим и наименьшим значениями функции на отрезке.
Нетрудно видеть, что если непрерывная функция дифференцируема в интервале и имеет единственный экстремум, то в случае максимума это будет ее наибольшее значение, а в случае минимума — наименьшее. При этом правило нахождения наибольшего и наименьшего значений функции упрощается.
Задача 1. Найти наибольшее и наименьшее значения функции f(х) = х3 - 3х2 + 1 на [-1; 4].
Решение. Найдем производную функции f(х) : f´(х) = 3х2 - 6х Она существует во всех точках.. Решив уравнение Зх2 - 6х = 0, найдем критические точки:
х1 = 0, х2= 2. Теперь составим таблицу значений функции в критических точках и на концах отрезка:
Х |
-1 |
0 |
2 |
4 |
f(х) |
-3 |
1 |
-3 |
17 |
Из этой таблицы видно, что наименьшее значение равно —3, а наибольшее 17.
Задача 2. Найти наименьшее и наибольшее значения функции у = х2- 2х + 3 на [0; 2].
Решение. Функция имеет единственный экстремум (минимум) в точке х = 1, которая принадлежит отрезку [0; 2]. Поэтому x = 1 есть наименьшее значение данной функции на [0; 2]. Далее, y(0) = 3, y(2) = 3. Наибольшее значение (3) функция достигает на обоих концах отрезка.
Выпуклость множества допустимых решений
задачи и целевой функции.
Для решения задач математического программирования существенно важно знать:
1) Выпукло или не выпукло множество допустимых решений задачи;
2) Является ли целевая функция выпуклой или вогнутой или она не относится ни к тому, ни к другому классу.
Напомним необходимые определения. Говорят, что множество выпукло, если оно вместе с любыми своими точками А и В содержит и все точки отрезка АВ. На рис.1. представлены примеры выпуклых множеств точек плоскости. Примерами выпуклых множеств в пространстве могут служить сфера, пирамида, призма и т. д.
Область
является
выпуклой,
если отрезок
прямой, соединяющей любые две точки
области, принадлежит этой области.
Следовательно, если хх
и х2
находятся в этой области, то любая точка
вида (θ х2
+ (1 — θ)
,
где 0 < θ <
1, находится
в этой же области. На рис.2. -
а изображена
выпуклая область, а на рис.1. - б
— невыпуклая.
Рис. 2.
На рис.3. изображены примеры невыпуклых множеств. В невыпуклом множестве можно указать хотя бы две точки, такие, что не все точки отрезка АВ принадлежат рассматриваемому множеству. Как пример невыпуклого множества в пространстве можно указать тор.
Рис. 3.
Функцию у = f (х) одной переменной будем называть выпуклой, если отрезок, соединяющий две любые точки её графика, принадлежит графику или расположен выше его (рис.4.). Функция вогнута, если отрезок, соединяющий две любые точки графика, принадлежит ему или расположен ниже его (рис.5.).
Рис.4. Рис.5.
Аналогично можно сформулировать определения понятий вогнутой и выпуклой функций нескольких переменных. Мы говорим, что гиперповерхность Z = f (х1, х2, ..., хп) выпуклая, если отрезок, соединяющий две ее любые точки, лежит на поверхности или выше ее. Гиперповерхность Z = f (х1, х2, ..., хп) вогнута, если отрезок, соединяющий две ее любые точки, лежит на поверхности или ниже ее.
Локальный и глобальный минимум функция f(х).
Функция f(х) имеетлокальный минимум в точке х0,если существует некоторая положительная величина δ, такая, что если |х - х0| < δ, тоf(х) ≥ f(х0) т. е. если существует окрестность точких0, такая, что для всех значенийх в этой окрестностиf(х) больше f(х0)
Функция f(х) имеет глобальный минимум в точке х*, если для всехх справедливо неравенство f(х) ≥ f (х*).
На рис.6. дано графическое представление функции f (х), которая имеет локальный минимум в точкех0 и глобальный минимум в точкех*.
Рис.6.
Классический подход к задаче нахождения значений х0 их* состоит в поиске уравнений, которым они должны удовлетворять. Представленная на рис. функция и ее производные непрерывны, и видно, что в точкахх0 их* производнаяf''(х), (градиент функции) равна нулю.Следовательно, х0 и х* будут решениями уравнения f''(х) = 0.Точкахт, в которой достигаетсялокальный максимум, и точкахc, в которой имеется точка горизонтального перегиба функции, также удовлетворяют этому уравнению. Следовательно, уравнениеf''(х) = 0 является тольконеобходимым условием минимума, ноне является достаточным условием минимума. Заметим, однако, что в точкахх0 их* производнаяf''(х) меняет знак с отрицательного на положительный. В точкехт знак
меняется с положительного на отрицательный, в то время как в точке хс он не меняется. Следовательно, производная в минимуме является возрастающей функцией, а поскольку степень возрастанияf''(х) измеряется второй производной, можно ожидать, что f'''(х0) > 0,f'''(х*) > 0, тогда какf'''(хт) < 0. Если, однако, вторая производная равна нулю, ситуация остается неопределенной. Полученные выше результаты могут найти надежное обоснование, если рассмотреть разложение функцииf(х) в ряд Тейлора в окрестности точких0 (илих*, илихт), что, конечно, требует непрерывности функцииf (х), и ее производных:
+
)
+
(1.1)
Если
в точкех0 достигается
минимум, то левая часть (1.1) будет
неотрицательной для любого достаточно
малогоh
(|h|
<δ). Следовательно, первая производнаяf''(х0)
должна быть равна
нулю, и это является достаточным условием.
Если бы она была положительной, то
достаточно малое отрицательное
значение 𝐡делало бы правую часть (1.1) отрицательной,
а если бы она была отрицательной, то
достаточно малое положительное
значение
делало бы правую часть отрицательной.
Так как в следующем члене (1.1) всегда
2 > 0, то, если
f'''(х0)
> 0, в точкех0
достигается минимум. Если
и f'''(хm)
< 0, , то из аналогичных
соображений в точкехт
достигается
максимум. Для определения различия между локальным и глобальным минимумами необходимо сравнить значения функций f(х0) и f (х*).
Пример.
Исследовать характер точек перегиба функции f(х) =х3 - 2х2 +х + 1:
Решение.
Зх2
- 4х+1 = 0, тогда (Зх - 1)(х - 1) = 0, т. е.х =
1/3 илих= 1.
При х = 1/3
производнаяменяет знак с положительного на
отрицательный, а при
х = 1 - с отрицательного на положительный. Следовательно, в точкех = 1/3 достигается максимум, а в точкех = 1 - минимум. Этот пример может быть решен более простым способом, если вычислить вторую производнуюf''' = 6х — 4: f'''1/3) = -2, т. е. отрицательна, и прих = 1/3 достигается максимум; f'''(1) = 2, т. е. положительна, и прих = 1 достигается минимум. Неоднозначность, возникающую приf'''(*)=0, можно разрешить, увеличив количество членов в формуле разложения в ряд Тейлора
:
+
)
+
При этом можно
сформулировать следующее правило: Если
функция f(х) и ее производные непрерывны, то точка
х0является точкой экстремума
(максимума или минимума)тогда, и
только тогда,когдап
четное, гдеn
— порядок первой необращающейся
в нуль в точкех0
производной. Если
<
0, то в
точке х0
достигается максимум, если>
0, то в точкех0 достигается
минимум.
Пример 2
Найти точку перегиба функции f (х) = (х - 1)6:
Решение. f' (х) = 6 (х - 1)5= 0 при х = 1.
Первой, не обращающейся в нуль в точке х = 1 производной, будетf 6(1) = 6. Следовательно, функцияf (х) имеет минимум в точкех = 1.
Локальный и глобальный минимум функция Z = f (х1, х2, ..., хп) .
Вспомним еще ряд определений, которые нам потребуются в дальнейшем.
Пусть дана функция Z = f (х1, х2, ..., хп), определенная на замкнутом множестве Ф. Элементами множества Ф являются точки X = (х1, х2, .. ., хп). Поэтому функцию
Z
=f
(х1,
х2,
...,
хп)
можно
записать так: Z
=f
(х).
Говорят, что функция Z
=f
(х),
определенная
на некотором замкнутом множестве X,
достигает в точке х0
Х
локального
максимума (локального минимума),
если найдется
такое число
> 0, что для
всех х,
удовлетворяющих
неравенству |х—х0|
<
,
выполняется неравенство
f(х)
≤
f(х0)
(f(х)
≥
f(х0)
).
Точка х0,
в которой
функция достигает локального максимума
(минимума), называется точкой
локального максимума (минимума).
Рассмотрим
пример. На рис. 7 изображён график
некоторой функции одной переменной,
определенной на [1; 10] (заметим, что эта
функция не является ни выпуклой, ни
вогнутой). Функция имеет на [1; 10] три
точки локального минимума (х1=
3,
х2 = 6, х3 = 9) и две точки локального максимума (x4 = 5, x5 = 8).
Пусть
функция Z
= f
(х)
определена
на замкнутом множестве X.
Если х0
Х
и
f(х)
≤
f(х0)
(f(х)
≥
f(х0)
).
любой точки х0
Х,
то говорят, что в точке х0
функция
достигает абсолютного максимума
(абсолютного минимума). Вместо термина
«абсолютный» часто используют термин
«глобальный». Иными словами, глобальный
максимум функции есть ее наибольшее
значение в области определения, а
глобальный минимум - наименьшее значение.
Глобальный максимум и глобальный минимум
называют глобальными экстремумами
функции. На рисунке 6 представлен
график функции, глобальный минимум
которой равен 2
Рис.7
и совпадает с наименьшим из локальных минимумов. Глобальный же максимум, равный 9, достигается функцией в точке x6 =10 и не совпадает с наибольшим из локальных максимумов.
Экстремумы функций многих переменных
Решение задачи оптимизации существенно усложняется, когда критерий оптимальности является функцией нескольких независимых переменных даже при известном аналитическом выражении этой функции. Наибольшие трудности возникают при отсутствии непрерывности у всех или некоторых производных оптимизируемой функции. В последнем случае для решения оптимальной задачи целесообразно использовать методы нелинейного программирования. Ниже рассмотрены необходимые и достаточные условия лишь для непрерывных функций, имеющих к тому же непрерывные производные первого и второго порядков.
Для непрерывной функции многих переменных
R
= R
(х2,………….,
),
(111.2)
имеющей
непрерывные производные первого и
второго порядков по всем переменным
(i=1,…,
n)
, необходимым условием
экстремума в точке
служит
равенство нуля в этой точке первых
производных по всем переменным.
Другими словами, точки, в которых возможен
экстремум функции (111,2), могут быть
определены решением системы уравнений:
.
i = 1, … , n
(111,3)
Для того чтобы
проверить, действительно ли точка
,
координаты которой удовлетворяют
системе уравнений (111,3), является точкой
экстремума функции (111,2), уже недостаточно
проверки экстремальности по всем
переменным в отдельности. В качестве
примера рассмотрим задачу отыскания
экстремума функции двух переменных:
R=
4-. (111,4)
Система уравнений (111,3) при этом имеет вид:
(a)
Решением ее являются значения:
(б)
Точка с координатами (б) является точкой, в которой может быть экстремум. Вычисление вторых производных по каждой из переменных в этом случае дает:
.
(в)
Из соотношений
(в) следует, что по каждой из переменныхи
в точке (б) функция (111, 4) принимает
максимальное значение. Однако можно
показать, что точка с координатами (б)
в действительности не является точкой
экстремума. Наиболее наглядно это
доказывается поворотом осей координат
на угол 45°. В данном случае для новых
координат будут справедливы следующие
формулы преобразования :
(г)
Подставляя выражения
(г) в соотношение (111,4) с учетом того, что
sin45° =cos45°=
найдем
R=
3 + (l)2- 2(
)2.
(111. 5)
Очевидно, что при
вращении системы координат экстремальные
свойства функции R(,
х2) не нарушаются. Поэтому, вычисляя
производные от функции (111,5) по обеим
переменным и приравнивая их нулю, получим
систему уравнений
2(-1)
= 0 ; - 4
= 0 , (д)
решение которой определяет положение точки, «подозреваемой» на экстремум в новой системе координат:
=1
;
=0
. (е)
Вычисление вторых производных по каждой из координат в новой системе теперь дает:
.
(ж)
Из уравнений (ж)
следует, что изучаемая точка не является
экстремальной, так как по переменнойфункция
(111,5) имеет минимум, а по
переменной
— максимум. Нетрудно представить
вид поверхности, описываемой
выражениями (111, 4) или (111,5). Она представляет
собой «седло» (рис. 111-8), имеющее точку,
в которой первые производные функции
по обеим переменным обращаются в
нуль.Разумеется, что использованная
процедура поворота осей координат в
общем случае непригодна для
практического исследования точек,
подозреваемых на экстремум. В
особенности это относится к задачам, в
которых число независимых переменных
велико.
Поэтому необходимо применять более строгие и общие методы.
Предположим, что исследуется на экстремум точка с координатами:
удовлетворяющими системе уравнений (111,3). Разложим функцию
в окрестности точки (111, 6) в ряд Тейлора по степеням приращении переменных
Тогда получим:
В записи выражения (111,9) использована сокращенная форма представления членов разложения с производными выше первого порядка. Например, для функции двух переменных член
раскрывается как
Аналогично
раскрываются и члены более высокого
порядка при большем числе независимых
переменных. Опуская в разложении (111,9)
члены, имеющие порядок малости по
выше второго, и принимая во внимание,
что члены первого порядка малости
по
обращаются
в нуль, поскольку координаты точки
удовлетворяют системе (111,3), получим
следующее приближенное равенство:
Из выражения
(111,11) следует, что знак приращения функции
в
достаточно малой окрестности точки
определяется производными второго
порядка отR(x)
по всем переменным, включая и смешанные
производные. Для того чтобы точка
являлась точкой экстремума функцииR(x), достаточно
при любых малых приращениях независимых
переменных
правой
части выражения (111,11) оставаться
положительной для точки минимума и
отрицательной для максимума. Поскольку
вторые производные в выражении (111,11)
вычисляются в точке
,
они могут рассматриваться как постоянные
числа. В этом случае для анализа знака
правой части выражения (111,11) не обязательно
требовать малости величин
.Taким образом, вопрос о
знаке приращения функции
Rможет решаться анализом знака квадратичной
формы
коэффициенты которой связаны с производными в правой части выражения (111,11) соотношениями
=
Квадратичная форма называется положительно определенной, если для любых значений zpона сохраняет положительное значение, за исключением точкиzp= 0 (р =1, ..., п), в которой она обращается в нуль. Для того чтобы найти, является ли данная квадратичная форма положительно определенной, можно воспользоваться теоремой, которая формулируется следующим образом. Для положительной определенности квадратичной формы (111,12) необходимо и достаточно, чтобы были выполнены условия Сильвестра:
(111.14)
Условия (111, 14) означают, что квадратичная форма (111, 12) будет положительно определенной в том случае, если все главные миноры соответствующей ей матрицы
, (111.15)
составленной из коэффициентов, будут строго положительны.
Таким образом,
если решен вопрос о положительной
определенности квадратичной формы
(111,12), где коэффициенты рассчитываются
по формулам (111, 13), то тем самым решается
задача и о типе точки
координаты которой удовлетворяют
системе уравнений (111,3), исследуемой
на экстремум.Так, когда квадратичная
форма, соответствующая правой части
выражения (111,11), оказывается положительно
определенной, исследуемая точка
является точкой минимума.Если
условия положительной определенности
не выполняются, но все главные миноры
матрицы (111,15), имеющие нечетный порядок,
отрицательны, т. е. для миноров нечетного
порядка в неравенствах (111, 14) знак
неравенств изменяется на обратный, то
квадратичная форма (111,12) будет отрицательно
определенной и, следовательно, функция
R(x)в
точке
имеет максимум.Если же условия
положительной и отрицательной
определенностей квадратичной формы
(111,12) не выполняются, но все главные
миноры отличны от нуля, то в исследуемой
точке
функцияR(x)
не имеет ни максимума, ни минимума.
При обращении в нуль главных миноров
матрицы (111, 15) вопрос о наличии экстремума
в исследуемой точке решается сложнее,
с использованием производных более
высокого порядка.
Рассмотрим некоторые частные случаи достаточных условий экстремума, которые могут быть получены из условий Сильвестра (111,14).
Случай двух переменных. Достаточным условием минимума является положительность главных миноров первого и второго порядков, что, принимая во внимание соотношения (111, 13), дает два условия относительно значений вторых производных функции R(x):
*
Достаточным
условием максимума в точке
является
выполнение условия
(111, 17), т. е. положительность четного минора, и одновременное выполнение условия отрицательности первого (нечетного) минора:
Проверим выполнение полученных условий для функции (111,4), для чего необходимо в дополнение к производным (в) вычислить значение смешанной производной, которое при этом будет равно:
Подставляя в
соотношение (111, 17), которое должно
выполняться для экстремальной точки
любого типа, значения производных из
выражений (в) и (и), получим, что это
условие не выполняется. Следовательно,
функция R(),
определяемая выражением (111,4), в точке
с координатами (б) не; имеет экстремума,
что и было получено ранее с использованием
вращения] осей координат.
Случай трех переменных.О наличии или отсутствии экстремума в точке, для которой первые производные по всем переменным обращаются в нуль можно в этом случае судить по знакам трех главных миноров:
=
;
(111,19)
При получении развернутых выражений главных миноров (111,20) (111,21) использовалось свойство симметрии матрицы (111,15), которое дует из определения ее элементов (111, 13), так как для непрерывных функций имеющих непрерывные производные до второго порядка, справедливо равенство:
Достаточным условием минимума для функции трех переменных является; положительность всех трех миноров (111, 19) —(111, 21), т. е.
Достаточным условием максимума служит положительность четных миноров (111,20) и отрицательность нечетных миноров (111,19) и (111,21), т. е.
Аналогичным образом могут быть получены достаточные условия и при большем числе переменных.