
- •Глава 3 Функции нескольких переменных
- •3.1. Критерии оптимальности
- •3.2. Методы прямого поиска
- •3.2.1. Метод поиска по симплексу (s2-метод)
- •3.2.2. Метод поиска Хука — Дживса
- •3.7. Итерация поиска по методу Хука—Дживса в примере 3.3.
- •3.2.3. Метод сопряженных направлений Пауэлла
- •3.3. Градиентные методы
- •3.3.1. Метод Коши [20]
- •3.3.2. Метод Ньютона [23]
- •3.3.3. Модифицированный метод Ньютона
- •3.3.4. Метод Марквардта
- •3.3.5. Методы сопряженных градиентов
- •3.3.6. Квазиньютоновские методы
- •3.3.7. Обобщенный градиентный алгоритм
- •3.3.8. Численная аппроксимация градиентов
- •3.4. Сравнение методов и результаты вычислительных экспериментов
- •3.5. Заключение
- •Контрольные вопросы и задачи
3.5. Заключение
В
данной главе изложены методы исследования
функций нескольких переменных в задачах
оптимизации. Сформулированы необходимые
и достаточные условия существования
минимума функции нескольких переменных.
Вместе с тем большая часть главы посвящена
рассмотрению методов поиска оптимумов.
Некоторые методы включены по причинам
исторического характера, другие методы
являются наиболее эффективными из
разработанных к настоящему времени.
Рассмотрены методы, в которых используются
только значения f
(x),
значения
f
(x)
и
f
(x)
значения
f
(x),
f
(x)
и
²f
(x).
Достаточно подробно освещены вопросы,
связанные с важным понятием сопряженности
направлений; изложены методы сопряженных
градиентов и квазиньютоновские методы.
Разумеется, проведенное обсуждение не
является полным, и многие
полезные
методы не рассмотрены из-за ограниченного
объема книги. Глава завершается кратким
анализом алгоритмов и результатов
вычислительных экспериментов.
Контрольные вопросы и задачи
3.1. Объясните, почему направления поиска, которые используются в алгоритме прямого поиска, например в алгоритме Хука — Дживса, должны быть линейно независимыми. Сколько направлений следует использовать в данном случае?
3.2. Опишите две ситуации, в которых метод поиска по симплексу оказывается более предпочтительным, чем метод сопряженных направлений Пауэлла.
3.3. Почему квадратичные функции используются как основа для построения алгоритмов нелинейной оптимизации?
3.4. В чем состоит полезность свойства параллельного подпространства, которым обладают квадратичные функции?
3.5. В чем заключается свойство убывания целевой функции при переходе от итерации к итерации? Почему выполнение этого свойства необходимо для построения эффективного алгоритма? Укажите один алгоритм, обладающий этим свойством, и один алгоритм, который этим свойством не обладает.
3.6. Почему положительная определенность матрицы А(k) является необходимым условием при решении задач минимизации с помощью квазиньютоновских методов?
3.7. Поясните связь метода Марквардта с методами Коши и Ньютона. Какому из трех перечисленных методов следует отдать предпочтение?
3.8. Возможно ли получение одинаковых точек при использовании методов Дэвидона — Флетчера — Пауэлла и Флетчера — Ривса для решения задачи с квадратичной целевой функцией, если в обоих случаях начальная точка одна и та же? Если возможно, то при каких условиях? Если невозможно, то почему?
3.9. Поясните понятие квадратичной сходимости. Укажите один алгоритм, обладающий свойством квадратичной сходимости, и один алгоритм, который этим свойством не обладает.
3.10. Покажите, что функция
f
(x)
= 3x+
2x
+
x
–
2x
x
–
2x
x
+
2x
x
–
6x
–
4x
–
2x
является выпуклой.
3.11. Найдите и классифицируйте стационарные точки функции
f
(x)
= 2x+
4x
x
–
10
x
x
+
x
линии уровня которой изображены на рис. 3.19.
f
(x)
= 2x+
4x
x
–
10
x
x
+
x
Риc. 3.19. Линии уровня функции из задачи 3.11.
3.12. Проведите анализ определенности следующих квадратичных форм:
Q(x)
= x
+
2x
–
3x
–
6x
x
+
8x
x
–
4x
x
,
Q(x)
= 2ax
x
+2bx
x
+2cx
x
,
Q(x)
= x
+5x
+3x
+4x
x
–2x
x
–2x
x
.
3.13. Воспользуйтесь методом Гаусса — Жордана для преобразования следующей квадратичной формы к виду суммы полных квадратов:
Q
(x)
= x+2x
x
+4x
x
+3x
+2x
x
+5x
.
Покажите, что эта квадратичная форма положительно определена.
3.14. Пусть
в точке х=
градиент
f
(
)
= 0. Что можно сказать о точкех,
если
(а) f(x) — выпуклая функция?
(б) f(x) — вогнутая функция?
(в) ²f
(
)
— неопределенная матрица?
(г) матрица
²f
(
)
положительно определена?
(д) матрица
²f
(
)
отрицательно определена?
3.15. Контрпример Пеано. Дана функция
f
(х)
=
(x–
a
x
)(x
–
a
x
),
где
a
и
a
—
постоянные коэффициенты.
(а) Охарактеризуйте
точку х
= [0,
0].
(б) Покажите, что максимальное значение f(x) на множестве точек кривой, заданной уравнением
x=
½ (a
+
a
)
x
,
достигается в начале координат.
(в) Нарисуйте несколько линий уровня этой функции в окрестности начала координат.
3.16. В результате поиска минимума функции
f
(х)
=
[x+
(x
+
1)²]
[x
+
(x
–
1)²]
найдены следующие точки:
(а) х(1)
= [0, 0],
(б) х(2)
= [0, 1],
(в) х(3)
= [0, –1],
(г) х(4)
= [1, 1],
Классифицируйте полученные точки.
3.17. Пусть требуется переправить 400 ярд3 сыпучего материала через большую реку. Для перевозки груза необходимо построить контейнер. Известны следующие данные: стоимость каждого рейса на противоположный берег реки и обратно равна 4,2 долл.; стоимость материалов для изготовления дна контейнера составляет 20,00 долл./ярд2; боковых стенок контейнера — 5,00 долл./ярд2, крышки контейнера — 20,00 долл./ярд2.
Сконструируйте контейнер таким образом, чтобы минимизировать полные затраты на перевозку груза.
3.18. Рассматриваются функция Розенброка
f
(х)
=
100(x–
x
)
+
(1– x
)
и начальная точка
х(0)
= [–1.2, 0].
Найдите точку x*, которой соответствует минимальное значение f (x*), пользуясь:
(а) методом поиска по симплексу Нелдера и Мида (проведите четыре итерации), затем при начальной точке х(0) проведите счет по программе SPX из библиотеки программ OPTLIB [22] или по другой подходящей программе по вашему выбору;
(б) методом Хука — Дживса (программа PS в OPTLIB);
(в) методом сопряженных направлений Пауэлла (программа PCD в OPTLIB).
3.19. На рис. 3.20 изображен бункер, для хранения зерна.
Требуется выбрать значения параметров h, d и φ таким образом, чтобы бункер имел заданный объем (v* = 10м3), а его стоимость была минимальной. Основание бункера изготавливается из деревянных плит стоимостью С1 = l долл./м2, а остальная часть бункера — из листового металла стоимостью С2 = 1,5 долл./м2. Воспользуйтесь ограничением на объем бункера для того, чтобы исключить одну переменную из целевой функции, и решите получаемую в результате задачу с двумя переменными с помощью метода поиска по образцу (θ = 30°). Указание. Полезно попытаться описать геометрическую форму бункера с помощью другого (эквивалентного) множества управляемых переменных.
Рис. 3.20. Бункер для хранения зерна.
3.20. На рис. 3.21 схематически изображена система подачи газа по трубам [76], в которой компрессорные станции расположены на расстоянии L миль друг от друга.
Рис. 3.21. Схема газопровода.
Суммарные затраты на эксплуатацию газопровода в течение года определяются
функцией
C
(D,
Pl,
L,
r)
= 7,84D2P1+
450000 + 36900D
++
+(r
–
1) (долл./год), (1)
где D — внутренний диаметр труб, дюйм; P1 — давление на выходе компрессора, фунт/дюйм2; L — расстояние между компрессорными станциями, миля; r = P1/P2 — отношение .давлений на выходе и входе компрессора. Предположим, что расход газа в единицу времени можно описать функцией
Q
= 3.39
(фут³/ч.), (2)
где f
= 0,008D
— коэффициент трения. Пусть расход газа
составляет 100
106
фут3/день.
Воспользуйтесь формулой (2) для исключения
переменной P1
из
(1). Затем с помощью метода поиска по
симплексу Нелдера и Мида и метода
сопряженных направлений Пауэлла найдите
такие значения параметров системы,
которым соответствует минимум суммарных
эксплуатационных затрат в единицу
времени.
3.21. Найдите координаты точек минимума функции Химмельблау (рис. 3.1)
f
(x)
= (+
– 11)
+(
+
– 7)
с точностью до трех десятичных знаков. Воспользуйтесь методом Хука — Дживса при поиске из следующих начальных точек:
х(1) = [5, 5]T, х(2) = [5, –5]T, х(3) = [0, 0]T,
х(4) = [–5, –5]T, х(5) = [–5, 0]T
3.22. Заданы текущее приближение к решению х(k) и направление поиска s(x(k)). Итерации проводятся по формуле (3.42). Покажите, что
α*
=
,
если целевая функция квадратичная:
f
(x)
= q
(x)
=
a
+ b²x
+
x
Cx.
3.23. Определите размеры прямоугольного контейнера открытого типа (без крышки), стоимость которого минимальна. (Пусть v* = 10 м3.)
3.24. Заданы
функция q
(х)
= 8x+
4x
x
+
5x
,
начальная
точка
x(0)
= [10, 10]T
и два линейно независимых направления
d(0)
=q
(x(0))
= [200, 140]T, d(1)
= [7, – 10]T.
Определите
новое направление поиска (S(1)
= d(1)
+ β∆g(1)),
сопряженное с d(0).
Используйте
эти направления при поиске точки х*:
сначала
проведите поиск в направлении S(0)
= d(0),
затем из полученной точки минимума
проведите поиск в направлении S(1).
Сравните S(1)
с направлением, полученным по методу
Флетчера — Ривса.
3.25. Найдите направление, ортогональное вектору
s=
, x
= [0,
0, 0]T.
Найдите также направление s2, сопряженное с s1 в той же точке при условии, что целевая функция равна
f
(x)
= x+
2x
–
x
x
+
3x
–
2x
x
+
x
.
3.26. Определите и классифицируйте стационарные точки функции
f
(x)
= x–
x
x
+
x
–
2x
+
3x
–
4.
3.27. Изон показал, что задача выбора (с целью минимизации инерции передачи) передаточных отношений в понижающей зубчатой передаче, образованной тремя прямозубыми цилиндрическими колесами и имеющей суммарное передаточное число 10, эквивалентна задаче минимизации функции (3.93). Воспользуйтесь методами Хука — Дживса, Коши и Флетчера — Ривса для нахождения приближенных значений координат точки х* при х(0) = [0.5, 0,5]T.
3.28. Заданы функция
f
(х)
=
100(x–
x
)
+
(1– x
)
и две первые точки, полученные в процессе поиска точки минимума функции f:
х(0)
= [–1.2, 1], х(1)
= [–1.3, 1.07]
.
Определите направление поиска из точки х(1) пользуясь следующими градиентными методами: (а) методом Коши, (б) модифицированным методом Ньютона, (в) методом Флетчера — Ривса, (г) методом Марквардта (λ(1) = 100).
3.29. Исследуйте
влияние ε2
— параметра сходимости для поиска вдоль
прямой —
на
процедуры расчетов по методам Флетчера
— Ривса, Дэвидона — Флетчера — Пауэлла
и Бройдена — Флетчера — Шэнно. Используйте
каждый из перечисленных методов для
решения задачи минимизации функции
Вуда (3.94) при х(0)
= [–3, –1, –3, –1]T.
Положите ε=
αε
,
α = 0,01, 0,1, 1 и 10; при этом значение параметра
сходимости алгоритма ε
следует выбирать в зависимости от
характеристик используемой ЭВМ.
Примечание:
для
ЭВМ CDC–6500
можно выбрать ε
=
10–4.
3.30. Рассмотрите
задачу 3.19, в которой речь шла об определении
параметров геометрической формы бункера
для хранения зерна. Исследуйте влияние
отношения c/c
на
оптимальную форму бункера. В частности,
найдите оптимальные решения при c
/c
=
0.5, 1.5
и 3 и проиллюстрируйте ответы рисунками.
Какие общие выводы можно при этом
сделать?
3.31. Проведите три итерации в соответствии с методом Коши, модифицированным методом Ньютона и методом Дэвидона — Флетчера — Пауэлла для минимизации функции Пауэлла
f
(x)
= (x+
10x
)
+
5(x
–x
)
+
(x
–
2x
)
+
10(x
–x
)
при х(0) = [3, –1, 0, 1]T.
3.32. В процессе проведения экспериментов инженер устанавливает наличие функциональной зависимости некоторой величины Q от переменной t. Он имеет определенные основания…