- •3.3. Чисельні методи відшукання екстремумів (основні ітераційні процедури)
- •Метод поділу інтервалу навпіл.
- •3.3. Чисельні методи відшукання екстремумів
- •Метод ділення інтервалу навпіл.
- •Метод золотого перерізу.
- •3.4. Методи одновимірної оптимізації, що враховують додаткові відомості про функції
- •4. Методи пошуку екстремумів функцій багатьох змінних
- •Аналітичний метод пошуку екстремумів
- •4.2. Ітераційний підхід. Унімодальність і опуклість
- •4.3. Метод перерізів
- •4.4. Вектор-градієнт і деякі його властивості
- •4.6. Спрощені градієнтні процедури
- •4.7. Процедури підвищеної ефективності
4.2. Ітераційний підхід. Унімодальність і опуклість
Для
мінімізації функції
,
що
характеризує
точність корекції каналу зв'язку, а
також для розв’язання багатьох інших
задач оптимізації функції декількох
змінних, на практиці застосовують
чисельні методи, що за допомогою ряду
ітерацій дозволяють з достатньою
точністю наблизитися до мінімуму цієї
функції. З подібною ситуацією ми
зустрічалися в главі 3, де ітераційний
підхід використовувався стосовно
функцій однієї змінної.
Апаратурна
реалізація такого підходу базується
на добре відомих процедурах оптимізації,
при виконанні яких напрямки обертання
«ручок» коректора (зміни параметрів
)
визначаються
значеннями поверхні
і
її похідних. Про методи пошуку
екстремумів такого типу і піде мова.
Важливо відзначити, що процедури послідовних наближень до екстремуму вимагають, щоб досліджувана поверхня мала деякі загальні для всіх точок області визначення (глобальні) властивості.
Визначення
4.5.
Функцію n+1
змінних
будемо називати унімодальною,
якщо
вздовж прямої лінії, проведеної з
довільної точки в області визначення
цієї функції в точку екстремуму
отримана одновимірна функція задовольняє
уведеній вище умові унімодальності
(визначення 3.4).
Сказане пояснює рисунок 4.3.
Рис. 4.3
Часто при дослідженні функцій багатьох змінних спираються на властивість опуклості (ця властивість є більш сильною: з опуклості завжди випливає унімодальність) - вона звичайно гарантує збіжність процесу послідовних наближень до екстремуму.
Визначення
4.6. Поверхня
називається
опуклою,
якщо відрізок
прямої лінії, що з'єднує будь-які дві
точки,
розташовані на поверхні, лежить цілком,
не враховуючи
кінців, нижче цієї поверхні (рис.
4.4,а).
Якщо відрізок, що з'єднує згадані точки,
лежить цілком вище поверхні, то багатомірну
функцію називають опуклою
вниз (рис.
4.4,б).
Доведено,
що середньоквадратична похибка
коригування
є опуклою
вниз
функцією.
По своїй суті опуклість вимагає того ж, що й унімодальність, але для будь-якого «вертикального» перерізу поверхні, а не тільки для перерізу, що проходить через точку екстремуму. Приведемо вигляд ліній рівня, одержаних в результаті горизонтальних перерізів опуклої (а) і унімодальної (б) поверхонь (рис. 4.5) (порівняйте перерізи А, B,C, D, Е на обох рисунках: у перерізі Е рис. 4.5,б умова опуклості порушується). На рис. 4.5 с = 1, 2, 3, 4, 5.
Рис. 4.4
4.3. Метод перерізів
Очевидно, найпростішим з відомих методів багатовимірної оптимізації, тобто відшукання екстремумів цільових функцій декількох змінних , є метод перерізів, чи метод почергового пошуку по кожної змінній. Сутність його при відшуканні, наприклад, мінімуму полягає в тому, що кожну з незалежних змінних змінюють доти, поки досліджувана функція - поверхня не перестане убувати, потім переходять до іншої змінної, поки не будуть перебрані всі змінні, після чого повертаються до тієї змінної, з якої починався пошук, відкриваючи тим самим другу ітерацію процесу, і т. д.
Рис. 4.5
Рисунок 4.6 показує, однак, що успіх застосування даної процедури оптимізації істотно залежить від вигляду поверхні і навіть у опуклих вниз функцій метод перерізів не завжди дозволяє знайти точку мінімуму. На рис. 4.6 поверхня представлена своїми лініями рівня (у випадках а і б — еліптичними).
Ясно,
що якість методу перерізів
істотно залежить від
вигляду
ліній рівня. Оскільки
кожна ланка
траєкторії пошуку паралельна одній
з
координатних осей
і загальна
траєкторія руху в області визначення
утворює
«сходи», метод перерізів
найбільш ефективний у
тому
випадку, коли лінії рівня являють собою
окружності
чи
еліпси, головні осі яких рівнобіжні
координатним осям
(рис.
4.6,а).
Якщо ж головні осі
еліпсів
повернені відносно координатних осей,
то приходиться
багато разів змінювати напрямок
пошуку, перш ніж мінімум буде досягнутий
(рис.
4.6,б).
Цей метод
зовсім
не придатний при оптимізації поверхні
зі зламом (чи, як
часто говорять, з
вузьким яром),
тому що
не можна
просунутися вниз
по зламу з точки
А
(рис.
4.6,в),
не маючи можливості переміщатися в дуже
малому секторі напрямків
(MN
- напрямок яру);
рух вздовж
координатних осей
тут
завжди призводить
до зростання поверхні.
Рис. 4.6
Відзначимо, що у багатьох опуклих (опуклих униз) поверхонь, що зустрічаються на практиці, завжди можна зробити крок, нехай невеликий, вздовж однієї з координатних осей так, щоб поверхня зменшилася. Однак кінцева точність обчислень (чи вимірів - у випадку апаратурної оптимізації), що виключає кроки занадто малої довжини, може зупинити просування вниз по яру. У зв'язку з цим були запропоновані методи оптимізації, засновані на русі по напрямках, не рівнобіжних координатним осям.
Зауваження 4.2. Уважний розгляд рис. 4.6 показує, що краї «сходинок» траєкторії пошуку знаходяться в точках дотику прямих ліній одновимірного пошуку і ліній рівня досліджуваної на екстремум поверхні. Пояснення цього явища таке: якби в точці дотику не відбулася зупинка і рух продовжувався далі уздовж тієї ж прямої в напрямку стрілки, то відбувалися б «перескоки» на лінії все більш високого рівня, що суперечить описаній вище процедурі мінімізації.
Зауваження 4.3. Так як процедура перерізів базується на одновимірній оптимізації, то природно виникає питання: яким з методів, описаних у главі 3, слід користуватися? Відповідь така: тим, що адекватний можливостям дослідника (методом «золотого перерізу», якщо недоступні відомості про похідні цільової функції; методом січних, якщо дані про похідні є в наявності, і т.д.). Дане зауваження зберігає свою силу по відношенню і до інших процедур багатовимірної оптимізації, наприклад,методу найшвидшого спуску (підйому), що буде досліджуватися в наступному параграфі .
Зауваження 4.4. Ітерації в методах багатовимірної оптимізації (зокрема, у методі перерізів) звичайно продовжують доти, доки приріст функції при переході від однієї ітерації до наступної не стане менше якогось наперед заданого числа.
Вивчимо
умови
застосовності методів перерізів
до задачі корекції лінійних спотворень
за допомогою коректора, базисні функції
якого
задовольняють умові ортонормованості
(4.15)
Нагадаємо, що середньоквадратична похибка коригування у випадку коректора з двома регуляторами
де
Припустимо, що канал зв'язку має спотворюючу ФЧХ, але не вносить амплітудно-частотних спотворень, тобто
(4.16)
Підставивши
(4.16) у вираз
для коефіцієнта
і з огляду
на умову ортонормованості
(4.15), виявляємо, що всі
при
дорівнюють
нулю, а при
-
.
Отже, середньоквадратична похибка
приводиться до вигляду
(4.17)
Неважко
перевірити, що рівняння лінії рівня
в цьому випадку є рівнянням кола [30] з
центром у точці, координати якої
дорівнюють
.
(4.18)
Числа (4.18), як випливає з формули (4.13), є координатами мінімуму функції (4.17). Таким чином, лінії рівня поверхні (4.17) можна описати графіком рис. 4.7.
Ми доходимо висновку, що канал зв'язку з довільно великими фазочастотними спотвореннями і постійною АЧХ може бути відкоригований за допомогою, наприклад, гармонічного коректора, що допускає настроювання лише однією ітерацією методу перерізів (див. рис. 4.6,а). Проведені розрахунки й аналіз середньоквадратичної похибки коригування показали, що при наявності спотворень АЧХ лінії рівня (див. рис. 4.6,б) трансформуються в еліпси, чиї головні осі не рівнобіжні осям координат, причому, трохи спрощуючи й округляючи опис ситуації, можна сформулювати наступне твердження: чим більша нерівномірність АЧХ, тим більш витягнутими є еліпси і тем менш ефективне застосування методу перерізів для настроювання ортогонального коректора. Саме така ситуація виникає при корекції гармонічним коректором телефонних каналів, нерівномірність залишкового загасання яких досягає 6...8 дБ.
Підводячи підсумки, можна сказати, що головною перевагою методу перерізів є його простота, у зв'язку з чим цей метод звичайно застосовується тоді, коли процес настроювання коректора автоматизувати неможливо і відшукання мінімуму похибки коригування приходиться робити «ручним» способом.
Рис. 4.7
