Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Институт информационных технологий БГУИР

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции по курсу.docx

Скачиваний:

107

Добавлен:

24.02.2016

Размер:

2.8 Mб

Скачать

☆

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 5152 / 5552 53 54 55 > Следующая >>>

23.2. Методы нахождения минимума функции одной переменной

Задача нахождения минимума функции одной переменной min/(x) нередко возникает в практических приложениях. Кроме того, многие методы решения задачи минимизации функции многих переменных сводятся к многократному поиску одномерного минимума. Поэтому разработка новых, более эффективных одномерных методов оптимизации продолжается и сейчас, несмотря на кажущуюся простоту задачи.

Примечание. В дальнейшем, если не будет особо оговорено, под минимумом функции будет подразумеваться локальный минимум.

Нахождение минимума функции осуществляется в два этапа:

1. Приближенное определение местоположения минимума.

2. Вычисление точки минимума x_min c заданной точностью s одним из нижеприведенных методов.

На первом этапе, задав некоторую начальную точку x °, спускаются с заданным шагом h в направлении уменьшения функции и устанавливают интервал длиной 2h, на котором находится минимум, из условия f ( x_m - h ) < f ( x_m ) < f ( x_m + h ). Для функции, изображенной на рис. 23.1, если A < x ° < x _g , будет выделен интервал [a,b] с локальным минимумом x _min ₁, а если x_g < x ° < B - с глобальным минимумом x _min ₂, т. е. тот, в области «притяжения» которого оказалась начальная точка x °.

Если на отрезке [a,b] функция f ( x ) унимодальна, т. е. она имеет на этом отрезке единственную точку минимума x _min и слева от этой точки является строго убывающей, а справа - строго возрастающей, то для вычисления точки минимума с заданной точностью могут использоваться нижеприведенные методы:

23.2.1. Метод деления отрезка пополам

Задаются a, b и погрешность s. Вычисляются две точки вблизи середины интервала [a, b]:

x₁ = (a + b - s) / 2, x₂ = (a + b + s) / 2.
Если f ( x ₁ ) > f ( x ₂ ), то a = x ₁, иначе b = x ₂.
Если | b - a | > 2s, тогда повторяем с п.1.

^4. ^{Вычисляем} ^xmin = ⁽^a + ^b)/2, JW = ^f⁽^Xmm ^).

Этот метод прост в реализации, позволяет находить минимум разрывной функции, однако требует большого числа вычислений функции для обеспечения заданной точности.

23.2.2. Метод золотого сечения

Золотое сечение - это такое деление отрезка [a, b] на две неравные части при котором отношение большего отрезка ко всему интервалу равно отношению меньшего отрезка к большему. При этом имеет место следующее соотношение:

^{(b
- x1)/(b -}^a^)
=^(x1^-^a^)/(b
-^x1)^{= 1- £ = 0.618, £ = (3 -}^V^{5)/2
= 0.382.}

О точке, которая расположена на расстоянии £ длины от одного из концов отрезка, говорят, что она осуществляет золотое сечение данного отрезка. Каждый отрезок имеет две такие точки, расположенные симметрично относительно середины. Алгоритм поиска минимума аналогичен вышеописанному методу деления пополам и отличается тем, что вначале точки x₁ и x₂ выби-

раются так, чтобы они осуществляли золотое сечение отрезка, и вычисляются значения функции в этих точках. В последующем, после сокращения интервала путем отбрасывания неблагоприятной крайней точки, на оставшемся отрезке уже имеется точка, делящая его в золотом отношении, ( точка xj на рис. 23.2 ) известно и значение функции в этой точке. Остается лишь выбрать ей симметричную и вычислить значение функции в этой точке для того, чтобы вновь решить, какую из крайних точек отбросить.

f(xi).

Алгоритм метода:

Задаются a, b и погрешность s.

1. Вычисляются две точки

^x1 = а + ^£(b ^- ci\ ^x2 = b ^-£(Ъ ^- ci\ ^yi = ^f ^(хД ^y2 = ^f⁽^x2⁾ ^.

2. Если yj > y2, то a = xj, xj = x2, yi = У2, x₂ = b - £ (b-a); У2 = f(x2), иначе b = x2, x2 = xj, y2 = yi, xj = a + £ (b-a),

Если | b - a\ > 2s, то повторить п.2.
Если yj > y2, то a = xj, иначе b = x2,

^5. ^{Вычисляется} ^x_mm = ^(a + ^b)/2, ^y_mm = ^f ^(x_min^).

^yj ⁼

За одно вычисление функции отрезок, на котором находится x_mi_n,

уменьшается в j-£ =0.62 раза, т.е. быстрее, чем метод деления пополам, в котором за два вычисления функции отрезок уменьшается в 0,5 раза.

23.2.3. Метод Фибоначи

На практике количество вычислений значений функции часто бывает ограничено некоторым числом n ( тем самым ограничено и число шагов вычислений по методу золотого сечения; оно не превышает n-1 ). Метод Фибоначчи отличается от метода золотого сечения лишь выбором первых двух симметричных точек и формул их пересчета и гарантирует более точное приближение к точке x _min за n -1 шаг, чем метод золотого сечения за то же количество шагов. Согласно методу Фибоначи, на нулевом шаге первые две симметричные точки вычисляют по формулам xi⁰ = ао + F n ( bo - ao ) / Fn+2 ,

X2⁰ = bo - F n ( bo - ao ) / Fn+2 = ao + F n + 1 ( bo - ao ) / Fn+2 ,

где F _n , F _n + ₁ , F _n + ₂ - числа Фибоначи , определяемые рекурентной формулой

F _k = F _k - 1 + F k - 2 , k=3, 4, ... ; F 1 = F 2 = 1 Запишем первые десять чисел Фибоначи :

F1 =1, F2 =1, F3 =2, F4 = 3, F5 =5, F6 =8, F₇ =13, F8 =21, F₉ =34, F10

=55.

В последующем, после сокращения интервала путем отбрасывания неблагоприятной крайней точки, одна из точек пересчитывается по одной из соответствующих формул

_k ^x1^k ⁼ ^ak ⁺ ^F n - k ⁽ ^b0 ^- ^a0 ⁾ ^/ ^Fn + 2 ^,^x2^k ⁼ ^ak ⁺ ^F n + 1 - k ⁽ ^b0 ^- ^a0 ⁾ ^/ ^Fn + 2 ^,

Выполняется n - 2 шага, при k = 1, 2, ... , n - 2, после чего отбрасывается крайняя неблагоприятная точка и вычисляется точка минимума x _min = ( a _n _- ₁+ b _n _- ₁) / 2. Погрешность вычисления точки минимума не превышает (b₀ - ao) / (2F _n ₊ ₂), т. е. за три вычисления функции получают точку минимума с погрешностью не превышающей 1 / 10 первоначального интервала , пять вычислений - 1 / 26, восемь - 1 / 110.

_Т lim F_n / F_n+2 = (3 -V5)/2, _б

Т.к. ⁿ ² то, при достаточно больших n, вычисле-

П — GO

ния по методу Фибоначи и золотого сечения начинаются практически из одной и той же пары симметричных точек.

Алгоритм метода:

Задаются a, b, число вычислений функции n.

1. Вычисляются d = ( b-a ) / F_n+₂ и две точки

^x1 = ^a + ^Fn^d^, ^x2 = ^a + ^Fn+1^d^, ^J1 = ^f ⁽^x1 X У2 = ^f ⁽^x2 ⁾ ^.

2. Если yi > y2 , то a = xi, xi = x2, У1 = У2, x2 = a + Fn - k d; У2 =f(x2), иначе b = x2, x2 = xi, У2 = У1, xi = a + Fn - k +1 d, yi =f(xi).

п.2 повторяется n-2 раза, при k = 1, 2, ... , n-2.

3. Если У1 > У2 , то a = xi, иначе b = x2

^4. ^{Вычисляется} ^xmin = ^(a + ^b)/2, JW = ^f ⁽^xmin⁾ ^.

23.2.4. Метод последовательного перебора

Этот метод не требует предварительного определения местоположения точки минимума. Идея метода состоит в том, что, спускаясь из точки x₀ с заданным шагом h в направлении уменьшения функции, устанавливают интервал длиной 2h, на котором находится минимум, который затем последовательно уточняют, повторяя спуск с последней точки, уменьшив шаг и изменив его знак, пока не будет достигнута заданная точность. Алгоритм метода приведен ниже.

Задаются x₀, некоторый шаг h и погрешность s .

1. Вычисляем y_o = f (x_o)

2. Определяем направление убывания функции. Если f (x_o+sh) > y_o, то h = -h.

Из точки x₀ делается шаг x₁=x₀+h и вычисляются y₁ = f (x₁).
Если y₁ < y₀, то x₀ = x₁, y₀ = y₁, и повторить с п.3

5. h = - h / 4. В точке x₁ функция оказалась большей, чем в x₀, следова- тельно, мы перешагнули точку минимума и организуем спуск в обратном на- правлении.

6. Если | h | > s, тогда повторить с п.3

^7. ^xmin = ^xo^, ^fmin = ^f^.

Скорость сходимости данного метода существенно зависит от удачного выбора начального приближения x₀ и шага h. Шаг h следует выбирать как половину оценки расстояния от x₀ до предполагаемого минимума x_mf_n.

23.2.5. Метод квадратичной параболы

Для ускорения спуска к минимуму из некоторой точки x₀ используют локальные свойства функции вблизи этой точки. Так, скорость и направление убывания можно определить по величине и знаку первой производной. Вторая производная характеризует направление выпуклости: если f">0, то функция имеет выпуклость вниз, иначе - вверх. Вблизи локального безусловного минимума дважды дифференцируемая функция всегда выпукла вниз. Поэтому, если вблизи точки минимума функцию аппроксимировать квадратичной параболой, то она будет иметь минимум. Это свойство и используется в методе квадратичной параболы, суть которого в следующем.

Вблизи точки x0 выбираются три точки xj, x2, x3. Вычисляются значения y₁, y₂, y₃. Через эти точки проводится квадратичная парабола

p( x - x₃) + q( x - x₃) + r = pz + qz + r,

z — x x3, z1 — x1 x3, z2 — x2 x3, r — y 3, (23.1)

_p = ⁽^y1 ^- ^y3⁾ ^z2 ^- ⁽^y2 ^- ^y3⁾ ^z1 _q = ⁽^y1 ^- ^y3⁾ ^z2 ^- ⁽^y2 ^- ^y3⁾ ^z1²

^z1^z2^(z1^-z2⁾ ^z1^z2^(z2^-z1⁾

Если p>0, то парабола имеет минимум в точке z_m = -b/(2a). Следовательно, можно аппроксимировать положение минимума функции значением x_m1 = x₃ + z_m и, если точность не достигнута, следующий спуск производить, используя эту новую точку и две предыдущие. Получается последовательность x_m1, x_m₂, x_m₃, ... , сходящаяся к точке x_m.

Алгоритм метода можно записать следующим образом Задается x0, h и s.

1.Выбираем 3 точки: x₁=x_o-h,x₂=x_o-h,x₃=x_o+h, 2. Вычисляем y1 = f (x1), y2 = f (x2), y3 = f (. 3.Проверяем положительность знака второй производной:

h²f'' = y₁ - 2y₂ + y₃ > 0 (см. п. (4.7)), если нет, то начальное приближение

x0 выбрано неудачно (в x0 имеется выпуклость вверх) и следует закончить вычисления с таким сообщением, если да, то переходим к п.4.

4. Вычисляем z, z₁, z₂, p, q, r, z_m по вышеприведенным формулам

(23.1).

5. Переименовываем точки, отбрасывая точку x₁:

6. Проверяем |z_m | < s, если нет, то повторяем с п.4.

^xm = ^x3 + ^zm^, ^ym = ^f ^(xm X ^конец.

Данный метод сходится очень быстро и является одним из наилучших методов спуска. Следует отметить, однако, что вблизи минимума расчет по приведенным здесь формулам для p и q приводит к накоплению погрешности из-за потери значащих цифр при вычитании близких чисел. Поэтому разные авторы предлагают свои эквивалентные формулы, счет по которым более устойчив. Кроме того, в алгоритм вносятся некоторые поправки, позволяющие предусмотреть различные неприятные ситуации - переполнение, деление на 0, уход от корня.

23.2.6. Метод кубической параболы

Данный метод аналогичен предыдущему, но за счет использования аппроксимации кубической параболой имеет более высокую сходимость, если функция допускает простое вычисление производной. При его использовании вблизи точки x0 выбираются две точки xi и x2 (обычно x₁ = x₀), вычисляются

значения функции y₁, y₂ и ее производной D₁ = f(x₁), D₂ = f'(x₂). Затем через эти точки проводится кубическая парабола, коэффициенты которой определяются таким образом, чтобы совпадали значения производных параболы и функции:

p(x - x₂) + q( x - x₂) + r (x - x₂) + s = pz + qz + rz + s = P( z),

z=x-x₂,z₁=x₁-x₂,

P(0) = У2, P(0) = D2, P(z1) = У1, P'(z1) = Д.

Как нетрудно убедиться, коэффициенты параболы вычисляются по следующим формулам: s = У2, r = D2,

^p = ⁽^D1 ^- ^D2 ^- ²⁽^y1 ^- ^y2 ^- ^D2 ■ ^z1^)/z1⁾^z²^,^q = ⁽^D2 ^- ^D1 + ³⁽^y1 ^- ^y2 ^- ^D2 ^ ^z1^)/z1^)/z1^.'

Поэтому приближенное положение минимума можно получить по формуле x_m1=x₂+z_m и, если точность не достигнута, следующий спуск произво-

Известно, что кубическая парабола имеет минимум в точке дить уже из точек x₂, x_m1 (точка x_j отбрасывается). Если подкоренное выражение окажется отрицательным, то спуск следует производить до точки перегиба параболы z_m1 = -q /3p . Следует также убедиться, что в начальной точке

a, D₂ - D _ функция вогнута вниз — -- > o.

Алгоритм метода можно записать следующим образом. Задаются начальное значение x₀, некоторый малый шаг h и s.

Вычисляем x₁ = x_o, D₁ = f'(x₁).
Если D₁ > o, то изменяем знак h (h=-h).
Вычисляем x₂ = x₁ + h, D₂ = f'(x₂).
Если (D₂ - D₁)/ h < o, функция вогнута вверх, тогда x₀ выбрана неудачно и следует закончить вычисления с этим сообщением.
Вычисляем y = f (x1), y2 = f (.
Вычисляем zj, p, q, r, z_m по вышеприведенным формулам.

^7. ^x1 = ^x2^, ^y1 = ^y2^ ^D1 = ^D2^, ^x2 = ^x2 + ^zm^, ^y2 = ^f ⁽^X2^), ^D2 = ^f '^(x).

8. Проверяем |z_m| < s, если нет, тогда повторяем п.6.

^9. ^xm = ^x2 + ^Zm^, ^ym = ^f ⁽^xm ^ ^конец.

Следует отметить, что вблизи точки минимума расчет по приведенным здесь простейшим формулам для p, q не всегда устойчив из-за ошибок округления, поэтому различные авторы рекомендуют использовать несколько преобразованные формулы.

ЛЕКЦИЯ 24. РЕШЕНИЕ ЗАДАЧИ КОШИ ДЛЯ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 5152 / 5552 53 54 55 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.02.20164.99 Mб46КР(заоч)-1.doc
#
24.02.20161.01 Mб14КР1.doc
#
24.02.20163.36 Mб30Лабораторный практикум по СТРПОСУ.doc
#
24.02.2016817.04 Кб40лекции бгуир.pdf
#
24.02.2016790.23 Кб537Лекции для студентов по ВМиС.docx
#
24.02.20162.8 Mб107Лекции по курсу.docx
#
24.02.20162.89 Mб28ЛекцииСАиЦУ_ФКП.pdf
#
24.02.2016433.13 Кб53Лекция по ОС.pdf
#
24.02.20161.37 Mб46Логин, В. М. 8-разряд_микроконтрол_семейства_МС68НС11_фирмы_MOTOROLA_Лаб_работы.pdf
#
24.02.20168.95 Mб246метода ТМ.doc
#
24.02.20162.7 Mб160Метода ЦОС.pdf