Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Северин Методы БМ

.pdf
Скачиваний:
92
Добавлен:
02.02.2015
Размер:
3.8 Mб
Скачать

X G uuT

ssT

 

 

suT usT

uuT .

(sT p)2

 

 

 

 

 

 

sT p

 

 

С учетом (5.7) получим:

 

 

 

 

 

 

 

 

X G (pT s pT u)

 

ssT

 

suT usT

,

(sT p)2

sT p

 

 

 

 

 

 

 

 

T

 

 

 

T

 

T

 

T

 

X G

 

 

p

 

u ss

 

 

su

 

us

.

1

 

 

 

 

 

 

 

 

 

 

 

s

T

 

 

T

 

 

s

T

p

 

 

 

 

p s

 

p

 

 

 

Возвращаясь к исходным обозначениям по равенствам (5.3)–(5.5), получим окончательно модифицированную формулу БФГШ (4.35)

 

 

 

 

 

 

 

 

 

T

 

 

 

T

 

sk (Gk pk )

T

 

T

 

 

 

 

 

 

 

 

 

pk Gk pk sk sk

 

 

Gk pk sk

 

 

 

 

Gk 1

Gk 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

T

 

 

T

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

sk pk

sk pk

 

 

 

 

 

sk pk

 

 

 

 

 

5.5. Дифференцирование функций многих переменных

 

 

 

Пусть функция

f (x)

векторного аргумента

 

x (x , x , , x )T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

n

задана в некоторой области D Rn

и пусть x

0

 

– некоторая точка этой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

области. Функция f (x)

 

называется непрерывной в точке x0 , если для

любого числа 0 существует такое число 0 ,

что из неравенства

 

x x0

 

следует неравенство

 

f (x) f (x0 )

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть функция

f (x)

векторного аргумента

 

x (x , x , , x )T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

n

задана в некоторой области

D Rn

и пусть x

0

– произвольная точка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

этой области. Придадим переменной xi

приращение такое, чтобы

было x

0

e

i

D , где e

 

(0, 0, , 0, 1, 0, , 0)T орт оси Ox

, пред-

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

ставляющий собой вектор с i -той единичной проекцией и остальными нулевыми проекциями. Вычислим разность i f f (x0 ei ) f (x0 )

151

и составим отношение i f . Если существует предел

lim i f

,

0

 

то он называется частной производной функции f (x) по переменной xi в точке x0 и обозначается f (x0 ) xi .

Итак, по определению

f (x0 ) lim

f (x0 ei ) f (x0 )

.

 

xi

0

 

Частные производные вычисляются по обычным правилам и формулам дифференцирования, причем при вычислении f xi диф-

ференцирование ведется по переменной xi , а остальные переменные считаются неизменными.

Частные производные функции двух переменных f (x1, x2 ) геометрически представляют собой тангенсы углов наклона касательных к сечениям графика этой функции плоскостями x1 C и x2 C .

Если для функции f (x) в точке x0 существуют все частные производные первого порядка, то она называется дифференцируемой в

точке x0 . Если функция

f (x) дифференцируема в точке x0 , то она и

непрерывна в этой точке.

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть функция f (x)

является

 

дифференцируемой

при всех

x Rn . Тогда она называется гладкой.

 

 

 

 

 

 

 

Вектор-столбец частных производных функции f (x)

в точке x0

называется градиентом и обозначается

 

 

 

 

 

 

 

f (x

 

)

f (x

 

)

,

f (x

 

)

, ...,

f (x

 

) T

 

0

 

 

0

 

 

0

 

 

0

.

 

 

 

 

x1

 

 

x2

 

 

xn

 

 

 

 

 

 

 

 

 

 

 

 

Символ «набла» служит для обозначения оператора градиента

152

( x1 , x2 , , xn )T . Градиент также обозначается через g(x)

. Вектор градиента определяет направление наиболее быстрого возрастания функции в данной точке.

Поскольку по определению градиента xi ei , то

xT (x1, x2, , xn ) (e1, e2, ...,en ) E .

Если векторы-столбцы u и v зависят от x , то по правилу производной произведения функций

(uT v) (uT )v (vT )u .

Пусть функция f (x) имеет частные производные f xi , i 1, n . Предположим, что эти частные производные в свою очередь диффе-

ренцируемы по всем переменным. Тогда, дифференцируя f

xi

по

xi , получим частную производную второго порядка функции

f (x)

по

переменной x

i

. Она обозначается 2 f

x2 .

 

 

 

 

i

 

 

Дифференцируя f xi по другой переменной x j , получим сме-

шанную частную производную второго порядка, которая обозначается

 

 

 

 

 

 

 

 

 

f 2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

j

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

Т е о р е м а Ш в а р ц а .

Пусть функция f (x) имеет в точке x0

и в некоторой ее окрестности частные производные

 

f

 

,

 

f

 

,

 

 

 

 

f 2

 

,

 

 

 

f 2

 

.

 

x

 

 

x

 

 

 

x

j

x

 

 

x x

 

 

 

i

 

 

j

 

 

 

 

 

 

 

i

 

 

 

i

j

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f 2 (x

0

)

 

f

2 (x

0

)

.

 

 

 

 

 

 

 

x j xi

 

 

 

 

 

xi x j

 

 

 

 

 

153

Пусть функция f (x) является дважды дифференцируемой по всем переменным. Тогда для такой функции можно составить матрицу вторых частных производных, которая называется матрицей Гессе

 

2 f (x)

 

 

 

x12

 

2 f (x)

 

 

2 f (x)

x2 x1

 

 

 

2 f (x)

 

 

xn x1

 

В силу теоремы Шварца

 

2 f (x)

2 f (x)

x x

 

 

x x

 

 

 

 

 

 

 

21

2

 

 

2

1

n

 

f (x)

 

f (x)

 

 

 

 

 

 

 

 

.

 

x22

 

x2 xn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 f (x)

 

 

 

 

2 f (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn x2

 

 

2

 

 

xn

 

 

2 f (x)

 

2 f (x)

 

 

 

 

 

 

,

i, j 1, n ,

i j .

x x

 

x

 

x

j

 

j

 

 

 

 

 

i

 

 

i

 

 

 

 

 

Поэтому матрица Гессе является симметрической матрицей и для нее

2 f (x)T 2 f (x) .

Матрица Гессе также обозначается как H(x) .

5.6. Формула Тейлора

Пусть функция f (x) скалярного действительного аргумента x R в любой точке x0 n раз дифференцируема. Тогда для нее справедлива формула Тейлора

f (x h) f (x) f (x)h 21! f (x)h2 n1! f (n) (x)hn o(hn ) ,

где h – приращение аргумента, o(hn ) – бесконечно малая более вы-

сокого порядка, чем hn , называемая остаточным членом формулы

154

Тейлора в форме Пеано.

Пусть теперь функция f (x) векторного аргумента x Rn в любой точке дважды дифференцируема. Тогда для нее формула Тейлора

 

n

f (x)

 

 

1

 

n n

2 f (x)

 

 

 

 

 

 

2

f (x h) f (x)

 

x

h

 

2!

x x

h h

j

o(

 

h

 

) ,

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

i

 

 

 

 

 

 

i 1

i

 

 

 

 

i 1 j 1

i j

 

 

 

 

 

 

 

где h (h1, h2 , , hn )T – векторное приращение аргумента. Эту формулу можно представить в векторном виде

f (x h) f (x) f (x)T h 21!hT 2 f (x)h o( h 2 ) ,

где f (x) и 2 f (x) – градиент и матрица Гессе функции f (x) соответственно.

5.7. Квадратичные формы

 

 

 

 

Функция n переменных f (x1, x2 , , xn )

называется квадратич-

ной формой, если

 

 

 

 

n

n

 

 

 

f (x1, x2 , , xn ) aij xi x j .

 

 

i 1

j 1

 

 

 

Вводя обозначения для вектора переменных

x (x , x , , x )T

и

 

 

1 2

n

 

квадратной матрицы A с элементами aij , квадратичную форму можно

представить в виде

f (x) xT Ax .

Без потери общности матрицу A можно всегда предполагать симметрической. В противном случае A следует заменить симметрической

матрицей (A AT )2 , значения квадратичной формы при этом не изменятся.

155

Симметрическая матрица A называется неотрицательно определенной, если xT Ax 0 для всех x Rn . При этом пишут A 0 .

Симметрическая матрица A называется положительно определенной, если xT Ax 0 для всех x 0 . При этом пишут A 0 .

Симметрическая матрица A называется неположительно определенной, если xT Ax 0 для всех x Rn . При этом пишут A 0 . Матрица A неположительно определенная тогда и только тогда, когдаA есть неотрицательно определенная матрица.

Симметрическая матрица A называется отрицательно определенной, если xT Ax 0 для всех x 0 . При этом пишут A 0 . Матрица A отрицательно определенная тогда и только тогда, когда A – положительно определенная матрица.

Симметрическая матрица A называется неопределенной, если квадратичная форма xT Ax может принимать как положительные, так и отрицательные значения.

Для установления положительной определенности матрицы A составим из ее элементов определители

a ,

 

 

 

 

a11

a12

 

 

 

 

a11

a12

a13

 

 

 

 

 

 

2

 

,

3

a

a

a

, …,

1

11

 

 

 

a21

a22

 

 

 

21

22

22

 

 

 

 

 

 

 

 

 

 

 

a31

a32

a33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11

a12

a1n

 

 

 

 

 

 

 

n

a21

a22

a2n

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

an1 an2 ann

Очевидно, det A n . Определители 1 , 2 , 3 , …, n 1 называют-

ся главными диагональными минорами матрицы A .

К р и т е р и й С и л ь в е с т р а – Я к о б и . Для того, чтобы квад-

ратная симметрическая матрица была положительно определенной,

156

необходимо и достаточно, чтобы все ее главные диагональные миноры, включая и определитель матрицы, были положительными.

Таким образом, если для матрицы A имеем 1 0 , 2 0 ,3 0 , …, n 1 0 , n 0 , то A – положительно определенная матрица. Все диагональные элементы положительно определенной матрицы должны быть положительными.

Чтобы установить, что матрица является отрицательно определенной, следует умножить ее на 1 и проверить полученную матрицу на положительную определенность. Тогда из критерия СильвестраЯкоби следует, что для того, чтобы матрица была отрицательно определенной, необходимо и достаточно, чтобы знаки ее главных диагональных миноров, включая и определитель этой матрицы, чередовались, начиная со знака «–». То есть, если 1 0 , 2 0 , 3 0 , …,

( 1)n n 0 , то A – отрицательно определенная матрица. Все диагональные элементы отрицательно определенной матрицы должны быть отрицательными.

При проверке матрицы на неотрицательную определенность достаточно установить, что все ее диагональные элементы и все главные диагональные миноры, включая определитель матрицы, неотрицательны.

При проверке матрицы на неположительную определенность достаточно установить, что все ее диагональные элементы и все главные диагональные миноры, включая определитель матрицы, неположительные.

При проверке матрицы на неопределенность достаточно убедиться в том, что, по крайней мере, два из ее диагональных элементов имеют разные знаки.

157

СПИСОК ЛИТЕРАТУРЫ

1. Аттетков А.В. Методы оптимизации : учебник для вузов / А. В. Аттетков, С.В. Галкин, В.С Зарубин ; под ред. В.С. Зарубина, А.П. Крищенко. – М. : Изд-во МГТУ им. Н.Э. Баумана, 2003. – 440 с.

2.Банди Б. Методы оптимизации. Вводный курс / Б. Банди ; пер. с англ. О.В. Шихеевой. – М. : Радио и связь, 1988. – 128 с.

3.Бейко И.В. Методы и алгоритмы решения задач оптимизации / И.В. Бейко, Б.Н. Бублик, П.Н. Зинько. – К. : Вища школа, 1983. – 512 с.

4.Воробьев Н.Н. Числа Фибоначчи / Н.Н. Воробьев. – 4-е изд., доп. – М. : Наука. Гл. ред. физ.-мат. лит., 1978. – 142 с.

5. Гилл Ф. Практическая оптимизация / Ф. Гилл, У. Мюррей, М. Райт ; пер. с англ. В.Ю. Лебедева. – М. : Мир, 1985. – 512 с.

6.Дэннис Д. Численные методы безусловной оптимизации и решения нелинейных уравнений / Д. Дэннис, Р. Шнабель ; пер. с англ. О.П. Бурдакова – М. : Мир, 1988. – 440 с.

7.Измаилов А.Ф. Численные методы оптимизации : учеб. пособ. / А.Ф. Измаилов, М.В. Солодов. – М. : ФИЗМАТЛИТ, 2005. – 304 с.

8. Карманов В.Г. Математическое программирование / В.Г. Карманов. – 2-е изд., перераб. и доп. – М. : Наука. Гл. ред. физ.-

мат. лит., 1980. – 256 с.

9.Короп В.Ф. Принцип равномерного вклада и регулирование шагов покоординатного случайного поиска / В.Ф. Короп // Численные методы нелинейного программирования. – К. : Наук. думка. – 1976. –

С. 33–41.

10.Мину М. Математическое программирование. Теория и алгоритмы / М. Мину ; пер. с фр. А.И. Штерна. – М. : Наука. Гл. ред. физ.-

мат. лит., 1990. – 488 с.

11.Полак Д. Численные методы оптимизации. Единый подход / Д. Полак ; пер. с англ. Ф.И. Ерешко. – М. : Мир, 1974. – 376 с.

12.Пантелеев А. В. Методы оптимизации в примерах и задачах :

158

учеб. пособ. / А. В. Пантелеев, Т.А. Летова. – М. : Высш. шк., 2002. –

544с.

13.Раскин Л.Г. Математическое программирование : учебнометод. пособ. / Л.Г. Раскин. – Харьков : ПП «ГЕММА», 1986. – 68 с.

14.Реклейтис Г. Оптимизация в технике : в 2 кн. / Г. Реклейтис,

А. Рейвиндран, К. Рэгсдел. Кн. 1 ; пер. с англ. В.Я. Алтаева, В.И. Моторина. – М. : Мир, 1986. – 349 с.

15.Северин В.П. Методы одномерного поиска : учебно-метод. пособ. по курсу «Методы оптимизации» / В.П. Северин. – Х. : НТУ

«ХПИ», 2012. – 112 с.

16.Струченков В.И. Методы оптимизации. Основы теории, зада-

чи, обучающие компьютерные программы : учеб. пособ. / В.И. Струченков. – М. : Экзамен, 2005. – 256 с.

17.Сухарев А.Г. Курс методов оптимизации : учеб. пособ. / А.Г. Сухарев, А.В. Тимохов, В.В. Федоров. – 2-е изд. – М. : ФИЗМАТ-

ЛИТ, 2005. – 368 с.

18.Форсайт Д. Машинные методы математических вычислений / Д. Форсайт, М. Малькольм, К. Моулер ; пер. с англ. Х.Д. Икрамова. –

М. : Мир, 1980. – 280 с.

19.Химмельблау Д. Прикладное нелинейное программирование / Д. Химмельблау ; пер. с англ. И.М. Быховской, Б.Т. Вавилова. – М. :

Мир, 1975. – 536 с.

20.Fletcher R. Practical methods of optimization / R. Fletcher. – 2-d edition. – UK, Chichester : John Wiley & Sons Ltd, 2000. – 436 p.

21. Luenberger D. G. Linear and nonlinear programming / D.G. Luenberger, Y. Yinyu. – 3-d edition. – USA, New York : Springer, 2008. – 546 р.

22.Bazaraa M.S. Nonlinear programming : theory and algorithms / M.S. Bazaraa, H.D. Sherali, C.M. Shetty. – 3-d edition. – USA, Hoboken, New Jersey : John Wiley & Sons Inc., 2006. – 853 р.

23.Sun W. Optimization theory and methods. Nonlinear programming

/W. Sun, Y. X. Yuan. – USA, New York: Springer, 2006. – 687 р.

159

Навчальне видання

СЕВЕРИН Валерій Петрович

МЕТОДИ БАГАТОВИМІРНОЇ БЕЗУМОВНОЇ МІНІМІЗАЦІЇ

Навчальний посібник з курсу «Методи оптимізації»

для студентів напрямків 6.040302 «Інформатика», 6.040303 «Системний аналіз»

Російською мовою

Роботу до видання рекомендував М. І. Безменов В авторській редакції

План 2013 р., п. 2

Підп. до друку 20.04.2013 р. Формат 60×84 1/16. Папір офісний. Riso-друк. Гарнітура Таймс. Ум. друк. арк. 9,3. Наклад 100 прим.

Зам. № 126. Ціна договірна.

____________________________________________________________________

Видавець і виготовлювач Видавничий центр НТУ «ХПІ» вул. Фрунзе, 21, м. Харків-2, 61002

Свідоцтво суб’єкта видавничої справи ДК № 3657 від 24.12.2009 р.