Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава V_.doc
Скачиваний:
6
Добавлен:
27.04.2019
Размер:
1.21 Mб
Скачать

Рубежный тестовый контроль

  1. Задачей нелинейного программирования называется задача, в которой

  1. все ограничения, равенства и неравенства, а также и целевая функция являются нелинейными;

  2. хотя бы одно из ограничений или целевая функция являются нелинейными;

  3. ограничения – линейные, а целевая функция – нелинейная;

  4. ограничения нелинейные, а целевая функция – линейная.

  1. Метод нелинейного программирования, в котором используется симплекс – метод, называется

  1. методом допустимых направлений;

  2. алгоритмом нелинейного программирования;

  3. методом линеаризации;

  4. градиентным методом.

  1. Метод нелинейного программирования, в котором применяется метод золотого сечения, называется

    1. методом допустимых направлений;

    2. алгоритмом нелинейного программирования;

    3. методом линеаризации;

    4. методом наискорейшего спуска.

  2. В основе метода отсекающих плоскостей лежит

    1. симплекс метод;

    2. задача линейного программирования;

    3. метод линеаризации;

    4. метод наискорейшего спуска.

Глава VI. Динамическое программирование

Принцип оптимальности Р.Беллмана

Динамическое программирование или динамическое планирование – это сравнительно новый общий метод решения оптимизационных задач. Предложен он Р.Беллманом в 50-х годах прошлого столетия. В основе метода лежит «принцип оптимальности». Этот принцип сформулирован для таких систем, будущее поведение которых полностью определяется их состоянием в настоящем, а также целью управления и не зависит от поведения системы в прошлом.

Принцип оптимальности можно сформулировать так: каждый конечный участок оптимальной траектории является в свою очередь оптимальной траекторией.

Докажем это утверждение.

Допустим, что имеется некоторая оптимальная траектория, которая соединяет две заданные точки А и B на плоскости x0y, рис. 6.1.

П оскольку траектория оптимальная, то на этой траектории достигает своего наилучшего (минимального или максимального) значения некоторый функционал Q. Например, АВ может быть автомобильным шоссе, движение по которому обеспечивает минимум расхода горючего. Особо подчеркнем, что если АВ оптимальная траектория, соединяющая точки А и В, то всякая другая траектория даст более худшее значение функционалу Q.

Выберем некоторую точку С, не совпадающую с А и В. Части траектории до точки С присвоим номер 1, после точки С номер 2. Покажем, что движение из точки С в точку В должно происходить по траектории 2, если при этом оптимизируется функционал Q.

Допустим противное – экстремум функционала на последнем участке достигается не на траектории 2, а на траектории . Тогда на траектории получим значение функционала «лучшее», чем на , а это противоречит исходному допущению, что – оптимальная траектория.

Этот принцип выглядит тривиальным и бедным по своему содержанию. Но это не так. Утверждение «любой участок оптимальной траектории также оптимальная траектория» не верно в общем случае.

Приведем пример. Как известно, бегун на длинной дистанции должен показать минимальное время. Однако на этой дистанции он пробегает отдельные ее отрезки за минимально возможное время, т.е. не в полную силу. Он распределяет свои силы так, чтобы пробежать каждую оставшуюся часть дистанции наилучшим образом.

Определение оптимального решения на основе принципа Беллмана осуществляется в постепенном понятном движении – от конечной цели к начальному состоянию системы.

Метод динамического программирования позволяет решить сложные прикладные задачи. Решение находится численно, однако ценность этих решений не снижается, т.к. применение других известных на настоящее время подходов в большинстве случаев сопряжено с гораздо большей трудоемкостью.

Рассмотрим некоторые прикладные задачи.

Задача о распределении ресурсов

Имеются средства (ресурсы) в объеме S единиц. Здесь для определенности будем считать, что S измеряется в рублях. Эти средства необходимо распределить между m предприятиями . Количество средств , которое достанется каждому предприятию, подлежит определению.

Д ля каждого предприятия известна прибыль, как монотонно возрастающая функция вложения , рис. 6.2.

Зависимости эти могут задаваться таблично.

Найти такие , чтобы суммарная прибыль всех предприятий

б ыла максимальной.

Всю сумму S разобьем на n значений , , рис. 6.3.

Опираясь на принцип оптимальности Беллмана, допустим, что все предприятия кроме последнего предприятия , свое получили и при этом в нашем распоряжении имеется лишь только , единиц ресурса S. Если из суммы S для выделить единиц, то прибыль на рассматриваемом шаге в этом простейшем случае будет равна прибыли предприятия , т.е. величине . Наибольшее значение прибыли

, . (6.1)

Значение из диапазона , которое доставляет максимум функции обозначим как . Так заканчивается первый шаг решения задачи.

На шаге считаем, что предприятия профинансированы, осталось разобраться с предприятиями и (действует принцип Беллмана) при этом нужно распределить ресурс , между этими двумя предприятиями так, чтобы их суммарная прибыль была бы максимальной. Рассмотрим, как будет распределяться ресурс в единиц. Если предприятию отдадим ед., то для останется . Прибыль на этом шаге будет

.

Ее наибольшее значение

, .

Операцию отыскания максимума необходимо проделать для каждого , т.е n раз, и все оптимальные значения и заполнить.

Далее аналогично находятся , и т.д., наконец,

.

Здесь нужно брать только одно S, т.к. запас средств известен. После этого нужно пройти весь путь в обратном направлении, определяя , .

Пример. Пусть , . Все характеристики сведем в таблицу

Таблица 6.1

x

1

0,5

0,1

0,6

0,3

2

1,0

0,5

1,1

0,6

3

1,4

1,2

1,2

1,3

4

2,0

1,8

1,4

1,4

5

2,5

2,5

1,6

1,5

Для простоты взяты целыми. Можно применить и более мелкую разбивку, например, через 0,5. Все зависит от степени дробления ресурса.

Начиная с четвертого шага заполним таблицу 6.2.

Таблица 6.2

i = 4

i = 3

i = 2

i = 1

1

1

0,3

1

0,6

0

0,6

2

2

0,6

2

1,1

0

1,1

3

3

1,3

2

1,4

0

1,4

4

4

1,4

1

1,9

0

1,9

5

5

1,5

2

2,4

5

2,5

4

2,6

При заполнении колонки руководствуемся соображениями: имеет такой характер, что достигает максимума при максимальном, поэтому предприятию отдается все , . На третьем шаге имеем следующую таблицу.

Таблица 6.3

1

0

1

1

0

0

0,6

0,3

0

0,3

0,6

0,6

2

0

1

2

2

1

0

0

0,6

1,1

0,6

0,3

0

0,6

0,9

1,1

1,1

3

0

1

2

3

3

2

1

0

0

0,6

1,1

1,2

1,3

0,6

0,3

0

1,3

1,2

1,4

1,2

1,4

4

0

1

2

3

4

4

3

2

1

0

0,6

1,1

1,2

1,4

1,4

1,3

0,6

0,3

0

1,4

1,9

1,7

1,5

1,4

1,9

5

0

1

2

3

4

5

5

4

3

2

1

0

0

0,6

1,1

1,2

1,4

1,6

1,5

1,4

1,3

0,6

0,3

0

1,5

2,0

2,4

1,8

1,7

1,6

2,4

Жирно выделенные числа таблицы являются оптимальными значениями соответственно для и прибыли на третьем шаге.

По данным первой и последней колонок и заполняется колонка при табл. 6.2. При заполняем таблицу 6.4.

Таблица 6.4

1

0

1

1

0

0

0,1

0,6

0

0,6

0,1

0,6

2

0

1

2

2

1

0

0

0,1

0,5

1,1

0,6

0

1,1

0,7

0,5

1,1

3

0

1

2

3

3

2

1

0

0

0,1

0,5

1,2

1,4

1,1

0,6

0

1,4

1,2

1,1

1,2

1,4

4

0

1

2

3

4

4

3

2

1

0

0

0,1

0,5

1,2

1,8

1,9

1,4

1,1

0,6

0

1,9

1,5

1,6

1,8

1,8

1,9

5

0

1

2

3

4

5

5

4

3

2

1

0

0

0,1

0,5

1,2

1,8

2,5

2,4

1,9

1,4

1,1

0,6

0

2,4

2,0

1,0

2,3

2,4

2,5

2,5

По данным первого и последних столбцов заполняется колонка при табл. 6.2.

При заполняем таблицу 6.5.

Таблица 6.5

5

0

1

2

3

4

5

5

4

3

2

1

0

0

0,5

1,0

1,4

2,0

2,5

2,5

1,9

1,4

1,1

0,6

0

2,5

2,4

2,4

2,5

2,6

2,5

2,6

По первой и последней колонкам заполняется колонка при табл. 6.2.

На первом шаге первому предприятию отдается . Остальным остается .

По табл. 6.2 находим при , т.о. роздано . Осталось распределить . По табл. 6.2 для находим , т.о. израсходовано . Осталось 0 ед, следовательно . Прибыль распределяется так, как указано в табл. 6.6.

Таблица 6.6

m

1

4

2

2

0

0

3

1

0,6

4

0

0

Итого

2,6

Суммарная прибыль составляет 2,6 ед., что и должно быть (см. табл. 6.5) Задача распределения ресурсов может решаться с учетом ограничений на x в , например, .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]