книги из ГПНТБ / Голенко Д.И. Статистические модели в управлении производством
.pdfАлгоритмы 1 и 2 были опробованы нанескольких те стовых задачах размеров 10X50, 10X30, 20X20, а ре зультаты сравнивались с методом Монте-Карло. Экспе римент, описанный в работе [2. 14], показал, что алгоритм
1 дает значение F, удовлетворяющее |
неравенству |
F<Fl + 0,\3(F2-Fl) |
, |
где Fi и F2 — соответственно минимальное и максималь ное значения Fi, достигнутые случайным поиском за 1500—2500 реализаций.
В большинстве испытанных вариантов алгоритм 2 за 500 реализаций выдавал значение F, которое не было до стигнуто случайным поиском за 3000 реализаций. Наря ду с алгоритмом 2 проводились эксперименты с некото рыми его модификациями, которые заключаются в спо собе (этап 4) получения матрицы R.
Так, например, были опробованы варианты с
которые в среднем оказались менее эффективны. Несколько иная идея просмотра окрестности оптиму
ма задачи минимизации математического ожидания ре ализована в алгоритме 3, который так же, как и алго ритм 2, является стохастическим. Будучи опробован на нескольких тестовых задачах, он показал более хорошие
результаты, |
чем алгоритм |
2 на начальном этапе |
поиска, |
|||||||||||
и более |
медленную |
сходимость |
при |
увеличении |
числа |
|||||||||
реализаций. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Первые три этапа |
алгоритма 3 совпадают с соответст |
|||||||||||||
вующими |
этапами алгоритма 2, дальнейшие вычисления |
|||||||||||||
заключаются в следующем: |
|
|
перестановку |
Л |
||||||||||
Этап |
4. |
|
Генерируем |
|
случайную |
л — |
||||||||
|
|
|
|
|
|
|
|
|
|
Л |
|
|
|
|
= (t"i, i 2 , |
i n |
) |
- Определяем |
по я, используя матрицу Т, |
||||||||||
перестановку |
я = ( / ь |
/г, • • •, |
in) |
следующим |
образом: |
|||||||||
1) среди элементов г'гй строки матрицы Т находим |
мини |
|||||||||||||
мальный |
элемент |
U>jа |
|
вместо |
thJ: |
(k=l,2,..., |
|
п) |
за |
|||||
писываем |
числа, |
равные |
«машинной бесконечности», |
|||||||||||
/і — первый |
|
элемент |
я; |
2) среди элементов і2-й |
|
строки |
||||||||
матрицы |
Т |
определяем |
минимальный |
элемент |
ti3j,, |
а |
||||||||
вместо thj |
(k=l, |
2 , . . . , п) |
записываем |
числа, равные |
«ма |
|||||||||
шинной бесконечности». Тогда \ 2 |
есть второй элемент це^ |
|||||||||||||
рестановки |
л, |
|
|
|
|
|
|
|
|
|
|
|
Аналогичным |
образом определяем |
последовательно |
элементы /з, /4, • • •, In |
|
|
dian 5. Этап |
5 полностью совпадает |
с этапом (п + 5) |
в алгоритме 2. Вычисления заканчиваются после опреде
ленного числа |
реализаций. |
|
§ 2. 8. Рандомизированные правила |
||
предпочтения |
в условиях мелкосерийного |
производства |
В предыдущих параграфах настоящей главы были |
||
рассмотрены |
наиболее представительные |
стандартные |
модели календарного планирования и описаны методы оптимизации календарных планов с помощью таких мо делей. Последующий материал посвящен вопросам по строения и исследования имитационных моделей более общего вида для конкретных объектов управления. Рас смотрим методы построения моделей мелкосерийного производства на достаточно простом примере, который может быть положен в основу создания более сложных имитационных моделей общего вида, — на примере вы бора и обоснования метода формирования очереди дета лей к станку. Формализация процесса выбора одной де тали из множества деталей, претендующих в данный мо мент времени на обработку, осуществляется на основе правил предпочтения, которые являются функциями не которых параметров системы. Числовые значения этих функций называются приоритетами. В случае возникно вения конфликтной ситуации при назначении деталей на обработку для всех деталей, стоящих в очереди, вы числяются приоритеты и деталь с максимальным прио ритетом ставится на обработку.
В последнее время получили распространение рандо мизированные правила формирования очереди, смысл которых заключается в том, что детали из очереди наз начаются на обработку случайно с вероятностями, про порциональными вычисленным приоритетам. Описанные принципы формирования очереди называют обычно ло кальными правилами предпочтения, имея в виду их эв ристическую основу и несогласованность с «глобаль ным» критерием оптимального функционирования систе мы в целом.
Задача определения оптимального (в смысле согла сованности с глобальным критерием) приоритета свя зана с большой сложностью аналитического исследова-
ния производственных систем. Тем не менее выбор луч шего из некоторого множества заданных для конкрет ной производственной системы (либо типовой структуры производственной системы) приоритетов сравнительно просто осуществить с помощью имитационной модели. Для этого необходимо проиграть на модели производст венный процесс с каждым приоритетом поочередно, вы числяя при этом значение f-целевой функции системы в целом. Естественно, что лучшим на испытанном множе стве будет приоритет, при котором достигается опти мальное значение /. Чем шире и представительнее мно
жество |
испытанных |
приоритетов, |
тем |
более |
надежен |
||
отобранный из этого |
множества |
приоритет. |
|
||||
В § 2. 3 нами были описаны два решающих |
правила |
||||||
SIO и |
LRT, |
нередко |
используемых |
при |
формировании |
||
расписаний |
запуска |
изделий в |
случае |
возникновения |
конфликтных ситуаций в момент наступления сущест
венных состояний |
системы. |
|
|
|
||
Рассмотрим другие правила предпочтения, подобные |
||||||
описанным выше. |
|
|
|
|
|
|
Правило |
1. Правило |
SIO |
+ LRT ожидание |
напряжен |
||
ной детали. |
|
|
|
|
|
|
Из множества |
решений, |
которые |
можно |
принять |
||
в некоторый |
момент Тк, |
принимается |
то, которому со |
ответствует минимальное изменение нижней оценки цик ла. Эта оценка строится по сумме времени оставшихся операций. Приближенность метода состоит в том, что оценка цикла, прогнозируемая после принятия каждого решения, принимается за истинную величину цикла, в результате чего движение происходит лишь по одной ветви дерева решений и не запоминаются другие ветви. Остановимся подробнее на реализации правила пред почтения.
В любой момент Тк освобождения станка г выявляет ся «напряженная» деталь, у которой суммарное время оставшихся операций (оставшееся время начатой опера ции в сумму не включается) максимально. Расписание обработки оставшихся операций «напряженной» детали в сильной степени влияет на величину цикла. Если «нап ряженная» деталь стоит в очереди к станку г, то ее за пуск призводится в момент Тк. Если она еще не постав лена в очередь, то вычисляется оставшееся время tnr выполнения операций напряженной детали до опера-
ции, соответствующей станку г, и сравнивается со вре
менем |
tij кратчайшей |
операции |
деталей, стоящих в оче |
|||||||
реди к |
станку |
г. |
Если t i } ^ t H . |
, то |
станок |
простаивает |
||||
до |
момента |
TK |
+ tnr |
. |
Если tij<:tllr |
, |
то на |
станок г |
за |
|
пускается деталь |
di. |
|
|
|
|
|
||||
|
Правила |
2 |
и 3. Правила приоритетов SIO |
и LRT |
бы |
|||||
ли |
рассмотрены |
выше. |
|
|
|
|
||||
|
Правило |
4. |
Правило попарного сравнения R. |
|
||||||
|
Для любых |
двух |
деталей di |
и dK, |
претендующих |
на |
обработку на освободившемся станке /, обозначим сим
волами |
OjS |
и |
О к і |
очередные операции, |
а |
символами |
|||||||||||
O i s + i |
|
Oimi |
, |
0Kt+\ |
|
0„mK |
оставшиеся |
|
операции |
||||||||
деталей d{ и dK, |
соответственно. |
|
|
|
|
|
|
|
|||||||||
|
Пусть |
Us, tKt |
|
— время выполнения |
операций |
Ot s , |
0Kt, |
||||||||||
a |
Tt-g, rKt |
— соответственно |
всех |
оставшихся |
|
операций |
|||||||||||
деталей di и dK. |
|
Имеются |
два |
возможных |
способа |
за |
|||||||||||
пуска |
деталей: |
1) |
сначала |
di, |
потом |
dK; 2) сначала |
dK, |
||||||||||
потом |
di. Для |
первого |
способа |
необходимо |
вычислить |
||||||||||||
величину |
F |
(I) =tis |
+ max[xiS; |
tKt+xKt], |
|
а для |
второго — |
||||||||||
F |
(II) =^K< + max |
[тк ь' tiS+Xis]. |
Будем |
говорить, |
что пер |
||||||||||||
вый способ |
предпочтительнее, если выполняется |
условие |
|||||||||||||||
F |
(I) |
< |
F ( I I ) . Произведя |
попарное |
сравнение |
деталей, |
|||||||||||
претендующих |
на обработку, можно выявить деталь с |
||||||||||||||||
наибольшим |
приоритетом. |
|
|
|
|
|
|
|
|
|
|||||||
|
Следующие два правила являются комбинированными. |
||||||||||||||||
|
Правило |
5. |
|
Правило |
кратчайшей |
операции+ про- |
|||||||||||
пуск «напряженной» детали. |
|
|
|
|
|
|
|
|
|||||||||
|
На |
освободившийся |
станок |
первой |
запускается |
«на |
пряженная» деталь, если она претендует на обработку; если же нет, то на обработку запускается деталь по правилу кратчайшей операции. Деталь назовем «напря женной», если суммарное время оставшихся невыпол ненными операций (оставшееся время начавшейся опе
рации в |
сумму |
не |
включается) |
максимально. |
Другими |
||||||
словами, |
если |
в момент |
времени |
t |
детали |
d*, |
, |
dir |
|||
выполнили операции О*, ^ |
Oir |
j r и еще не приступили |
|||||||||
к выполнению очередной, а детали d i r + 1 , |
|
din |
еще вы |
||||||||
полняют |
операции |
Oir_l_1 j r |
+ v |
Oin |
j n |
, |
то деталь |
dis |
|||
считается |
напряженной |
в |
том |
случае, |
если |
т,^ (t) |
= |
||||
*=maxnK |
(t), |
где xik |
|
ті'к |
tilci. |
|
|
|
|
|
|
("0=2 |
|
|
|
|
|
||||||
ft |
|
|
|
|
]=/р +i |
|
|
|
|
|
Правило |
6. Правило |
попарного |
сравнения |
-(-про |
|||||
пуск «напряженной» |
детали. |
|
|
|
|
|
|
||
На освободившийся станок первой запускается |
«на |
||||||||
пряженная» |
деталь, |
если |
она |
претендует |
на |
обработку; |
|||
в противном случае |
деталь |
выбирается |
по |
правилу R. |
|||||
Экспериментальная |
проверка |
каждого |
из |
описанных |
|||||
выше правил производилась |
[2.16] на модельных зада |
||||||||
чах единичного и мелкосерийного |
производства |
с |
раз |
||||||
мерностью |
6X6, 1 0 X 1 0 , |
20X20, 50X20, |
70x20, |
100X20 |
запуска п деталей с различными технологическими марш рутами, причем каждая деталь проходила обработку на т различных станках.
Ограничения по срокам выпуска каждой детали и об щему времени работы станка не рассматривались. Ис
ходная информация задав-алась |
матрицей М=\\(пц, |
іц)\\^ |
||
где riij — номер |
станка, на котором |
должйа выполняться |
||
/-я по порядку |
операция детали |
d^ |
іц — соответствующее |
время обработки, причем подготовительно-заключитель ное время включалось в операционное время. Технологи
ческий |
маршрут детали di разыгрывался для матрицы |
||
М как |
случайная перестановка щ=(іі,..., |
in) |
чисел |
\,...,п; |
время обработки tij моделировалось |
как |
случай |
ная величина, равномерно распределенная на числах 1 —
10 для задачи 6X6, |
и на числах 1 —100 для всех |
осталь |
ных задач. |
|
|
Моделирование |
производилось с помощью |
универ |
сального имитатора, позволяющего реализовать прак тически любое из исследуемых правил предпочтения, включая метод слепого поиска, и случайную комбинацию рандомизированных правил предпочтения. Универсаль ность достигалась путем введения сменного оператора 6, осуществляющего некоторый закон принятия одного из решений В МОМеНТ 7ft.
Описываемый ниже имитатор состоит из следующих операторов.
Оператор 1. Формирование нулевого шага s = 0, мо
мента изменения состояний Г° = 0, T°j = 0. |
|
|
Оператор 2. |
Формирование очереди Mj |
перед станком |
/ для / = 1 , . . . , |
m путем просмотра массива |
исходной ин |
формации. |
|
|
Оператор 3. |
Просмотр очереди М\ перед станком 1. |
|
Оператор 4. Проверка условия Tf>Ts |
для станка /, |
•Ж
которое определяет, работает |
станок / или нет. Если да, |
|||
то переход к следующему станку (оператор 10). |
|
|||
Оператор 5. |
Проверка наличия очереди Mj деталей |
|||
перед станком /. |
Если |
очереди |
нет, т. е. Mj = 0, то |
пере |
ход к оператору |
8. |
|
|
|
Оператор 6. |
Блок |
выбора |
детали d{ из очереди |
Mj |
для обработки на станке /. Этот блок меняется в зависи мости от применяемого метода.
Оператор |
7. Вычисление |
Tjs=Ts + |
ti)— момента |
ос |
вобождения |
станка / после |
окончания |
обработки |
дета |
ли di. |
|
|
|
|
Оператор 8. Счетчик k результатов «1» оператора 5 вычисляет число станков, перед которыми отсутствуют очереди деталей.
Оператор 9. Проверка условия k<m, которое выяв ляет наличие деталеопераций, готовых к обработке. Если условие не выполняется, то переход к оператору 14 и окончание работы имитатора.
Оператор 10. Переход к следующему станку у.
Оператор П . Проверка условия j<m, |
определяюще |
|
го, все ли |
станки просмотрены. Если }<т, |
то переход к |
оператору |
4. |
|
Оператор 12. Переход к очередному моменту измене ния существенных состояний.
Оператор 13. Вычисление этого момента ТА по фор муле
Г"= т і п Г »
Оператор 14. Конец программы имитации. Операторная схема имитатора имеет следующий вид:
F\ 1 3 Ф 2 F3 " Р 4 + 1 ° * V 8 |
Ф е А]0 |
|
5Ks |
і У и 4 ^іо Pu Fn A]3 Яц • |
|
Результаты |
экспериментальных |
исследований по ре |
ализации правил 1—6 приведены в табл. 2.8.1. Результаты, представленные в табл. 2.8.1, указывают
на предпочтительность использования правила 1 прак тически для всех задач. Аналогичные результаты были получены при сравнении этого правила с двумя стати стическими методами оптимизации расписаний: методом статистических испытаний (слепой поиск) и случайным
|
|
|
|
|
|
|
Т а б л и ц а |
2.8.1 |
|
|
Размерность |
техно- |
|
|
Величина |
цикла |
|
|
|
^ ~ ~ ~ - ~ ^ . ; і о г и ч е с к о й |
матрицы |
|
|
|
|
|
|
||
|
Правило |
|
|
6 X 6 |
10X10 |
10X20 |
50X20 |
70X20 |
100X20 |
|
|
|
|
|
|
|
|
|
|
1. |
SIO + LRT+ |
ожидание |
|
1040 |
1672 |
3332 |
4021 |
5479 |
|
|
напряженной |
детали |
57 |
||||||
2. |
5/ 0 |
|
|
88 |
1074 |
1864 |
3441 |
4610 |
5944 |
3. LRT |
|
|
61 |
1108 |
1823 |
3193 |
4153 |
5694 |
|
4. |
R |
|
|
60 |
1103 |
1831 |
3165 |
4031 |
5622 |
5. |
5 / 0 + пропуск |
напряжен |
|
— |
|
|
|
|
|
|
ной детали |
|
|
58 |
1752 |
3129 |
4221 |
5780 |
|
6. /?+пропуск напряженной |
56 |
— |
1844 |
|
4050 |
5624 |
|||
|
детали |
|
|
3082 |
чередованием рандомизированных правил предпочтения (случайное переключение правил SIO и LRT). Послед ний метод представляет известный интерес для оптими зации календарных планов, поэтому остановимся на воп росах использования таких методов.
Рассмотрим процесс поиска оптимального рандомизи рованного правила предпочтения с использованием само обучения и без него. В целях отыскания оптимального расписания рассмотрим способ применения рандомизи рованных правил предпочтения, состоящий в том, что в каждый момент t возникновения конфликтной ситуации для ее разрешения случайно с вероятностью pr' (t) из совокупности решающих правил R выбирается некоторое правило г'. При этом имеет место соотношение ~Zpr{t) = 1.
В результате одного проигрывания процедуры разре шения конфликтов получаем комбинацию правил, кото рой соответствует определенное расписание А{.
После iV-кратного проигрывания получается расписа ние А: К(А) =minK(Ai), которое принимаем за решение задачи. Если вероятности pr(t) не зависят от і, то мы имеем дело с ненаправленным поиском. Недостаток та кого применения правил состоит в том, что предыдущая информация никак не влияет на выбор очередного пра вила. Если же предыдущая информация учитывается при перестройке вероятностей pr(t) таким образом, что в ито ге вероятность появления хорошей комбинации увеличи вается или плохой уменьшается, то при этом получается
направленный случайный поиск наилучшей комбинации. Использование этих методов для решения задачи кален дарного планирования начато лишь в последнее время.
Рассмотрим общую схему процесса обучения, которая заключается в следующем.
Определим набор признаков бь . . . , 6S, таких, что для каждой комбинации правил и каждого признака воз можны только 2 случая:
1)комбинация правил имеет признаки;
2)комбинация правил не имеет признака б. Обозначим через Q (б) множество комбинаций, имею
щих |
признак |
6; через Фб(*) —функцию распределения |
||
значений К(А) |
на множестве Q(б); |
через |
F(x)—фун |
|
кцию |
распределения значений К (А) |
при A^D. |
Зададим |
некоторый уровень доверия а. Тогда признак б является
существенным |
признаком хорошей комбинации (распи |
||
сания) в том |
случае, если F~l(a) |
^Ф&~1(а). |
Если б явля |
ется существенным признаком |
«хорошей» |
комбинации, |
то разумно увеличивать вероятность появления комбина ций, имеющих признак б. Методы с самообучением, ис пользуя накопленную информацию о «хороших» комби нациях, выявляют признаки б и перераспределяют соот ветствующим образом вероятности.
В качестве признака |
6V при использовании рандоми |
|||
зированного правила на |
базе LRT |
и SIO |
может |
служить, |
например, число использования |
правила |
SIO |
в первых |
|
/ шагах. После N испытаний можно с определенным до |
||||
верием отнести этот признак к |
разряду |
существенных |
или несущественных для «хорошей» комбинации. Оста новимся на применении рандомизированных правил без самообучения и с самообучением в задачах календарно го планирования.
Рандомизированное правило приоритетов, называе мое также процессом несмещенного случайного отбора,
может быть |
образовано из двух правил 5/0 и LRT [2.5] |
и применено |
для решения задачи планирования запуска |
п изделий, имеющих различные технологические марш руты, на т станках. В общем случае необходимо принять
пхт решений для |
составления |
расписания. Число |
раз |
|
личных вариантов |
расписаний |
имеет порядок |
2пХт. |
В |
принципе эта рандомизация может использовать |
не |
два, |
а несколько правил. Многократное проигрывание рандо мизированного правила с одинаковыми вероятностями
применения правил L R T и SIO показало его эффектив ность по сравнению с использованием лучшего из этих правил.
Так, |
50-кратное проигрывание рандомизированного |
||
правила |
с одинаковыми вероятностями для |
правил |
SIO |
и L R T при решении задач различного объема |
(6x6, |
10Х |
ХІ0, 20X5) дает улучшение плана примерно на 10% по циклу по сравнению с использованием лучшего из этих правил.
Метод использования рандомизированных правил с обучением можно рассматривать как случайный поиск в пространстве комбинаций с постоянным изменением плотности распределения вероятностей до тех пор, пока вся вероятность не сосредоточится на хорошем плане [2.3]. Эффективность обучения зависит от того, насколь ко близость последовательностей планов приводит к бли зости продолжительностей циклов, т. е. порождают ли последовательности решений, близкие к эталонной, та кие планы, время выполнения которых ближе к эталонно му времени, нежели времени для планов, возникших на основе последовательностей, более удаленных от эталон ной.
На основании экспериментальных результатов можно показать [2.3], что если в качестве эталона выбран план, близкий к оптимальному, то средний цикл выполнения плана по сравнению с оптимальным увеличивается быст рее сравнительно с ростом несходства этих планов с эта лоном. Дело в том, что задача календарного планирова ния обладает той спецификой, что множество сравнитель но хороших планов включает существенно различные планы. Множество этих планов распределено в D не рав номерно, а образует сосредоточения в зонах концентра
ции. Правильная |
методика |
самообучения заключается |
в определении |
(например, |
методом слепого поиска) |
местонахождения благоприятных зон поиска и, в даль нейшем, тщательном исследовании этих зон методом ло кального поиска.
На |
тестовых задачах 6 X 6 x 6 |
и 20X5X5 проверялось |
[2. 25] предположение о высоком |
проценте отбора прави |
|
ла SIO |
на ранних стадиях последовательности приорите |
|
тов X |
и правила L R T — на поздних в расписаниях, близ |
ких к оптимальному. Однако это предположение пол ностью не подтвердилось, как и другое, более умеренное
предположение, в соответствии с которым для расписа ний, близких к оптимальному, процент выбора на ранней стадии загрузки правила SIO и на поздней стадии LRT должен быть большим, нежели для случая неудачных расписаний.
Таким образом, на основании комплекса эксперимен тальных исследований рандомизированных правил с обу чением и без него для решения задач 6x6 , 10x10, 20X5
иряда других можно заключить, что:
—несмещенная случайная комбинация правил обыч но дает лучшие результаты, чем каждое из них в отдель ности;
—методология самообучения легко реализуется на ЭВМ, однако его эффективность по сравнению с несме щенной случайной комбинацией правил пока не подтвер дилась.
Обобщая сказанное, можно сделать следующее за ключение: существующие точные методы пригодны, как правило, только для решения частного класса задач, в основном задач очередности, или общих задач очень не больших «площадей». По поводу применения статисти ческих методов следует заметить, что последние эффек тивны для решения задач, допускающих Л'-кратную реализацию на ЭВМ случайного расписания. В частности, с помощью метода ненаправленного случайного поиска можно получить довольно точные решения с высокой на дежностью при условии больших N (порядка нескольких сотен и более). При меньших N, на наш взгляд, более эффективным является применение рандомизированных правил предпочтения, использование которых можно рас сматривать как метод, аналогичный ненаправленному случайному поиску в некотором подмножестве D ' мно жества D допустимых расписаний.
Что касается весьма громоздких задач, позволяющих реализовать случайное расписание не более 10 раз, то в настоящее время возможно лишь для улучшения плана использование правил предпочтения. При этом большое значение имеет выбор правила предпочтения, которое учитывает специфику задачи и позволяет смоделировать хорошее расписание.
Направленный случайный поиск и другие вероятност ные методы (см. § 2.4 и 2.5) эффективнее ненаправлен ного, однако при решении лишь частных задач календар-
9. Д . I I . Голенко |
129 |