Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Промышленные и МС Обучаемые системы управления...doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
4.47 Mб
Скачать

3.2. Обучаемая система управления с внутренними обратными связями

Изложенное в этом разделе изобретение [78] имеет важное теоретическое и практическое значение. Оно позволяет обучать систему выполнению последовательности действий, когда выполнение одного действия (точнее, формирование управляющего сигнала) вызвано выполнением предыдущего (предыдущим управляющим сигналом) и в свою очередь является причиной последующего действия объекта управления (последующего сигнала управления). При отключенных исполнительных органах таким образом реализуется процесс мышления технической нервной системы. Изобретение позволяет согласовывать управляющие сигналы исполнительными двигателями между собой. На рис.3.2 представлена схема такой обучаемой системы управления (внешне она напоминает так называемые нейронные сети Хопфилда). Она содержит технические органы чувств 1, состоящие из наборов рецепторов очувствления 2, постоянное запоминающее устройство 3 в виде матрицы аналоговых резисторных элементов 4, строчные шины 5 которой совмещены с рецепторами очувствления 2, а столбцо вые шины 6 и 7 объединены попарно, блок усилителей 8, содержащий двуполярные усилители 9, со входами каждого из которых соединены отдельные парные столбцовые шины 6 и 7, каждая столбцовая шина имеет нагрузочный резистор 10. Выходы 11 усилителей 9 являются выходами системы на управляемые исполнительные органы. Питание на рецепторы очувствления 2 подается с источника питания 12 постоянного тока. Система включает также дополнительный блок 13 резисторной матрицы, столбцовые шины которого соединены со столбцовыми шинами матрицы постоянного запоминающего устройства 3, а строки с помощью каналов 14 блока внутренних обратных связей 15 – попарно с выходами системы 11. В каждом канале 14 установлены блок задержки 16 и диод 17. Направление проводимости диодов 17 в каналах 14 одной пары обратных связей – противоположное.

Рис.3.2. Схема обучаемой системы управления с внутренними обратными связями

На схеме указаны обозначения: U – напряжение источника питания 12; b1р, b2р,..., bmр – токи, проходящие через фоторезисторы 2 и определяемые сопротивлениями этих резисторов (индекс внизу обозначает порядковый номер рецептора); m – общее количество рецепторов очувствления; Е(1), Е(2), . . . , Е(n) – сигналы управления исполнительными органами объекта управления (на схеме исполнительные органы не показаны) (индекс вверху обозначает порядковый номер исполнительного органа); n – общее количество исполнительных органов; b11M, b12M,..., bn1M, bn2M – токи, проходящие по каналам обратных связей, определяемые величинами сигналов управления Е и сопротивлениями потенциометров 4 (первый индекс внизу обозначает номер соответствующего исполнительного органа, второй индекс внизу обозначает номер канала в паре каналов обратных связей).

Рассмотрим процесс обучения данной системы. Допустим, обучаемая система управления установлена на промышленном роботе, и обучим этот робот поиску заданного предмета среди посторонних. В качестве органа чувств в данном случае используем технический глаз, установленный на схвате робота. Сначала необходимо определить стратегию поведения робота. Если предметы, среди которых находится искомый, расположены на столе, то поиск можно организовать так, что рука робота с глазом будет перемещаться вдоль стола на определенной высоте и смещаться поперек стола только в том случае, если в поле зрения глаза попал любой предмет. Смещение поперек стола должно быть всегда в сторону попавшего в поле зрения предмета. Если предмет повернут, то схват с глазом должен при поиске повернуться так, чтобы искомый предмет оказался правильно сориентированным в поле зрения глаза. Определим более подробно действия двигателей робота. Тот его двигатель, который перемещает схват и установленный на нем глаз вдоль стола с размещенными на нем различными предметами, должен работать в заданном направлении в тех случаях, когда в поле зрения глаза либо нет предметов, либо есть, но посторонние, и должен остановиться в том случае, когда в поле зрения – сориентированный искомый предмет. Другой двигатель, смещающий схват поперек стола, должен работать в том направлении, с какой стороны в поле зрения глаза попал край любого предмета, и должен остановиться в том случае, если предмет находится в центре поля зрения. Третий двигатель должен вращать схват в ту или иную сторону в зависимости от направления отклонения условной оси предмета относительно условной оси поля зрения глаза; но если искомый предмет находится в заданном положении, то двигатель должен остановиться. Обучение проводят отдельно для каждого двигателя, а затем согласуют совместные действия всех двигателей. Предварительно пронумеруем все фоторезисторы 2 сетчатки глаза и соответствующие им строки 5 матрицы постоянного запоминающего устройства 3. Расположение фоторезисторов на сетчатке и их нумерация – произвольные. Обучение можно начать с первого двигателя, управление которым осуществляет, допустим, первая пара столбцов 6 и 7 матрицы 3 с сигналом управления Е(1). Ситуации в обучаемую выборку подбирают, исходя из стратегии поиска. Перед началом обучения все потенциометры 4 необходимо выставить в средние положения. Первая ситуация: глаз видит стол без предметов. При этом необходимо замерить токи b11р, b12р, . . . , b1mр всех фоторезисторов 2 технического глаза 1. Измерение можно производить лишь при отсоединенных строках 5, подсоединив разъемы рецепторов 2 к источнику питания 12. Первый индекс внизу обозначает номер ситуации. Как явствует из стратегии поиска, сигнал управления, подаваемый с первой пары столбцов на первый двигатель в первой ситуации, должен быть положительным: Е(1) > 0. Следует оговорить эту величину, но нужно иметь в виду, что она может иметь широкий диапазон или, другими словами, большое допустимое отклонение (Е(1)). Вторая ситуация: глаз видит посторонний предмет. Необходимо повторить замеры и представить их в виде b21р, b22р, . . . , b2mр. Сигнал управления Е2(1) в этой ситуации должен иметь тот же знак, что и в первой ситуации: Е2(1) > 0, – но величина его может отличаться. Допустимое отклонение (Е2(1)) может быть таким же, как и в первой ситуации: (Е2(1)) = (Е1(1)). Третья ситуация: глаз видит искомый предмет в заданном положении. Замеры дадут b31р, b32р, . . . , b3mр . Сигнал управления в этой ситуации согласно стратегии поиска должен быть равен нулю: Е3(1) = 0. Допустимое отклонение (Е3(1)) сигнала управления должно быть настолько малым, чтобы гарантировать остановку первого двигателя, т.е. оно не должно превышать значения сигнала управления, необходимого для преодоления момента трения двигателя. Третья ситуация является целевой в задаче поиска предмета. В общем случае целевых ситуаций для одного предмета может быть несколько с учетом различной ориентации предмета в поле зрения глаза. На этом формирование обучаемой выборки для обучения первого двигателя закончено. На следующем этапе обучения производят расчет долей ei сигнала управления, которые формируются на выходе 11 первой пары столбцовых шин каждым i-ым рецептором 2 и соответствующим ему i-ым потенциометром 4. Для этого одну из ситуаций обучаемой выборки принимают за опорную, и далее доли ei пересчитывают относительно выбранной опорной ситуации; обозначим их через eоi. В качестве опорной удобно выбрать целевую ситуацию. Порядок расчета предусматривает поочередное предъявление ситуаций и поочередный расчет долей сигнала управления в пересчете на опорную ситуацию. Расчет итерационный и повторяется до тех пор, пока ошибка сигнала управления  Еj(1) в каждой ситуации не окажется меньше допустимого отклонения (Еj(1)). Исходные значения долей сигнала управления принимают равными нулю. Порядок расчета соответствует описанному в разделе 2.2.4. В результате получают значения eоi для всех рецепторов. На следующем этапе обучения производят настройку потенциометров 4 по методике, аналогичной той, которая использовалась для настройки системы, показанной на схеме 3.1. После настройки всех потенциометров 4 первой пары столбцовых шин 6 и 7 матрицы 3 можно провести контрольные замеры. Для этого в той же опорной ситуации при поданном напряжении U источника питания 12 на выходе 11 первого усилителя 9 сигнал управления должен быть равен нулю: Е3(1) = 0. В первой и во второй ситуациях сигнал должен быть больше нуля. Таким образом подтверждается правильность процесса обучения. После завершения обучения первого двигателя (после настройки потенциометров 4 первой пары столбцовых шин 6 и 7) переходят к обучению второго и третьего двигателей, руководствуясь при этом принятой стратегией поведения и той же методикой, которая применялась при обучении первого двигателя. После завершения обучения всех трех двигателей робота переходят к процедуре согласования движений этих двигателей. Но предварительно необходимо определить смысл согласования. Очевидно, во время поиска заданного предмета схват с глазом может проскочить вдоль стола мимо этого предмета, не успев сместиться поперек стола или повернуться до требуемой ориентации предмета. Чтобы устранить такой нежелательный случай, достаточно задать при обучении скорости двигателей поворота схвата и смещения его поперек стола значительно большими, чем скорость двигателя перемещения вдоль стола. Однако при этом снижается скорость поиска. Предлагаемое новое техническое решение позволяет устранить указанный нежелательный случай не за счет снижения скорости поиска, а путем согласования движения всех двигателей. Для этого достаточно предусмотреть снижение скорости движения схвата вдоль стола при возрастании скорости движения поперек стола или поворота схвата. Итак, если в поле зрения глаза попал край некоторого предмета, то можно предусмотреть движение в первую очередь поперек стола, погасив при этом скорости поворота схвата и движения вдоль стола. Как только схват сместится до расположения предмета в середине поля зрения глаза, когда скорость движения поперек стола уменьшится до нуля, можно разрешить поворот схвата, по-прежнему сохраняя погашенной скорость движения вдоль стола. И, например, когда предмет окажется в середине поля зрения и правильно сориентированным, т.е. когда и Е(1)= 0, и Е(2)= 0, скорость движения вдоль стола восстанавливается до значения, заданного в процессе обучения. Практические согласования движений двигателей осуществляются следующим образом. Предварительно отсоединяют от системы управления двигатели. Затем располагают искомый предмет в поле зрения так, чтобы сигналы управления двигателями смещения поперек стола Е(2) и поворота Е(3) имели большое, например положительное значение, т.е. при этом двигатели стремились бы сместить схват поперек стола дальше от робота (выдвижение руки) и повернуть схват по или против часовой стрелки. Согласование осуществляют с помощью настройки потенциометров 4 дополнительного блока 13 постоянного запоминающего устройства. Сначала определяют тот канал внутренней обратной связи 14, который связан с выходом 11 второго двигателя (Е(2)) и по которому течет ток (по второму парному каналу ток течь не может, так как отсекается диодом). После этого смещают скользящие контакты потенциометров 4 первой и третьей пар столбцовых шин, соединенные с выявленным каналом внутренней обратной связи, в ту сторону и на столько, чтобы уменьшить сигналы Е(1) и Е(2) до нуля. После этого указанную процедуру повторяют при расположении искомого предмета с противоположной стороны поля зрения глаза. Таким образом добиваются снижения скоростей движения схвата вдоль стола и поворота при возникшем движении поперек стола. Затем располагают искомый предмет по центру поля зрения (Е(2)=0), но с перекосом в ту или другую сторону, и настраивают потенциометр первой пары столбцовых шин, соединенных с выходом 11 третьего двигателя, так, чтобы уменьшить сигнал Е(1). Процедуру повторяют при перекосе искомого предмета в обратную сторону. На этом требуемое согласование движений всех трех двигателей закончено. Указанное согласование можно осуществить в процессе обучения путем изменения обучаемой выборки. Для этого придется увеличить число ситуаций и изменить сами ситуации, дополнив ряд показаний рецепторов b1р, b2р, . . . , bmр показаниями внутренних обратных связей: b11M, b12M, b21M, . . . , bn1M, bn2M. Составим обучаемую выборку для первого двигателя с учетом согласования. Сохраним неизменными первые три ситуации, приняв в них равными нулю токи всех обратных связей: bM = 0, – и дополним их следующими ситуациями. Четвертая ситуация: в поле зрения глаза край любого предмета (требуется смещение схвата поперек стола в сторону от робота). Замеры дадут b41р, b42р, ... , b4mр, и кроме этого ряд необходимо дополнить показаниями внутренних обратных связей, среди которых все bM=0, кроме b21M = kE(2)>0, Коэффициент k учитывает снижение тока потенциометром 4. Пятая ситуация: в поле зрения глаза край того же предмета, но с противоположной стороны. Замеры дадут b51р, b52р, ... , b5mр, дополнительно к этому все bM =0, кроме b22M =kE(2) <0. Шестая ситуация: в поле зрения глаза искомый предмет, повернутый на 45 по часовой стрелке. Замеры дадут b61р, b62р, ... , b6mр, дополнительно к этому все bM =0, кроме b31M =kE(3) >0. Седьмая ситуация: а поле зрения глаза искомый предмет, повернутый на 45 против часовой стрелки. Замеры дадут b71р, b72р, . . . , b7mр, дополнительно к этому: bM = 0, кроме b32M = kE(3) > 0. На этом формирование обучаемой выборки первого двигателя заканчивается. Также можно дополнить и изменить обучаемую выборку третьего двигателя. В остальном процесс обучения сохраняется прежним. Работает обучаемая система управления следующим образом. После завершения обучения система подсоединяется к объекту управления, например, роботу и на нее подается напряжение U источника питания 12. Электрический ток идет от одной клеммы источника питания 12, проходит через резисторы рецепторов 2, выходит на строчные шины 5 матрицы 3, далее проходит через потенциометры 4, идет по столбцовым шинам 6 и 7 и через нагрузочные резисторы 10 возвращается на вторую клемму источника питания 12. В результате на парных столбцовых шинах 6 и 7 возникает разность потенциалов. На эту разность повлияет также ток, идущий с соседних усилителей 9, проходящий по каналам внутренней обратной связи 14, выходящий на строчные шины дополнительного блока 13 и через потенциометры 4 выходящий на ту же пару столбцовых шин 6 и 7. Разность потенциалов пары столбцовых шин усиливается двуполярными усилителями 9 и подается в виде сигналов управления Е с выходов 11 для управления скоростью двигателя. Сигнал управления Е может быть как положительным, так и отрицательным. Каждый рецептор 2 и каждая внутренняя обратная связь 14 в каждой ситуации выдают на выход 11 свои доли eij сигнала управления. В результате фактический сигнал управления Еf определится как сумма всех долей:

Если правильно была составлена обучаемая выборка по всем двигателям, то их действия окажутся целенаправленными и согласованными, т.е. схват с глазом будет перемещаться вдоль стола, притормаживать и быстро смещаться в сторону предмета, попавшего в поле зрения глаза, разворачиваться до совпадения условной оси искомого предмета с условной осью поля зрения и останавливаться в том случае, если в центре поля зрения окажется правильно сориентированный искомый предмет. Посторонние предметы схват будет проходить, не останавливаясь. Наличие блоков задержки 16 в каналах внутренних обратных связей 14 позволяет, во-первых, учесть различную инерционность исполнительных органов (изменение скорости двигателя всегда отстает во времени от изменения сигнала управления), а во-вторых, согласовать действия исполнительных органов при неизменной ситуации, воспринимаемой органами чувств. Поясним последнее утверждение примером. Допустим, робот обслуживает станок-полуавтомат, и на время отсутствия заготовок отключают станок полностью. Как только в поле зрения глаза робота появилась требуемая заготовка (только что ее подвезли), то обучаемая система управления, не меняя положения схвата робота, может сначала подключить для предварительного прогрева электронику, затем включить станок, потом подать смазывающе-охлаждающую жидкость и только после этого приступить к управлению роботом. Временная задержка сигналов в каналах обратной связи 14 с помощью блоков задержки 16 позволяет растянуть процесс согласования сигналов Е (мышления) на некоторое время. Без указанной задержки процесс согласования затухал бы практически мгновенно. При решении сложных задач, потребуется многоходовой перебор ситуаций согласования и, следовательно, необходимость в блоках задержки 16. Таким образом, введение в обучаемую систему управления дополнительного блока 13 постоянного запоминающего устройства и блока внутренних обратных связей 15 расширяет функциональные возможности системы путем введения взаимовлияния сигналов управления на выходах усилителей.