Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Промышленные и МС Обучаемые системы управления...doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
4.47 Mб
Скачать

3. Схемные решения обучаемых систем управления

Каждый из приведенных ниже вариантов разработанных схем обучаемых систем управления решает серьезные проблемы, которые возникали в процессе исследования этих систем, и является определенным этапом в работе и новым техническим решением, выводившем на более высокий уровень понимания принципов работы обучаемых систем, поэтому эти схемы приобрели форму изобретений, защищенных авторскими свидетельствами и патентами.

3.1. Командные рецепторы обучаемой системы управления

В процессе сборки узлов возникает необходимость последовательного поиска собираемых деталей. Классическую обучаемую систему управления можно обучить искать несколько предметов. Но как задать требуемую последовательность поиска? Для решения этой задачи возникла идея так называемых командных рецепторов [77], включение каждого из которых определяет поиск необходимой в данный момент цели. Но при этом возникла новая проблема: командные рецепторы не реагируют на изменение освещенности, и, следовательно, при ее изменении сигнал управления двигателя, определяющего движение поиска, в целевой ситуации отклонялся от нулевого значения за пределы допуска, т.е. поиск становился невозможным. Было предложено соединить командные рецепторы с источником питания через рецептор освещенности. Следует отметить, что идея командных рецепторов не была заимствована у природы, и в дальнейшем было найдено более интересное решение, позволяющее обучать объект управления различным задачам, но для практического обучения реальной обучаемой системы командные рецепторы оказались очень удобными, т.к. позволяют легко дообучать и корректировать ошибки обучения изменением долей сигналов только таких командных рецепторов, не затрагивая другие рецепторы.

На рис.3.1 представлена электрическая схема такой обучаемой системы управления. Система содержит сетчатку технического глаза 1 (оптика технического глаза на схеме не показана), состоящую из набора рецепторов очувствления в виде фоторезисторов 2; технический мозг 3 в виде матрицы аналоговых резисторных элементов 4, соединенных строчными шинами 5 с фоторезисторами 2 сетчатки глаза, а парными столбцовыми шинами 6 и 7 с нагрузочными резисторами 10; набор усилителей 8, содержащий двуполярные усилители 9, входы которых соединены с парными столбцовыми шинами 6 и 7, а выходы 11 которых являются выходами системы. Кроме того, система включает набор 12, содержащий три группы командных рецепторов, каждый из которых состоит из последовательно соединенных электрического контакта 13 и переменного резистора 14. Электрические контакты 13 одной из групп командных рецепторов выполнены в виде выключателей с ручным управлением; управляющие входы электрических контактов 13 другой группы предназначены для подключения к внешним системам, и, наконец, управляющие входы электрических контактов 13 третьей группы подключены к выходам пороговых элементов 15, установленных на выходах 11 части усилителей 9. В системе имеется источник питающего напряжения постоянного тока 16. С одной клеммой этого источника соединены рецепторы очувствления 2, а с другой клеммой соединены нагрузочные резисторы 10. Командные рецепторы соединены строчными шинами 5 с аналоговыми резисторными элементами 4 матрицы мозга 3 и с источником питающего напряжения 16 через фоторезистор 17, оптически направленный на поле зрения технического глаза, минуя объектив этого глаза. Рецепторы очувствления и командные рецепторы соединены со строчными шинами 5 технического мозга разъемами 18. Технический мозг включает еще дополнительные строчные шины (на схеме не указаны), совмещенные с выходами 11 системы.

Рис.3.1. Схема обучаемой системы управления с командными рецепторами

На схеме указаны обозначения: С1фр, С2фр, . . . , Сmфр – проводимости фоторезисторов 2 сетчатки технического глаза; индекс внизу обозначает порядковый номер фоторезистора, m – общее количество фоторезисторов сетчатки; С1к, С2к, . . . , Срк – проводимости переменных резисторов 14 командных рецепторов, электрические контакты 13 которых выполнены в виде выключателей, замыкаемых или размыкаемых вручную человеком; р – общее количество таких командных рецепторов; Ср+1к, Ср+2к, . . . , Ср+вк – проводимости переменных резисторов 14 командных рецепторов, замыкание и размыкание электрических контактов 13 которых осуществляется внешними управляющими системами, например системой управления металлорежущего станка, который обслуживается промышленным роботом, оснащенным обучаемой системой управляющего зрения; в – общее количество командных рецепторов, электрические контакты которых замыкаются и размыкаются внешними управляющими системами; Ср+в+1к, Ср+в+2к, . . . , Сvк – проводимости переменных резисторов 14 командных рецепторов, замыкание и размыкание электрических контактов 13 которых осуществляется пороговыми элементами 15 обучаемой системы управляющего зрения; v– общее количество таких командных рецепторов; w = p + b + v – общее количество командных рецепторов; n – общее число исполнительных органов объекта управления и пороговых элементов 15; (n – w) – общее количество исполнительных органов объекта управления; E(1), E(2), . . . , E(n–v) – сигналы управления исполнительными органами объекта управления (индекс вверху обозначает порядковый номер исполнительного органа); E(n–v+1), E(n–v+2), . . . , E(n) – сигналы управления пороговыми элементами 15, замыкающими и размыкающими электрические контакты 13 командных рецепторов; U – напряжение источника питающего напряжения 16.

Пороговые элементы 15 срабатывают при определенных уровнях сигналов управления Е на соответствующих выходах усилителей 9, замыкая или размыкая электрические контакты 13 командных рецепторов. Соотношение электрических сопротивлений фоторезисторов 2, резисторов потенциометров 4 и нагрузочных резисторов 10 должно быть таким, чтобы исключить появление блуждающих токов в обучаемой системе управления. Число различных задач, решению которых можно обучать робот, оснащенный данной системой, определяется числом возможных комбинаций включений командных рецепторов. Число таких комбинаций будет равным:

Nk = 2w .

Прежде, чем включить обучаемую систему управления в работу, ее необходимо обучить т.е. настроить. Рассмотрим процесс обучения на примере настройки системы, установленной на промышленном роботе, предназначенном для поиска заданных предметов сложного внешнего вида, произвольно расположенных в рабочей зоне робота. Решение этой задачи необходимо в процессе, например, сборки узлов, когда в рабочую зону робота поступает комплект различных деталей, сориентированных произвольно, и которые в определенной последовательности должны быть собраны в узел. Технический глаз установлен на схвате робота и совмещен с осью вращения схвата. Движения поиска осуществляют три двигателя: первый – перемещает схват с установленным на нем глазом вдоль стола с размещенными на нем различными предметами; второй – перемещает схват поперек стола; третий – вращает схват вокруг оси. Была поставлена цель – обучить робот при замыкании электрического контакта 13 первого командного рецептора искать первый заданный предмет, при замыкании контакта 13 второго командного рецептора – искать второй заданный предмет и т.д. по числу искомых предметов. При замыкании контакта 13 одного из командных рецепторов контакты остальных автоматически размыкаются. Возможны и другие комбинации включений и выключений контактов 13 командных рецепторов. Сначала необходимо определить стратегию поведения робота. Тот его двигатель, который перемещает схват и установленный на нем глаз вдоль стола с размещенными на нем предметами, должен работать в заданном направлении в тех случаях, когда в поле зрения глаза либо нет предметов, либо есть, но – посторонние, и должен остановиться в том случае, когда в поле зрения находится правильно ориентированный искомый предмет. Другой двигатель, смещающий схват поперек стола, должен работать таким образом, чтобы любой предмет располагался по центру поля зрения глаза в поперечном направлении. Третий двигатель должен вращать схват в ту или иную сторону в зависимости от перекоса предмета в поле зрения, и, если предмет находится в заданном положении, третий двигатель должен остановиться. Схват должен сработать только в том случае, если в поле зрения будет располагаться правильно сориентированный искомый предмет. Какой предмет является искомым в данный момент, определяется замыканием контактов 13 командных рецепторов. Установленный на схвате робота технический глаз имеет сетчатку из фоторезисторов 2, расположение которых произвольное. Предварительно пронумеруем все фоторезисторы 2 и им соответствующие строки 5 матрицы технического мозга. Изображение рабочей зоны проецируется на сетчатку с помощью объектива. Перед началом обучения все скользящие контакты потенциометров 4 необходимо выставить в среднее положение. Далее устанавливают проводимости переменных резисторов 14 командных рецепторов в зависимости от заданной последовательности поиска предметов, определяемой, например, последовательностью сборки узла. В процессе сборки предметы (детали) поочередно удаляются из рабочей зоны робота и устанавливаются в собираемый узел. Наибольшую проводимость резистора 14 устанавливают для командного рецептора, задающего команду на поиск первого предмета. Для поиска второго предмета проводимость резистора 14 соответствующего командного рецептора устанавливают меньше; для третьего – еще меньше и т.д. Наименьшая проводимость резистора 14 устанавливается для командного рецептора, определяющего поиск последнего предмета. Такой порядок установки проводимостей резисторов 14 командных рецепторов обеспечивает по мере удаления предметов из рабочей зоны остановку схвата только на том предмете, который задан последовательностью сборки, и прохождение схвата над всеми оставшимися предметами, если те будут попадать в поле зрения глаза. Обучение проводят отдельно для каждого двигателя и одновременно для всех задач по поиску предметов. Обучение можно начать с первого двигателя, управление которым осуществляет первая пара столбцов 6 и 7 матрицы 3 с сигналом Е(1). Ситуации в обучаемую выборку подбирают, исходя из стратегии поиска. Обучение проводят в условиях наибольшей освещенности, возможной при работе системы. Первая задача – поиск первого предмета. При этом замкнут контакт 13 первого командного рецептора. Первая ситуация обучаемой выборки: глаз видит стол без предметов. При этом измеряют электрические проводимости всех фоторезисторов 2 технического глаза. Все измерения проводят при разомкнутых разъемах 18. Представим измеренные проводимости в виде: С11фр, С12фр, . . . , С1mфр, где первый индекс внизу означает номер ситуации, а второй – номер фоторезистора 2 сетчатки. Полученный ряд проводимостей фоторезисторов 2 дополняют проводимостью резистора 14 первого командного рецептора С1к, контакт которого замкнут. Проводимости остальных командных рецепторов равны нулю, т.к. их электрические контакты разомкнуты. Как следует из стратегии поиска предмета, сигнал управления, подаваемый с первой пары столбцов на первый двигатель в первой ситуации должен быть положительным: Е1(1) > 0. Следует оговорить эту величину, но нужно иметь в виду, что она может иметь широкий диапазон изменения; другими словами, задают такое допустимое отклонение сигнала управления 1(1), которое позволяет только сохранить направление движения, т.е. сохранить знак сигнала управления Е(1) и не превысить предельную скорость перемещения исполнительного органа. Вторая ситуация: глаз видит сориентированный первый предмет, который является искомым для первой задачи. В этой ситуации замеры дадут: С21фр, С22фр, . . . , С2mфр. Сигнал управления двигателем в этой ситуации должен быть равен нулю. Задают Е2(1) = 0. Допустимое отклонение 2(1) сигнала управления должно быть настолько малым, чтобы гарантировать остановку первого двигателя в этой ситуации, т.е. задают величину его меньше значения сигнала управления, необходимого для преодоления момента трения двигателя. Вторая ситуация является целевой для первой задачи. Целевых ситуаций для одного предмета может быть несколько с различной ориентацией предмета в поле зрения глаза. Третья ситуация: глаз видит сориентированный второй предмет, который является посторонним для первой задачи, как и все оставшиеся предметы. Для этой ситуации проводимости фоторезисторов 2 представим как: С31фр, С32фр, . . . , С3mфр. Сигнал управления Е3(1) в этой ситуации задаем таким же, как и в первой. И далее, по очереди предъявляют все предметы комплекта собираемого узла и задают для них сигналы управления такие же, как и в первой ситуации. Формирование ситуаций обучаемой выборки для решения первой задачи закончено. Переходим к подбору ситуаций в обучаемую выборку для решения второй задачи – поиска второго предмета. Замкнутым в этом случае является контакт 13 второго командного рецептора; его проводимость – С2к; остальные контакты командных рецепторов разомкнуты, их проводимости Ск принимаем равными нулю. В обучаемую выборку обучению решению второй задачи входят те же ситуации, что и для обучения решению первой задачи, кроме ситуации, когда глаз видит первый предмет, т.е. кроме второй ситуации первой задачи. Целевой для второй задачи является ситуация, когда глаз видит сориентированный второй предмет. Сигнал управления для нее задаем нулевым с допустимым отклонением как и во второй ситуации первой задачи: ц(1)= 2(1). Для остальных ситуаций сигналы управления задаем положительными с широкими диапазонами изменения аналогично первой ситуации первой задачи. Для решения третьей задачи – поиска третьего предмета, в обучаемую выборку входят те же ситуации, что и для решения первых двух, кроме тех, когда глаз видит первый и второй предметы. Целевой является ситуация, когда в поле зрения – сориентированный третий предмет. Замкнут при этом только электрический контакт 13 третьего командного рецептора с проводимостью резистора 14, обозначенной через С3к; и так далее. Для обучения поиску последнего предмета в обучаемую выборку входят только две ситуации: ситуация, когда глаз видит стол без предметов с положительным сигналом управления для нее и широким допуском на этот сигнал, и ситуация, когда в поле зрения находится сориентированный искомый предмет с нулевым сигналом управления и жестким допуском. На этом формирование обучаемой выборки для обучения первого двигателя закончено.

На следующем этапе обучения производят расчеты долей eоi сигнала управления каждого i-го рецептора, которые формируются на выходе 11 усилителя 9 первой пары столбцовых шин 6 и 7 в опорной ситуации. Для формирования опорной ситуации используют одну из целевых, например вторую ситуацию первой задачи и замыкают электрические контакты 13 всех командных рецепторов. Порядок расчета предусматривает поочередное предъявление ситуаций обучаемой выборки и поочередный расчет долей сигнала управления eоi в опорной ситуации. Расчет – итерационный и повторяется до тех пор, пока ошибка сигнала управления  Еj(1) в каждой j-ой ситуации обучаемой выборки не окажется меньше допустимого отклонения j(1). Исходные значения долей eоi сигнала управления принимают равными нулю. Порядок расчета соответствует описанному в разделе 2.2.4. Следующий этап обучения – настройка потенциометров 4 технического мозга. Для этого подсоединяют к строчным шинам 5 все отсоединенные ранее рецепторы очувствления 2 и командные рецепторы и замыкают электрические контакты 13 всех командных рецепторов. Во время настройки все выходы 11 усилителей 9 должны быть отключены от двигателей и пороговых элементов 15. Настройку ведут в ситуации, принятой за опорную, для чего глаз выставляют в положение, когда он видит сориентированный первый искомый предмет, и замыкают контакты всех командных рецепторов. Настройка заключается в смещении скользящего контакта каждого потенциометра 4 в ту сторону и на такую величину, которые обеспечивали бы изменение сигнала управления Е(1) на выходе первого усилителя на расчетную величину eоi соответствующего i-го рецептора. Например, согласно расчету доля в сигнале управления первого рецептора равна 0,12 В (eо1 =+12 В), следовательно, нужно сместить скользящий контакт первого потенциометра 4 первой пары столбцовых шин в ту сторону и настолько, чтобы при этом измеряемый с помощью вольтметра сигнал управления Е(1) на выходе первого усилителя увеличился на величину 0,12 В. После этого переходят к следующему потенциометру 4 той же пары столбцовых шин, и, если, согласно расчету, например eо2=–0,08 В, то скользящий контакт второго потенциометра 4 смещают в обратную сторону настолько, чтобы сигнал управления Е(1) уменьшился на 0,08 В.

После настройки всех потенциометров 4 первой пары столбцовых шин технического мозга проводят проверку настройки. Для этого в той же ситуации, которая использовалась для формирования опорной, но при замкнутом контакте 13 только первого командного рецептора, измеряют на выходе первого усилителя сигнал управления, который должен быть равен нулю: Е(1) = 0 – в пределах заданного допуска. Во всех прочих ситуациях обучаемой выборки сигнал должен быть положительным. Равным нулю он должен быть и в ситуации, когда глаз видит сориентированный второй искомый предмет при замкнутом контакте 13 только второго командного рецептора. При замкнутом контакте 13 только третьего командного рецептора нулевым сигнал должен быть в ситуации, когда глаз видит сориентированный третий искомый предмет. И так далее. Таким образом подтверждается правильность обучения. После завершения настройки потенциометров 4 первой пары столбцовых шин 6 и 7, т.е. после обучения первого двигателя, переходят к обучению второго двигателя, руководствуясь при этом принятой стратегией поведения робота и той же методикой, которая применялась при обучении первого двигателя. Пороговые элементы 15 обучают по подобной методике. Они могут использоваться для переключения контактов 13 командных рецепторов в случае перехода к выполнению очередной задачи, а также для управления работой схвата. Условием срабатывания порогового элемента 15 может быть целевая ситуация, когда в поле зрения располагается найденный предмет и его требуется захватить с помощью схвата и перейти к решению следующей задачи. Для управления работой пороговых элементов может использоваться как отдельная пара столбцовых шин технического мозга, так и пара уже задействованных для управления одним из двигателей. В первом случае необходимо настроить потенциометры 4 отдельной пары столбцовых шин таким образом, чтобы в ситуациях, когда требуется срабатывание пороговых элементов, на выходе 11 соответствующего усилителя 9 была необходимая для срабатывания величина сигнала управления, а во втором случае требуется подобрать или настроить пороговый элемент таким образом, чтобы срабатывание его в целевых ситуациях определялось величиной сигнала управления соответствующего двигателя.

Работает обучаемая система управления следующим образом. После завершения обучения система подсоединяется к объекту управления и на нее подается напряжение U от источника питающего напряжения постоянного тока 16. При этом каждый рецептор очувствления 2 и включенный командный рецептор в текущей j-ой ситуации выдает на выход 11 свою долю eij сигнала управления Ej, определяемую его проводимостью в этой ситуации Сijфр или Сijк и смещением скользящего контакта соответствующего ему потенциометра 4. В результате фактический сигнал управления Efj определится как сумма долей от всех рецепторов:

Если теперь замкнуть контакт 13 первого командного рецептора, то на выходе 11 первого усилителя 9 сформируется сигнал управления Е(1), соответствующий тому, что попадает в поле зрения технического глаза, т.е. этот сигнал будет равен нулю в тех случаях, когда в поле зрения глаза окажется первый искомый предмет с заданной ориентацией, и будет положительным, если в поле зрения находятся другие предметы или фон. Следовательно, первый двигатель робота будет смещать схват с глазом вдоль стола до тех пор, пока глаз не увидит искомый предмет, и только при этом остановится. Действия первого двигателя будут успешными, так как контрольная проверка сигналов управления первого усилителя 9 после обучения подтвердила, что сигналы управления будут равны нулю в целевых ситуациях и будут положительными в остальных. Такими же успешными окажутся действия второго и третьего двигателей, если обучение проведено правильно. Как видно из стратегии обучения, второй и третий двигатели робота смещают и поворачивают глаз так, чтобы искомый предмет оказался правильно сориентированным в поле зрения глаза вне зависимости от его положения на столе. Таким образом, все двигатели робота, действуя согласованно, обеспечивают поиск заданного предмета. Если же замкнуть контакт 13 второго командного рецептора, то будет осуществлен поиск второго заданного предмета. При замкнутом контакте 13 третьего командного рецептора осуществится поиск третьего предмета. И так далее.

Электрические контакты 13 командных рецепторов могут быть разделены по управлению ими на три группы. Контакты одной из групп являются выключателями, замыкает и размыкает которые вручную человек. Управляющие входы контактов другой группы предназначены для подключения к внешним системам. Это могут быть системы управления другими объектами, системы управления других уровней и т.д. Управляющие входы контактов третьей группы подключены к выходам пороговых элементов 15, через которые замыкание или размыкание контактов этой группы осуществляет конкретная зрительная ситуация, воспринимаемая техническим глазом. Поиск заданных предметов будет обеспечен в условиях изменяющейся освещенности благодаря наличию фоторезистора 17, оптически направленного на поле зрения технического глаза, минуя объектив, и соединяющего командные рецепторы с источником питания. Это следует из выражения для определения фактического сигнала управления, если ввести в него коэффициент h, учитывающий, во сколько раз изменилась освещенность поля зрения глаза:

из которого следует, что при любом значении h в целевых ситуациях сигнал управления будет равен нулю, т.е. поиск предметов гарантирован. Что же касается скорости движений при поиске, то очевидно, что при большей освещенности она будет больше, при меньшей – меньше. При слабом освещении движения робота будут замедленными, при ярком освещении – ускоренными. При выходе из строя некоторой части рецепторов 2 технического глаза, например при обрыве их контактов со строчными шинами 5 матрицы 3, сигналы управления Е исполнительными органами изменяются на величину, равную сумме долей е, которые формировались этими рецепторами. В результате, значения сигналов управления Е могут выйти за пределы допустимых величин в некоторых целевых ситуациях, т.к. допуск в этих ситуациях на сигналы управления – наиболее жесткий. Тогда при поиске задаваемых предметов робот может не остановиться над искомым предметом, т.е. не будет выполнять поставленную задачу. В этом случае нужно заново переобучить систему управления. Можно также дообучить робот, не меняя настройку потенциометров 4 матрицы мозга 3, соединенных с рецепторами очувствления 2. Для этого в тех целевых ситуациях, в которых робот не останавливается, подстраивают потенциометры 4 только соответствующих командных рецепторов в соответствующей паре столбцовых шин таким образом, чтобы компенсировать потерянные доли сигнала управления в результате обрыва рецепторов очувствления 2, добиваясь, чтобы в целевых ситуациях на выходах 11 усилителей 9 сигналы управления равнялись нулю. Если в рассмотренном примере в первой целевой ситуации на выходе первого усилителя вместо нулевого сигнала измерения показали, что сигнал положительный и превышает допустимое отклонение, то скользящий контакт потенциометра 4, соединенного строчной шиной 5 с первым командным рецептором и выводы резистора которого соединены с первой парой столбцовых шин, смещают в ту сторону и настолько, чтобы сигнал управления уменьшился до допустимого значения. Аналогично добиваются требуемых значений сигналов управления и в других целевых ситуациях.