- •Технические нервные системы Обучаемые системы управления со зрением для промышленных роботов
- •Оглавление
- •Введение
- •1. Аналитический обзор информационно-управляющих систем промышленных роботов
- •1.1. Современное состояние систем управления роботами, использующих процедуру обучения
- •1.2. Принципы функционирования обучаемых систем управления (технических нервных систем)
- •Павлов Иван Петрович (1849-1936)
- •Пуанкаре (Poincare) Жюль Анри (1854-1912)
- •1.3. Сравнительный анализ адаптивных управляющих систем управления с распознаванием образов и обучаемых систем управления
- •1.4. Анализ вопросов аппаратной реализации систем управления роботами
- •2. Моделирование обучаемых систем управления
- •2.1. Математическое моделирование процесса обучения обучаемой системы управления
- •2.1.1. Алгоритм обучения обучаемой системы управления
- •2.1.2 Алгоритм расчета рецепторных долей сигнала управления
- •2.1.3. Условие сходимости процесса обучения
- •2.2. Закономерности процесса обучения, выявленные с помощью его математической модели
- •2.2.1. Закономерности процесса обучения системы управления для двух ситуаций обучаемой выборки
- •2.2.2. Закономерности процесса обучения системы управления при последовательном предъявлении ситуаций
- •2.2.3. Обучение с масштабированием подобных ситуаций
- •2.2.4. Влияние заданной точности выходных сигналов на продолжительность обучения
- •2.2.5. Влияние отличительности образов ситуаций обучаемой выборки на продолжительность обучения
- •2.2.6. Влияние порядка предъявления ситуаций обучаемой выборки на продолжительность обучения
- •Первый вариант обучения:
- •Второй вариант обучения:
- •2.2.7. Влияние способа дробления входной информации на продолжительность обучения
- •1 Вариант.
- •2 Вариант.
- •2.3. Имитационное моделирование обучения системы управления решению некоторых задач
- •2.3.1. Имитационное моделирование процесса обучения поиску заданного предмета
- •2.3.2. Имитационное моделирование процесса обучения воспроизведению образов
- •2.3.3. Имитационное моделирование процесса обучения распознаванию образов (ситуаций)
- •3. Схемные решения обучаемых систем управления
- •3.1. Командные рецепторы обучаемой системы управления
- •3.2. Обучаемая система управления с внутренними обратными связями
- •3.3. Деление рецепторов обучаемой системы управления на группы
- •3.4. Обучаемая система управления с парными рецепторами
- •3.5. Распределитель выходных сигналов обучаемой системы управления
- •4. Исследование обучаемой системы управления, установленной на робот тур-10к
- •4.1. Выбор параметров обучаемой системы управления для промышленного робота тур-10к
- •4.2. Методика обучения робота тур-10к с обучаемойсистемой управления со зрением поиску заданного предмета среди прочих
- •4.2.1. Разработка методики выбора ситуаций обучаемой выборки для решения задачи поиска заданного предмета
- •4.2.2. Настройка резисторной матрицы обучаемой системы управления и результат обучения
- •4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований
- •5. Реализация обучаемых систем управления
- •5.1. Варианты физической реализации обучаемых систем управления
- •5.2. Варианты электрической реализации обучаемых систем управления
- •5.2.1. Обучаемая система управления с резисторной матрицей из подстроечных резисторов
- •5.2.2. Обучаемая система управления с резисторной матрицей, элементы которой выполнены в виде графитовых соединений
- •5.2.3. Обучаемая система управления с резисторной матрицей, элементы которой выполнены из халькогенидных полупроводников
- •5.3. Обучаемая система управления со зрением для промышленного робота pm-01 (puma)
- •6. Технический подход к проявлениям сложной нервной деятельности
- •6.1. Обучение и самообучение объекта с технической нервной системой
- •6.2. Чувства и эмоции объекта с технической нервной системой
- •6.3. Мышление объекта с технической нервной системой
4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований
В результате исследований были выявлены некоторые свойства и особенности обучаемых систем и процесса их обучения.
Память обучаемых систем управления. Сформированные в результате обучения проводимости резисторных элементов технического мозга отражают все ситуации, использованные в обучаемой выборке, т.е. в обучаемых системах управления нет блока памяти в виде пространственного накопителя информации, в котором бы хранилась информация о каждой отдельной ситуации обучаемой выборки. Память в обучаемых системах управления – это функция технического мозга (а не некое материальное устройство, как в компьютерах), способность формировать требуемые сигналы управления в определенных ситуациях. При этом отсутствует процедура распознавания ситуаций, как предварительная процедура перед формированием правильного сигнала управления. Память обучаемых систем управления – распределенная. Каждый резисторный элемент матрицы мозга определяет свою долю сигнала с соответствующего выхода рецептора в формировании сигнала управления отдельного столбца матрицы мозга для данной ситуации. При достаточной избыточности рецепторов очувствления потеря части элементов мозга не сказывается на работоспособности системы, а при выходе сигнала управления за пределы допустимого эта потеря может быть компенсирована дообучением.
Некоторые правила обучения обучаемых систем. Прежде чем включить обучаемую систему управления в работу, ее необходимо обучить, т.е. настроить регулируемые резисторные элементы технического мозга таким образом, чтобы обеспечить выполнение объектом управления поставленных перед ним задач. При этом методы обучения могут быть различными: динамическое обучение, когда обучение ведется без отключения выходов обучаемой системы управления от исполнительных двигателей объекта управления, а сигналы обучения, изменяющие проводимости элементов мозга, подаются во время движения объекта управления, и статическое обучение с отключением выходов системы от исполнительных двигателей, правильность которого определяется по величинам сигналов управления, измеряемых приборами. Может быть использовано пассивное обучение с многократным циклическим "вождением за руку", когда для обучения используются все возникающие при работе объекта ситуации, или активное обучение, когда обучение ведется в некоторых наиболее характерных для данной задачи ситуациях, составляющих обучаемую выборку. Скорость обучения зависит от правильности подбора ситуаций в обучаемую выборку и от порядка чередования ситуаций при обучении. Обучение можно ускорить, если на каждом шаге обучения определять ситуацию, в которой отношение отклонения сигнала управления к допустимому отклонению этого сигнала в данной ситуации было наибольшим, и проводить очередную корректировку проводимостей элементов матрицы технического мозга именно в этой ситуации.
Практическое обучение робота с обучаемой системой управления со зрением выполнению различных задач позволило выявить ряд общих правил обучения:
1. Терпимость. Это правило заключается в том, что нельзя слишком жестко регламентировать движения робота; важно только, чтобы он выполнял задачу, т.е. достигал целевых ситуаций с требуемой точностью. Допуски же на точность движений робота в остальных ситуациях должны быть максимально широкими.
2. Непротиворечивость. Это правило означает, что сигналы управления в ситуациях обучаемой выборки должны достигаться обучением с заданной точностью. Противоречивость обучения заключается в задании таких сигналов на выходах мозга в ситуациях обучаемой выборки, которые не могут быть сформированы одним и тем же набором проводимостей резисторных элементов технического мозга. Примером противоречивого обучения можно считать требование разных сигналов на выходах мозга в ситуациях, в которых совпадают выходные сигналы рецепторов, подаваемых на строчные шины матрицы технического мозга. Противоречивость можно устранить расширением системы очувствления за счет рецепторов, которые в данных ситуациях будут иметь различные возбуждения.
3. Правило последнего предъявления целевой ситуации. Поскольку требуемая точность сигналов управления в целевых ситуациях наиболее высокая, то предъявление ее последней в процессе обучения является оптимальным, т.к. полученные сигналы не будут искажены следующими шагами обучения.
Свойство обратимости обучаемых систем управления. Обезличенность рецепторов обучаемых систем управления определяет их особенность, которую можно назвать обратимостью. Заключается она в том, что обучение системы идет по тем же самым каналам, по которым в рабочем режиме происходит управление объектом. Эта особенность позволяет снизить требования к элементам системы. Разброс характеристик, например, рецепторов учитывается при обучении и не влияет на качество работы. Нам не важно как возбуждается рецептор системы очувствления под действием раздражения в рабочем режиме, т.к. именно через него шло формирование соответствующих ему весовых коэффициентов (проводимостей резисторных элементов матрицы мозга), и поэтому, возбуждаясь в рабочем режиме так же как и при обучении, он будет выполнять свои функции. Поэтому, если до обучения подсоединение рецепторов к строчным шинам матрицы технического мозга может носить случайный характер, то по окончании обучения переподсоединение их недопустимо. В программируемых системах управления такой обратимости быть не может, ко всем элементам таких систем предъявляются жесткие требования к заданным характеристикам.
Особенность подхода к вопросу точности обучаемых систем управления. Точность позиционирования робота с обучаемой системой управления определяется только разрешающей способностью его системы очувствления и точностью обучения в целевых ситуациях и практически не зависит от погрешностей механической части робота. Например, при движении схвата в сторону целевой ситуации будут автоматически выбираться люфты, компенсироваться погрешности изготовления, упругие и постоянные деформации его частей, т.к. любое отклонение от целевой ситуации, фиксируемое системой очувствления робота, будет формировать сигналы управления приводами до тех пор, пока текущий образ ситуации полностью не совпадет с целевым.
Увеличение разрешающей способности системы очувствления позволяет увеличивать точность позиционирования до предела, определяемого возможностями приводов манипулятора, который, однако, может быть существенно расширен применением дополнительных устройств, например для поступательного движения можно использовать вращение микрометрического винта.
Важно отметить, что ужесточать требования к точности позиционирования следует только в целевых ситуациях и в случае необходимости, т.к. это приводит к увеличению продолжительности обучения. В промежуточных ситуациях обучаемой выборки требования к точности могут быть максимально снижены.
Особенность подхода к надежности обучаемых систем управления. Структура обучаемой системы определяет новый подход к надежности ее работы [63]. Принято считать, что увеличение числа элементов любой системы приводит к снижению надежности ее работы. Это утверждение верно для логических систем, когда выход из строя любого элемента приводит к полному отказу всей системы. Для обучаемых систем – наоборот: чем больше в такой системе элементов, тем надежнее ее работа. Избыточность рецепторов не равнозначна простому дублированию ими друг друга. Каждый рецептор вносит свою долю в общую величину сигнала управления. Эта доля определяется значением его весового коэффициента. Поэтому отказ отдельных рецепторов или искажение их информации приводит к искажению величины сигнала управления. Однако, чем больше избыточность рецепторов, тем меньше сказывается выход из строя отдельных элементов системы на ее работоспособность. Причем, появившаяся погрешность может быть компенсирована дообучением объекта за счет оставшихся рецепторов. Ремонт таких систем практически должен исчезнуть. Его во многом заменит дообучение объекта до требуемых параметров. Таким образом, обучаемые системы управления обладают высокой живучестью, аналогичной живучести биологических систем.
Надежность обучаемых систем управления можно повысить еще больше, используя равномерно-распределенный принцип построения этой системы (рис.4.17).
Рис.4.17.
Схема обучаемой системы управления,
построенной
по равномерно-распределенному
принципу
Этот принцип заключается в том, что отдельный выход каждого рецептора разделяется на множество выходов, по которым распределяется сигнал рецептора. Все выходы отдельного рецептора соединены со строчными шинами, равномерно распределенными по матрице мозга. То же самое – со столбцовыми шинами: с каждым входом усилителя или сумматора мозга соединяется множество столбцовых шин, равномерно распределенных по матрице. В микроэлектронном варианте обучаемой системы такое выполнение не приведет к значительному увеличению ее габаритов. Даже удаление целых участков матрицы мозга не повлияет на работоспособность такой обучаемой системы (рис.4.18).
Рис.4.18.
Расколовшаяся матрица технического
мозга не теряет полностью своей
работоспособности
Особенность подхода к вопросу быстродействия обучаемых систем управления. В обучаемых системах отсутствует процедура опроса датчиков, процедуры вычислений по решающим правилам и другие последовательные (логические) операции. Поток информации (сигналов) от рецепторов идет параллельно через резисторные элементы матрицы мозга, на выходах которой этот поток уже является сигналами управления исполнительными двигателями объекта управления. Таким образом, быстродействие обучаемых систем управления является практически мгновенным и ограничивается только инерционностью чувствительных элементов рецепторов системы очувствления.
Особенность динамики объекта с обучаемой системой управления. Динамика объекта с обучаемой системой управления характеризуется плавностью движений (плавными разгоном и торможением) и сглаженностью траекторий движения исполнительных органов объекта управления. Это определяется тем, что во время движения объекта ситуация, воспринимаемая его системой очувствления, не может измениться мгновенно и резко. На стробоскопии движения технического глаза при поиске ключа (рис.2.14) видно, что при приближении глаза к целевой ситуации его скорость уменьшается постепенно, пока не станет равной нулю, когда текущая ситуация полностью совпадет с целевой. Кроме этого, инерционность реальных рецепторов, например фоторезисторов, сглаживает резкие изменения освещенности. Значительное число проблем динамики объекта с обучаемой системой управления решает изобретение [75], которое заключается в том, что в систему очувствления обучаемой системы включают рецепторы, имеющие различные постоянные времени возбуждения и спада. Это позволяет учитывать при обучении ситуации, предшествующие текущей с разной степенью отдаления от нее, т.е. обучать торможению или разгону заранее, реализуя упреждение. Динамика технических обучаемых систем управления перекликается с динамикой биологических обучаемых систем. В частности, сглаженность траектории движения биологических систем хорошо видна на затоптанных прямых углах клумб и газонов.
Проявления адаптивности объекта с обучаемой системой управления. Как видно из примеров обучения поиску заданного предмета, обучение робота осуществляется в нескольких наиболее характерных ситуациях, отобранных в обучаемую выборку. Однако в процессе работы возникает множество ситуаций, неучтенных при обучении, и число которых стремится к бесконечности. Тем не менее, движения робота целенаправленны и в этих ситуациях. В отличие от систем, сравнивающих текущую ситуацию с эталонными, обучаемые системы формируют сигналы управления в любой ситуации – в этом заключается основная характеристика их адаптивности. Причем выходные сигналы в любой ситуации носят не вероятностный характер, а имеют строго определенные, детерминированные значения, определяемые весовыми коэффициентами, сформированными во время обучения. Можно сказать, что обучаемые системы – это детерминированные системы, работающие в недетерминированной среде. Поскольку движения объекта с обучаемой системой задаются не в геометрическом пространстве, а определяются поставленной перед ним целью, то результат его действий не зависит ни от люфтов, ни от деформаций механической части объекта. Погрешности управляющих сигналов для одних исполнительных двигателей могут быть компесированы другими. Таким образом, выполнение поставленных задач возможно и на более изношенном оборудовании, оснащенном обучаемой системой управления, что также является важной характеристикой адаптивности этих систем. Если при движении робота к цели возникает сопротивление, сигналы управления начинают возрастать до тех пор, пока сопротивление не будет преодолено (или не сработает защита от перегрузок). Далее, достижение поставленной цели перед роботом, оснащенным обучаемой системой управления со зрением, не зависит от изменения освещенности его рабочей зоны, изменяется только скорость его движений. Кроме этого обучаемые системы управления являются открытыми. В том смысле, что они допускают неограниченное наращивание системы очувствления за счет включения дополнительных рецепторов или органов очувствления с соответствующими им участками преобразующей матрицы, а также допускают неограниченное увеличения количества управляемых исполнительных органов за счет включения дополнительных пар столбцовых шин. После этого необходимо лишь дообучить систему выполнению требуемых задач.
