
- •Технические нервные системы Обучаемые системы управления со зрением для промышленных роботов
- •Оглавление
- •Введение
- •1. Аналитический обзор информационно-управляющих систем промышленных роботов
- •1.1. Современное состояние систем управления роботами, использующих процедуру обучения
- •1.2. Принципы функционирования обучаемых систем управления (технических нервных систем)
- •Павлов Иван Петрович (1849-1936)
- •Пуанкаре (Poincare) Жюль Анри (1854-1912)
- •1.3. Сравнительный анализ адаптивных управляющих систем управления с распознаванием образов и обучаемых систем управления
- •1.4. Анализ вопросов аппаратной реализации систем управления роботами
- •2. Моделирование обучаемых систем управления
- •2.1. Математическое моделирование процесса обучения обучаемой системы управления
- •2.1.1. Алгоритм обучения обучаемой системы управления
- •2.1.2 Алгоритм расчета рецепторных долей сигнала управления
- •2.1.3. Условие сходимости процесса обучения
- •2.2. Закономерности процесса обучения, выявленные с помощью его математической модели
- •2.2.1. Закономерности процесса обучения системы управления для двух ситуаций обучаемой выборки
- •2.2.2. Закономерности процесса обучения системы управления при последовательном предъявлении ситуаций
- •2.2.3. Обучение с масштабированием подобных ситуаций
- •2.2.4. Влияние заданной точности выходных сигналов на продолжительность обучения
- •2.2.5. Влияние отличительности образов ситуаций обучаемой выборки на продолжительность обучения
- •2.2.6. Влияние порядка предъявления ситуаций обучаемой выборки на продолжительность обучения
- •Первый вариант обучения:
- •Второй вариант обучения:
- •2.2.7. Влияние способа дробления входной информации на продолжительность обучения
- •1 Вариант.
- •2 Вариант.
- •2.3. Имитационное моделирование обучения системы управления решению некоторых задач
- •2.3.1. Имитационное моделирование процесса обучения поиску заданного предмета
- •2.3.2. Имитационное моделирование процесса обучения воспроизведению образов
- •2.3.3. Имитационное моделирование процесса обучения распознаванию образов (ситуаций)
- •3. Схемные решения обучаемых систем управления
- •3.1. Командные рецепторы обучаемой системы управления
- •3.2. Обучаемая система управления с внутренними обратными связями
- •3.3. Деление рецепторов обучаемой системы управления на группы
- •3.4. Обучаемая система управления с парными рецепторами
- •3.5. Распределитель выходных сигналов обучаемой системы управления
- •4. Исследование обучаемой системы управления, установленной на робот тур-10к
- •4.1. Выбор параметров обучаемой системы управления для промышленного робота тур-10к
- •4.2. Методика обучения робота тур-10к с обучаемойсистемой управления со зрением поиску заданного предмета среди прочих
- •4.2.1. Разработка методики выбора ситуаций обучаемой выборки для решения задачи поиска заданного предмета
- •4.2.2. Настройка резисторной матрицы обучаемой системы управления и результат обучения
- •4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований
- •5. Реализация обучаемых систем управления
- •5.1. Варианты физической реализации обучаемых систем управления
- •5.2. Варианты электрической реализации обучаемых систем управления
- •5.2.1. Обучаемая система управления с резисторной матрицей из подстроечных резисторов
- •5.2.2. Обучаемая система управления с резисторной матрицей, элементы которой выполнены в виде графитовых соединений
- •5.2.3. Обучаемая система управления с резисторной матрицей, элементы которой выполнены из халькогенидных полупроводников
- •5.3. Обучаемая система управления со зрением для промышленного робота pm-01 (puma)
- •6. Технический подход к проявлениям сложной нервной деятельности
- •6.1. Обучение и самообучение объекта с технической нервной системой
- •6.2. Чувства и эмоции объекта с технической нервной системой
- •6.3. Мышление объекта с технической нервной системой
Павлов Иван Петрович (1849-1936)
Механизм возникновения условных рефлексов следующий. Вначале возникает временная связь между корковым представительством условного раздражителя (образом ситуации) и корковым представительством безусловного раздражителя, затем она закрепляется, и формируется устойчивый условный рефлекс. Существует несколько гипотез о механизмах образования устойчивой временной связи. Одна из наиболее широко распространенных – синаптическая, согласно которой, основой формирования временной связи условного рефлекса является улучшение синаптической проводимости синапсов, участвующих в передаче возбуждения. Таким образом, обучение животных (выработка условных рефлексов) – это увязывание ситуации, воспринимаемой системой очувствления животного, с реакциями его исполнительных органов. Принципы обучения животных положены в основу процесса обучения обучаемых систем управления. Можно сказать, что основная идея разработки обучаемой системы управления – увязать напрямую текущую зрительную информацию о внешней ситуации с сигналами управления исполнительными двигателями робота, минуя процедуру распознавания образов. Рассмотрим основные исходные положения, характерные для функционирования как живых существ, так и объектов, оснащенных обучаемыми системами управления.
Представление информации в обучаемых системах управления. В существующих автоматических системах управления в основном используется параметрическое представление информации, когда в качестве содержания информации выступают искусственно созданные наукой и техникой параметры, например скорость движения, давление, температура и т.д., образующие пространство параметров. Эти параметры являются условными и достаточно произвольными, сложившимися исторически. Так, например, если эталон массы, хранящийся во Французской академии наук, принятый за один килограмм, договориться считать равным одной тонне, то параметр, характеризующий вес любого предмета, возрастет в тысячу раз. Однако физическое воздействие предметов друг на друга от этого не изменится. Для обучаемых систем управления важно не то, каким параметром характеризуется вес предмета, а то, какое воздействие он оказывает на рецепторы объекта управления. Поэтому в обучаемых системах используется признаковая информация [64], т.е. возбуждения рецепторов в виде, например, величины тока на выходах рецепторов, в биологии – ощущения. Если рецептор установлен на весы, то не имеет значения сколько килограммов или тонн (в принятой системе единиц) весит положенный на них предмет, а какое напряжение на выходе рецептора веса (силарецептора) будет при этом. Причем, важна не только величина этого напряжения, а и то, при каком изменении веса напряжение на выходе рецептора будет изменяться. Для обучаемых систем не имеет значения какой параметр и в каком диапазоне отражает отдельный технический рецептор (далее – просто рецептор): температуру, освещенность или давление, – не имеет значения и нелинейность отражения параметра сигналом на выходе рецептора; важно только значение этого сигнала в каждой ситуации. Один параметр может восприниматься несколькими рецепторами; причем, каждый из них может реагировать на изменение параметра по-разному, т.е. снимаются требования по точности рецепторов, линейности зависимости выхода его от значения воздействующего на него параметра. Обучаемые системы функционируют в условиях избыточности информации. Отказ от параметрического представления информации позволяет обезличить рецепторы: для обучаемой системы неважно, чем вызвано возбуждение конкретного рецептора, каким параметром, важна только величина возбуждения этого рецептора в данной ситуации. Рецепторы могут многократно дублировать друг друга, перекрывать диапазоны измерения друг друга, т.е. обучаемые системы могут обрабатывать избыточную информацию. Рецепторы могут быть с узким диапазоном измерения, т.е. реагировать на изменение параметра, если его значение входит в этот диапазон. При достаточном сужении интервала чувствительности они превращаются в индикаторы с выходом типа “да-нет”, тогда их информация имеет бинарный характер. Признаковая нформация часто является неорганизованной, как, например, зрительные образы. Обучаемые системы обладают свойством обратимости – характеристики рецепторов могут быть неодинаковыми, например рецепторы сетчатки технического глаза могут по-разному реагировать на одинаковую освещенность, их расположение в сетчатке и соединение их выходов со строчными шинами преобразующей резисторной матрицы может быть произвольным, поскольку они участвуют как в обучении, так и в работе системы. Использование рецепторов с узким диапазоном измерения параметров является способом дробления информации, который позволяет использовать линейную зависимость выходного сигнала от входных значений. Таким образом, параметрическое представление информации является искусственным, порождено человеческим интеллектом и неадекватно отражает реальную природу. Хотя, строго говоря, человек тоже не пользуется параметрами в своей повседневной жизни. Даже оператор, управляющий каким-либо процессом по величине давления пара в котле, пользуется все-таки признаковой информацией. Он физически не может ощутить давление, например, в 1000 атмосфер, и не может даже представить себе, что это за давление, ведь при давлении более 10 атмосфер он погибает. Поэтому он пользуется признаковой информацией. Признаком при этом является положение стрелки на шкале манометра. Итак, обучаемые системы управления оперируют признаковой информацией, рецепторы системы очувствления обезличены, и их характеристики могут варьировать в широких пределах. Информация системы очувствления может носить избыточный и неорганизованный характер.
Пространство объекта с обучаемой системой управления. Обучаемые системы потребовали замены для объекта управления внешнего геометрического (искусственного, умозрительного) пространства на собственное моторное (реальное) пространство объекта. Функционирование объекта с обучаемой системой управления происходит в моторном пространстве, которое в отличие от геометрического трехмерного пространства имеет столько же координат, сколько исполнительных двигателей у объекта управления, и координатами являются сигналы управления этими двигателями. По определению великого французского ученого А.Пуанкаре [1] “Моторное пространство – это те всем известные ощущения, которыми сопровождаются все наши движения и которые обыкновенно называют мускульными”. Применительно к нервной системе человека А.Пуанкаре отмечал: “Когда я говорю, что мы представляем себе движения, я хочу сказать, что мы представляем себе мускульные ощущения, которые сопровождают их и которые вовсе не имеют геометрического характера, а, следовательно, отнюдь не предполагают предсуществование понятия пространства”, и далее: “И пусть не говорят, что для того, чтобы представить себе движения, которые нужно совершить, их надо проектировать сначала в пространство, и что понятие пространства должно, следовательно, существовать раньше”. Кроме того, Пуанкаре утверждал, что “чувство направления – результат привычки” т.е. обучения, опыта.