- •Технические нервные системы Обучаемые системы управления со зрением для промышленных роботов
- •Оглавление
- •Введение
- •1. Аналитический обзор информационно-управляющих систем промышленных роботов
- •1.1. Современное состояние систем управления роботами, использующих процедуру обучения
- •1.2. Принципы функционирования обучаемых систем управления (технических нервных систем)
- •Павлов Иван Петрович (1849-1936)
- •Пуанкаре (Poincare) Жюль Анри (1854-1912)
- •1.3. Сравнительный анализ адаптивных управляющих систем управления с распознаванием образов и обучаемых систем управления
- •1.4. Анализ вопросов аппаратной реализации систем управления роботами
- •2. Моделирование обучаемых систем управления
- •2.1. Математическое моделирование процесса обучения обучаемой системы управления
- •2.1.1. Алгоритм обучения обучаемой системы управления
- •2.1.2 Алгоритм расчета рецепторных долей сигнала управления
- •2.1.3. Условие сходимости процесса обучения
- •2.2. Закономерности процесса обучения, выявленные с помощью его математической модели
- •2.2.1. Закономерности процесса обучения системы управления для двух ситуаций обучаемой выборки
- •2.2.2. Закономерности процесса обучения системы управления при последовательном предъявлении ситуаций
- •2.2.3. Обучение с масштабированием подобных ситуаций
- •2.2.4. Влияние заданной точности выходных сигналов на продолжительность обучения
- •2.2.5. Влияние отличительности образов ситуаций обучаемой выборки на продолжительность обучения
- •2.2.6. Влияние порядка предъявления ситуаций обучаемой выборки на продолжительность обучения
- •Первый вариант обучения:
- •Второй вариант обучения:
- •2.2.7. Влияние способа дробления входной информации на продолжительность обучения
- •1 Вариант.
- •2 Вариант.
- •2.3. Имитационное моделирование обучения системы управления решению некоторых задач
- •2.3.1. Имитационное моделирование процесса обучения поиску заданного предмета
- •2.3.2. Имитационное моделирование процесса обучения воспроизведению образов
- •2.3.3. Имитационное моделирование процесса обучения распознаванию образов (ситуаций)
- •3. Схемные решения обучаемых систем управления
- •3.1. Командные рецепторы обучаемой системы управления
- •3.2. Обучаемая система управления с внутренними обратными связями
- •3.3. Деление рецепторов обучаемой системы управления на группы
- •3.4. Обучаемая система управления с парными рецепторами
- •3.5. Распределитель выходных сигналов обучаемой системы управления
- •4. Исследование обучаемой системы управления, установленной на робот тур-10к
- •4.1. Выбор параметров обучаемой системы управления для промышленного робота тур-10к
- •4.2. Методика обучения робота тур-10к с обучаемойсистемой управления со зрением поиску заданного предмета среди прочих
- •4.2.1. Разработка методики выбора ситуаций обучаемой выборки для решения задачи поиска заданного предмета
- •4.2.2. Настройка резисторной матрицы обучаемой системы управления и результат обучения
- •4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований
- •5. Реализация обучаемых систем управления
- •5.1. Варианты физической реализации обучаемых систем управления
- •5.2. Варианты электрической реализации обучаемых систем управления
- •5.2.1. Обучаемая система управления с резисторной матрицей из подстроечных резисторов
- •5.2.2. Обучаемая система управления с резисторной матрицей, элементы которой выполнены в виде графитовых соединений
- •5.2.3. Обучаемая система управления с резисторной матрицей, элементы которой выполнены из халькогенидных полупроводников
- •5.3. Обучаемая система управления со зрением для промышленного робота pm-01 (puma)
- •6. Технический подход к проявлениям сложной нервной деятельности
- •6.1. Обучение и самообучение объекта с технической нервной системой
- •6.2. Чувства и эмоции объекта с технической нервной системой
- •6.3. Мышление объекта с технической нервной системой
2. Моделирование обучаемых систем управления
Основой моделирования обучаемых систем управления является разработка математической модели процедуры ее обучения.
2.1. Математическое моделирование процесса обучения обучаемой системы управления
2.1.1. Алгоритм обучения обучаемой системы управления
Процесс обучения, заключающийся в формировании проводимостей регулируемых резисторных элементов преобразующей матрицы, аналогичен формированию условных рефлексов в живой природе. Если в какой-либо ситуации сигнал управления отдельным исполнительным органом не удовлетворяет обучателя, он подает обучающий сигнал на соответствующий столбец резисторной матрицы. Это можно осуществить, например, нажимая кнопку из токопроводящей резины, в виде которой выполнен элемент коммутации распределителя сигналов обучения. Чем сильнее усилие нажатия кнопки, тем больше значение обучающего сигнала, подаваемого на соответствующие преобразователи проводимостей резисторных элементов. При этом может исказиться сигнал управления данным исполнительным органом в другой ситуации. Его аналогично корректируют до требуемой величины. Затем переходят к следующей ситуации, соответствующей очередному шагу обучения. Проведя обучение во всех ситуациях обучаемой выборки, снова возвращаются к первой и т.д. Как говорится, повторение – мать учения. Примем, что в любой ситуации сигнал управления отдельным исполнительным органом определится как
где j – номер ситуации; m – общее количество рецепторов; bij – возбуждение i-го рецептора в j-ой ситуации; ci – весовой коэффициент i-го рецептора. Задача обучения сводится к определению весовых коэффициентов ci. В реальных условиях, когда в общем случае не определено общее количество ситуаций решаемой задачи, определение значений ci может быть только итерационным, т.е. путем постепенного приближения. Именно в этом состоит процесс обучения. Он позволяет определить поправку всех весовых коэффициентов ci на очередном шаге обучения с учетом ошибки Ej , определяемой как разность между желаемым и действительным значениями сигнала управления. Эту ошибку определяет обучатель. Так как все рецепторы системы очувствления обезличены, то в процессе обучения не может осуществляться индивидуальная корректировка каждого из них. Корректировка должна проводиться общей для всех рецепторов командой. Принципом корректировки весовых коэффициентов рецепторов является изменение их значений пропорционально общей ошибке Ej и возбуждению каждого рецептора bij:
ci = Kj · Ej · bij ,__________________(2.2)
где Kj – общая команда на корректировку в j-ой ситуации.
Если задаться целью сведения ошибки Ej после обучения на данном шаге к нулю, то очевидно
Команда Kj определится из совместного решения (2.2) и (2.3):
Подставляя (2.4) в (2.2), получим выражение для определения поправки весового коэффициента каждого рецептора
Таким образом, на каждом t-м шаге обучения значение i-ого весового коэффициента определится выражением:
Выражения (2.1) и (2.6) составляют вычислительную модель обучаемой системы управления. Вычислительная модель может использоваться в качестве универсального алгоритма управляющих вычислительных машин (микропроцессоров и в том числе ЧПУ), работающих в режиме обучаемых систем управления. Схема алгоритма расчета весовых коэффициентов представлена на рис.2.1. В блок-схеме алгоритма r – показатель, по которому определяется, для всех ли ситуаций обучаемой выборки фактические выходные сигналы входят в пределы допустимых отклонений E (в этом случае r = 0).
Рис.2.1.
Алгоритм расчета весовых коэффициентов
С математической точки зрения данный алгоритм (рекуррентный алгоритм Качмажа) не самый оптимальный по числу необходимых итераций. Однако особенность его в том, что, как здесь было показано, он вытекает из процедуры обучения и отражает реальный процесс обучения обучаемых систем, в том числе и биологических. Другими словами, использование данного алгоритма в обучаемых системах определяется не выбором его из многих возможных, а является результатом математической формализации процедуры обучения.
