- •Технические нервные системы Обучаемые системы управления со зрением для промышленных роботов
- •Оглавление
- •Введение
- •1. Аналитический обзор информационно-управляющих систем промышленных роботов
- •1.1. Современное состояние систем управления роботами, использующих процедуру обучения
- •1.2. Принципы функционирования обучаемых систем управления (технических нервных систем)
- •Павлов Иван Петрович (1849-1936)
- •Пуанкаре (Poincare) Жюль Анри (1854-1912)
- •1.3. Сравнительный анализ адаптивных управляющих систем управления с распознаванием образов и обучаемых систем управления
- •1.4. Анализ вопросов аппаратной реализации систем управления роботами
- •2. Моделирование обучаемых систем управления
- •2.1. Математическое моделирование процесса обучения обучаемой системы управления
- •2.1.1. Алгоритм обучения обучаемой системы управления
- •2.1.2 Алгоритм расчета рецепторных долей сигнала управления
- •2.1.3. Условие сходимости процесса обучения
- •2.2. Закономерности процесса обучения, выявленные с помощью его математической модели
- •2.2.1. Закономерности процесса обучения системы управления для двух ситуаций обучаемой выборки
- •2.2.2. Закономерности процесса обучения системы управления при последовательном предъявлении ситуаций
- •2.2.3. Обучение с масштабированием подобных ситуаций
- •2.2.4. Влияние заданной точности выходных сигналов на продолжительность обучения
- •2.2.5. Влияние отличительности образов ситуаций обучаемой выборки на продолжительность обучения
- •2.2.6. Влияние порядка предъявления ситуаций обучаемой выборки на продолжительность обучения
- •Первый вариант обучения:
- •Второй вариант обучения:
- •2.2.7. Влияние способа дробления входной информации на продолжительность обучения
- •1 Вариант.
- •2 Вариант.
- •2.3. Имитационное моделирование обучения системы управления решению некоторых задач
- •2.3.1. Имитационное моделирование процесса обучения поиску заданного предмета
- •2.3.2. Имитационное моделирование процесса обучения воспроизведению образов
- •2.3.3. Имитационное моделирование процесса обучения распознаванию образов (ситуаций)
- •3. Схемные решения обучаемых систем управления
- •3.1. Командные рецепторы обучаемой системы управления
- •3.2. Обучаемая система управления с внутренними обратными связями
- •3.3. Деление рецепторов обучаемой системы управления на группы
- •3.4. Обучаемая система управления с парными рецепторами
- •3.5. Распределитель выходных сигналов обучаемой системы управления
- •4. Исследование обучаемой системы управления, установленной на робот тур-10к
- •4.1. Выбор параметров обучаемой системы управления для промышленного робота тур-10к
- •4.2. Методика обучения робота тур-10к с обучаемойсистемой управления со зрением поиску заданного предмета среди прочих
- •4.2.1. Разработка методики выбора ситуаций обучаемой выборки для решения задачи поиска заданного предмета
- •4.2.2. Настройка резисторной матрицы обучаемой системы управления и результат обучения
- •4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований
- •5. Реализация обучаемых систем управления
- •5.1. Варианты физической реализации обучаемых систем управления
- •5.2. Варианты электрической реализации обучаемых систем управления
- •5.2.1. Обучаемая система управления с резисторной матрицей из подстроечных резисторов
- •5.2.2. Обучаемая система управления с резисторной матрицей, элементы которой выполнены в виде графитовых соединений
- •5.2.3. Обучаемая система управления с резисторной матрицей, элементы которой выполнены из халькогенидных полупроводников
- •5.3. Обучаемая система управления со зрением для промышленного робота pm-01 (puma)
- •6. Технический подход к проявлениям сложной нервной деятельности
- •6.1. Обучение и самообучение объекта с технической нервной системой
- •6.2. Чувства и эмоции объекта с технической нервной системой
- •6.3. Мышление объекта с технической нервной системой
2.2.7. Влияние способа дробления входной информации на продолжительность обучения
Признаковое представление информации позволяет использовать дробление выходного сигнала датчика с широким диапазоном измерения параметра, охватывающего весь диапазон его изменения, на узкие интервалы изменения параметра и установление для каждого интервала своего весового коэффициента, что соответствует кусочно-линейной аппроксимации зависимости сигнала управления исполнительным двигателем от значений входных параметров. Дробление информации может быть различным: простым, когда диапазон измерения разбивается на равные интервалы; разрядным, когда диапазон измерения разбивается на разряды: единицы, десятки, сотни и т.д.; переменным, когда диапазон измерения разбивается более часто в рабочем интервале изменения параметра и менее часто в нерабочих интервалах; другие виды дробления. Рассмотрим влияние дробления информации на скорость обучения системы управления. Допустим, сигнал управления отдельным исполнительным двигателем в j-й ситуации связан с тремя параметрами нелинейной зависимостью:
Ej = a1j + a2j2 + a3j3 .
В качестве системы очувствления использованы три датчика с широким диапазоном измерения. При этом, сигнал управления будет связан с показаниями датчиков b зависимостью:
Ej = b1j + b2j2 + b3j3 .
Для использования обучаемой системы управления эту зависимость необходимо привести к виду (2.1), т.е. при отсутствии дробления показаний датчиков сигнал управления определится как:
Ej = c1b1j + c2b2j + c3b3j .
Процесс обучения заключается в циклическом переборе ситуаций обучаемой выборки и определении коэффициентов ci на каждом шаге обучения по алгоритму (2.5).
В обучаемую выборку входят три ситуации:
1) b11 = 3 ; _ b21 = 2 ; _ b31 = 1 ; __ сигнал управления E1 = 8 ; 2) b12 = 3 ; _ b22 = 3 ; _ b32 = 2 ; __ сигнал управления E2 = 20 ; 3) b13 = 2 ; _ b23 = 4 ; _ b33 = 3 ; __ сигнал управления E3 = 45 .
Обучение считается законченным, если фактическое значение сигнала управления не выходит за пределы допустимого: Ej + E (принимаем E = 0,1). Для определения степени адаптивности использованы контрольные ситуации:
4) b14 = 1 ; _ b24 = 3 ; _ b34 = 3 ; __ сигнал управления E4= 37 ; 5) b15 = 2 ; _ b25 = 4 ; _ b35 = 1 ; __ сигнал управления E5 = 19 .
Число циклов обучения без использования дробления параметров составило: t = 7817. Получены следующие значения весовых коэффициентов: c1 = –12,856242; c2 = 34,468731; c3 = –22,368735, которые обеспечивают следующие фактические значения сигналов управления в контрольных ситуациях: Ef4 = 1,075011; Ef5 = –15,881226.
Для различных вариантов дробления информации результаты обучения имеют вид:
1 Вариант.
Этот вариант дробления параметров заключается в следующем: диапазон изменения параметра разбивается на интервалы, соответствующие единице измерения параметра. Если значение параметра перекрывает данный интервал или входит в него, то значение признака, соответствующего этому интервалу, принимаем равным единице, в противном случае значение признака равно нулю.
Ситуации обучаемой выборки (верхний индекс в скобках – номер дробимого параметра, первый нижний индекс – номер полученного в результате дробления обезличенного признака, второй нижний индекс – номер ситуации): 1) b1,1(1)=1; _b2,1(1)=1; _b3,1(1)=1; _b4,1(2)=1; _b5,1(2)=1; _b6,1(2)=0; _b7,1(2)=0; _b8,1(3)=1; _b9,1(3)=0; _b10,1(3)=0; __сигнал управления E1 = 8; 2) b1,2(1)=1; _b2,2(1)=1; _b3,2(1)=1; _b4,2(2)=1; _b5,2(2)=1; _b6,2(2)=1; _b7,2(2)=0; _b8,2(3)=1; _b9,2(3)=1; _b10,2(3)=0; __сигнал управления E2 = 20; 3) b1,3(1)=1; _b2,3(1)=1; _b3,3(1)=0; _b4,3(2)=1; _b5,3(2)=1; _b6,3(2)=1; _b7,3(2)=1; _b8,3(3)=1; _b9,3(3)=1; _b10,3(3)=1; __сигнал управления E3 = 45.
Контрольные ситуации: 4) b1,4(1)=1; _b2,4(1)=0; _b3,4(1)=0; _b4,4(2)=1; _b5,4(2)=1; _b6,4(2)=1; _b7,4(2)=0; _b8,4(3)=1; _b9,4(3)=1; _b10,4(3)=1; __сигнал управления E4 = 32,892045; 5) b1,5(1)=1; _b2,5(1)=1; _b3,5(1)=0; _b4,5(2)=1; _b5,5(2)=1; _b6,5(2)=1; _b7,5(2)=1; _b8,5(3)=1; _b9,5(3)=0; _b10,5(3)=0; __сигнал управления E5 = 29,729593.
Число циклов обучения: t=26. Весовые коэффициенты признаков: c1 = 2,880595; ___ c2 = 2,880595; ___ c3 = –6,402976; ___ c4 = 2,880595; ___ c5 = 2,880595; ___ c6 = 6,043047; ___ c7 = 9,283571; ___ c8 = 2,880595; ___ c9 = 6,043047; ___ c10 = 9,283571.
Фактические значения сигналов управления в контрольных ситуациях: Ef4 = 32,892045, ошибка Ef4 = 4,107955; ___Ef5 = 29,729593, ошибка Ef5 = 10,729593.
