4.3. Свойства и особенности обучаемых систем управления, выявленные в результате исследований

В результате исследований были выявлены некоторые свойства и особенности обучаемых систем и процесса их обучения.

Память обучаемых систем управления. Сформированные в результате обучения проводимости резисторных элементов технического мозга отражают все ситуации, использованные в обучаемой выборке, т.е. в обучаемых системах управления нет блока памяти в виде пространственного накопителя информации, в котором бы хранилась информация о каждой отдельной ситуации обучаемой выборки. Память в обучаемых системах управления – это функция технического мозга (а не некое материальное устройство, как в компьютерах), способность формировать требуемые сигналы управления в определенных ситуациях. При этом отсутствует процедура распознавания ситуаций, как предварительная процедура перед формированием правильного сигнала управления. Память обучаемых систем управления – распределенная. Каждый резисторный элемент матрицы мозга определяет свою долю сигнала с соответствующего выхода рецептора в формировании сигнала управления отдельного столбца матрицы мозга для данной ситуации. При достаточной избыточности рецепторов очувствления потеря части элементов мозга не сказывается на работоспособности системы, а при выходе сигнала управления за пределы допустимого эта потеря может быть компенсирована дообучением.

Некоторые правила обучения обучаемых систем. Прежде чем включить обучаемую систему управления в работу, ее необходимо обучить, т.е. настроить регулируемые резисторные элементы технического мозга таким образом, чтобы обеспечить выполнение объектом управления поставленных перед ним задач. При этом методы обучения могут быть различными: динамическое обучение, когда обучение ведется без отключения выходов обучаемой системы управления от исполнительных двигателей объекта управления, а сигналы обучения, изменяющие проводимости элементов мозга, подаются во время движения объекта управления, и статическое обучение с отключением выходов системы от исполнительных двигателей, правильность которого определяется по величинам сигналов управления, измеряемых приборами. Может быть использовано пассивное обучение с многократным циклическим "вождением за руку", когда для обучения используются все возникающие при работе объекта ситуации, или активное обучение, когда обучение ведется в некоторых наиболее характерных для данной задачи ситуациях, составляющих обучаемую выборку. Скорость обучения зависит от правильности подбора ситуаций в обучаемую выборку и от порядка чередования ситуаций при обучении. Обучение можно ускорить, если на каждом шаге обучения определять ситуацию, в которой отношение отклонения сигнала управления к допустимому отклонению этого сигнала в данной ситуации было наибольшим, и проводить очередную корректировку проводимостей элементов матрицы технического мозга именно в этой ситуации.

Практическое обучение робота с обучаемой системой управления со зрением выполнению различных задач позволило выявить ряд общих правил обучения:

1. Терпимость. Это правило заключается в том, что нельзя слишком жестко регламентировать движения робота; важно только, чтобы он выполнял задачу, т.е. достигал целевых ситуаций с требуемой точностью. Допуски же на точность движений робота в остальных ситуациях должны быть максимально широкими.

2. Непротиворечивость. Это правило означает, что сигналы управления в ситуациях обучаемой выборки должны достигаться обучением с заданной точностью. Противоречивость обучения заключается в задании таких сигналов на выходах мозга в ситуациях обучаемой выборки, которые не могут быть сформированы одним и тем же набором проводимостей резисторных элементов технического мозга. Примером противоречивого обучения можно считать требование разных сигналов на выходах мозга в ситуациях, в которых совпадают выходные сигналы рецепторов, подаваемых на строчные шины матрицы технического мозга. Противоречивость можно устранить расширением системы очувствления за счет рецепторов, которые в данных ситуациях будут иметь различные возбуждения.

3. Правило последнего предъявления целевой ситуации. Поскольку требуемая точность сигналов управления в целевых ситуациях наиболее высокая, то предъявление ее последней в процессе обучения является оптимальным, т.к. полученные сигналы не будут искажены следующими шагами обучения.

Свойство обратимости обучаемых систем управления. Обезличенность рецепторов обучаемых систем управления определяет их особенность, которую можно назвать обратимостью. Заключается она в том, что обучение системы идет по тем же самым каналам, по которым в рабочем режиме происходит управление объектом. Эта особенность позволяет снизить требования к элементам системы. Разброс характеристик, например, рецепторов учитывается при обучении и не влияет на качество работы. Нам не важно как возбуждается рецептор системы очувствления под действием раздражения в рабочем режиме, т.к. именно через него шло формирование соответствующих ему весовых коэффициентов (проводимостей резисторных элементов матрицы мозга), и поэтому, возбуждаясь в рабочем режиме так же как и при обучении, он будет выполнять свои функции. Поэтому, если до обучения подсоединение рецепторов к строчным шинам матрицы технического мозга может носить случайный характер, то по окончании обучения переподсоединение их недопустимо. В программируемых системах управления такой обратимости быть не может, ко всем элементам таких систем предъявляются жесткие требования к заданным характеристикам.

Особенность подхода к вопросу точности обучаемых систем управления. Точность позиционирования робота с обучаемой системой управления определяется только разрешающей способностью его системы очувствления и точностью обучения в целевых ситуациях и практически не зависит от погрешностей механической части робота. Например, при движении схвата в сторону целевой ситуации будут автоматически выбираться люфты, компенсироваться погрешности изготовления, упругие и постоянные деформации его частей, т.к. любое отклонение от целевой ситуации, фиксируемое системой очувствления робота, будет формировать сигналы управления приводами до тех пор, пока текущий образ ситуации полностью не совпадет с целевым.

Увеличение разрешающей способности системы очувствления позволяет увеличивать точность позиционирования до предела, определяемого возможностями приводов манипулятора, который, однако, может быть существенно расширен применением дополнительных устройств, например для поступательного движения можно использовать вращение микрометрического винта.

Важно отметить, что ужесточать требования к точности позиционирования следует только в целевых ситуациях и в случае необходимости, т.к. это приводит к увеличению продолжительности обучения. В промежуточных ситуациях обучаемой выборки требования к точности могут быть максимально снижены.

Особенность подхода к надежности обучаемых систем управления. Структура обучаемой системы определяет новый подход к надежности ее работы [63]. Принято считать, что увеличение числа элементов любой системы приводит к снижению надежности ее работы. Это утверждение верно для логических систем, когда выход из строя любого элемента приводит к полному отказу всей системы. Для обучаемых систем – наоборот: чем больше в такой системе элементов, тем надежнее ее работа. Избыточность рецепторов не равнозначна простому дублированию ими друг друга. Каждый рецептор вносит свою долю в общую величину сигнала управления. Эта доля определяется значением его весового коэффициента. Поэтому отказ отдельных рецепторов или искажение их информации приводит к искажению величины сигнала управления. Однако, чем больше избыточность рецепторов, тем меньше сказывается выход из строя отдельных элементов системы на ее работоспособность. Причем, появившаяся погрешность может быть компенсирована дообучением объекта за счет оставшихся рецепторов. Ремонт таких систем практически должен исчезнуть. Его во многом заменит дообучение объекта до требуемых параметров. Таким образом, обучаемые системы управления обладают высокой живучестью, аналогичной живучести биологических систем.

Надежность обучаемых систем управления можно повысить еще больше, используя равномерно-распределенный принцип построения этой системы (рис.4.17).

Рис.4.17. Схема обучаемой системы управления, построенной по равномерно-распределенному принципу

Этот принцип заключается в том, что отдельный выход каждого рецептора разделяется на множество выходов, по которым распределяется сигнал рецептора. Все выходы отдельного рецептора соединены со строчными шинами, равномерно распределенными по матрице мозга. То же самое – со столбцовыми шинами: с каждым входом усилителя или сумматора мозга соединяется множество столбцовых шин, равномерно распределенных по матрице. В микроэлектронном варианте обучаемой системы такое выполнение не приведет к значительному увеличению ее габаритов. Даже удаление целых участков матрицы мозга не повлияет на работоспособность такой обучаемой системы (рис.4.18).

Рис.4.18. Расколовшаяся матрица технического мозга не теряет полностью своей работоспособности

Особенность подхода к вопросу быстродействия обучаемых систем управления. В обучаемых системах отсутствует процедура опроса датчиков, процедуры вычислений по решающим правилам и другие последовательные (логические) операции. Поток информации (сигналов) от рецепторов идет параллельно через резисторные элементы матрицы мозга, на выходах которой этот поток уже является сигналами управления исполнительными двигателями объекта управления. Таким образом, быстродействие обучаемых систем управления является практически мгновенным и ограничивается только инерционностью чувствительных элементов рецепторов системы очувствления.

Особенность динамики объекта с обучаемой системой управления. Динамика объекта с обучаемой системой управления характеризуется плавностью движений (плавными разгоном и торможением) и сглаженностью траекторий движения исполнительных органов объекта управления. Это определяется тем, что во время движения объекта ситуация, воспринимаемая его системой очувствления, не может измениться мгновенно и резко. На стробоскопии движения технического глаза при поиске ключа (рис.2.14) видно, что при приближении глаза к целевой ситуации его скорость уменьшается постепенно, пока не станет равной нулю, когда текущая ситуация полностью совпадет с целевой. Кроме этого, инерционность реальных рецепторов, например фоторезисторов, сглаживает резкие изменения освещенности. Значительное число проблем динамики объекта с обучаемой системой управления решает изобретение [75], которое заключается в том, что в систему очувствления обучаемой системы включают рецепторы, имеющие различные постоянные времени возбуждения и спада. Это позволяет учитывать при обучении ситуации, предшествующие текущей с разной степенью отдаления от нее, т.е. обучать торможению или разгону заранее, реализуя упреждение. Динамика технических обучаемых систем управления перекликается с динамикой биологических обучаемых систем. В частности, сглаженность траектории движения биологических систем хорошо видна на затоптанных прямых углах клумб и газонов.

Проявления адаптивности объекта с обучаемой системой управления. Как видно из примеров обучения поиску заданного предмета, обучение робота осуществляется в нескольких наиболее характерных ситуациях, отобранных в обучаемую выборку. Однако в процессе работы возникает множество ситуаций, неучтенных при обучении, и число которых стремится к бесконечности. Тем не менее, движения робота целенаправленны и в этих ситуациях. В отличие от систем, сравнивающих текущую ситуацию с эталонными, обучаемые системы формируют сигналы управления в любой ситуации – в этом заключается основная характеристика их адаптивности. Причем выходные сигналы в любой ситуации носят не вероятностный характер, а имеют строго определенные, детерминированные значения, определяемые весовыми коэффициентами, сформированными во время обучения. Можно сказать, что обучаемые системы – это детерминированные системы, работающие в недетерминированной среде. Поскольку движения объекта с обучаемой системой задаются не в геометрическом пространстве, а определяются поставленной перед ним целью, то результат его действий не зависит ни от люфтов, ни от деформаций механической части объекта. Погрешности управляющих сигналов для одних исполнительных двигателей могут быть компесированы другими. Таким образом, выполнение поставленных задач возможно и на более изношенном оборудовании, оснащенном обучаемой системой управления, что также является важной характеристикой адаптивности этих систем. Если при движении робота к цели возникает сопротивление, сигналы управления начинают возрастать до тех пор, пока сопротивление не будет преодолено (или не сработает защита от перегрузок). Далее, достижение поставленной цели перед роботом, оснащенным обучаемой системой управления со зрением, не зависит от изменения освещенности его рабочей зоны, изменяется только скорость его движений. Кроме этого обучаемые системы управления являются открытыми. В том смысле, что они допускают неограниченное наращивание системы очувствления за счет включения дополнительных рецепторов или органов очувствления с соответствующими им участками преобразующей матрицы, а также допускают неограниченное увеличения количества управляемых исполнительных органов за счет включения дополнительных пар столбцовых шин. После этого необходимо лишь дообучить систему выполнению требуемых задач.

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829 / 3429 30 31 32 33 34 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025220.7 Кб5Проектирование рельсовой колеи и одиночного обы...docx
#
13.11.2018345.09 Кб7Проектные задания.doc
#
09.04.2015247.3 Кб30Произв. логистика (Федоров).doc
#
01.07.202571.2 Кб3произв.травм..docx
#
01.04.202540.22 Кб2произв.травм..docx
#
01.03.20254.47 Mб2Промышленные и МС Обучаемые системы управления...doc
#
10.12.2018134.14 Кб8Профессионально-прикладная физ. подготовка.DOC
#
09.04.20151.63 Mб21ПС.docx
#
09.04.201535 Кб29психология.docx
#
09.04.201536.42 Кб17психология.docx
#
01.07.202566.47 Кб0птб ефим.docx