- •Вопросы на экзамен по дисциплине «Системы искусственного интеллекта»
- •1. Определение интеллектуальной системы (ис). Основные направления развития ис.
- •2. Естественный нейрон. Описание принципа функционирования. Нервная система человека как трехступенчатая схема.
- •3. Определения формального и искусственного нейрона, искусственной нейронной сети. Функции активации искусственного нейрона.
- •4. Персептрон Розенблатта. Описание и принцип функционирования.
- •5. Математическая модель персептрона Розенблатта. Обучение персептрона Розенблатта.
- •6. Общая схема обучения нейронных сетей. Обучение однослойной нейронной сети с учителем.
- •7. Общие понятия про системы распознавания образов. Принципы и методологии распознавания образов.
- •8. Определения данных и знаний. Этапы представления данных и знаний.
- •9. Модели представления знаний.
5. Математическая модель персептрона Розенблатта. Обучение персептрона Розенблатта.
Рассмотрим математическую модель персептрона:
1. В рецепторном поле образуется сигнал, соответствующий внешнему раздражителю, который изображается некоторым вектором х.Розенблатт отмечает, что каждое нервное окончание передает достаточно простой сигнал — либо посылает импульс, либо не посылает его. Это означает, что векторхбинарный, т. е. его координаты могут принимать только два значения: 0 и 1.
2. Набор импульсов распространяется до тех пор, пока с помощью нейронов второго слоя не будет преобразован в новый набор импульсов (бинарный вектор xпреобразуется в бинарный векторy).Розенблатт уточняет характер преобразованийу =f(x):
а) преобразование осуществляется пороговыми элементами;
б) входы преобразующих пороговых элементов соединены с рецепторами случайно.
3. Считается, что персептрон относит входной вектор к p-му понятию, если возбуждаетсяp-й реагирующий нейрон и не возбуждаются другие реагирующие нейроны. Формально это означает, что для векторавыполняется система неравенств:
В этих неравенствах —коэффициенты усиленияt-го реагирующего нейрона.
4. Формирование понятий в схеме Розенблатта сводится к образованию коэффициентов (весов) каждого из элементов R.Процедура построения весов элементовRтакова.
Пусть к данному моменту существуют некоторые веса элементов Rивесар-го элемента.В момент временидля классификации на вход персептрона поступает сигнал, описываемый вектором. Векторможет либо соответствовать понятиюp,либо не соответствовать ему. Рассмотрим оба этих случая.
Случай первый.Векторхсоответствует понятиюр.Тогда правильной реакцией элементана сигналхдолжно быть возбуждение, т. е. должно выполняться неравенство
.
Если веса элемента обеспечивают правильную реакцию на векторx, то они не меняются. Если же веса не обеспечивают правильной реакции элемента,т. е. они таковы, что
то веса элемента изменяются по правилу
Случай второй.Векторхне соответствует понятиюр.Тогда элементне должен возбудиться, т. е. должно выполниться неравенство
Если веса элемента обеспечивают правильную реакцию этого элемента на векторх,то они не меняются. Если же веса элементане обеспечивают правильной реакции, т.е.
то веса изменяются по правилу
При обучении аналогично меняются веса всех элементов Rперсептрона.
Розенблатт надеялся, что его персептрон моделирует существенные черты человеческого восприятия, в особенности восприятия зрительных образов. Он полагал, что персептрон легко можно будет обучить узнаванию одного и того же изображения независимо от масштаба изображения, существенных сдвигов его в рецепторном поле и других преобразований, при которых человек относит изображение к одному и тому же понятию. Иными словами, предполагалось, что персептрон будет узнавать предметы инвариантно по отношению к определенным группам преобразований.
В действительности же теоретические и экспериментальные исследования персептрона Ф. Розенблатта показали его неспособность к такому обобщению.
Последовали всевозможные усложнения схемы персептрона. Строились персептроны с большим числом нейронных слоев, допускалась настройка коэффициентов усиления не только на верхнем слое, но и на промежуточных уровнях, предлагалось вводить перекрестные и обратные связи.
Теоретическое исследование таких сложных персептронных схем чрезвычайно затруднительно. На практике же при распознавании зрительных образов эти модели оказались малоэффективными, в конце концов, от них пришлось отказаться и пойти другим путем.
Основная идея нового направления состоит в том, чтобы, опираясь на известные свойства зрительных образов, найти такую систему признаков или, общее, такой язык описания изображения, которые уже сами по себе обеспечивают инвариантность по отношению к требуемым преобразованиям. Таким образом, при построении обучающегося устройства закладываются априорные сведения относительно того, по каким именно преобразованиям должна достигаться инвариантность.
Если предположить, что физиологическая модель человеческого восприятия действительно аналогична персептрону, то следует допустить, что связи преобразующих 4-элементов с рецепторами (а вероятнее, нескольких слоев таких элементов) отнюдь неслучайны, а построены именно так,чтобы обеспечить новое описание изображения, содержащее уже требуемые инварианты. Математически это означает, что преобразование
таково, что среди координат вектора уесть такие, которые не меняются при определенных преобразованиях векторах.
Возможно, что человек вовсе и не учится находить эти инварианты. Способность использовать их дана ему от рождения и заложена в «схеме» зрительного анализатора, возникшего в процессе эволюции. Во всяком случае эксперименты с персептронами, где в процессе обучения выбиралось и отображение ,не доказали способности персептрона к выработке такого рода инвариантов.
Поэтому, оставляя в стороне вопрос о том, как устроено отображение, будем рассматривать более общую схему персептрона. Будем считать, что дано некоторое преобразование или, в координатной форме,
.
Здесь х —входной вектор, соответствующий исходному описанию объекта. Преобразованиеставит ему в соответствие некоторое новое описаниеу.Это преобразование выбирается до начала обучения и может быть построено на основании известных сведений о природе данной задачи распознавания.
Координаты вектора утеперь в общем случае — действительные числа, не обязательно 0 или 1.
Для простоты будем считать, что различаются всего два понятия. Тогда персептрон отнесет вектор х кпервому понятию, если выполнится неравенство
(8.2) |
а в противном случае — ко второму.
Такая схема имеет простую геометрическую интерпретацию: в пространстве Хзадана гиперповерхность
(8.3) |
которая делит пространство на два полупространства. Считается, что если вектор хнаходится по одну сторону от поверхности (это значит, что для него выполняется неравенство (8.2)), то он соответствует первому понятию, если же по другую от нее сторону, то второму. Такие гиперповерхности называются разделяющими (рис. 8.2).
Рис. 8.2.
Для образования нового понятия надо построить соответствующую разделяющую гиперповерхность. Каждой гиперповерхности (8.3) пространства Хв пространствеYс координатамисоответствует гиперплоскость
(8.4) |
Введение пространства Yпозволяет заменять рассмотрение разделяющих гиперповерхностей (8.3) разделяющими гиперплоскостями (8.4). Поэтому пространство векторовYполучило название спрямляющего. В спрямляющем пространстве изучается следующая схема. Каждому объекту ставится в соответствие вектор. Этот вектор относится к первому классу, если он лежит по одну сторону от разделяющей гиперплоскости
,
и ко второму, если по другую.