aj (nJr \) = aj (ri) + K*[x— b(xk, п)]тdb <'Xk’ w) x
|
|
|
|
|
|
|
|
|
|
dxk |
|
|
/vp |
|
|
|
|
|
В |
|
|
X |
|
S |
|
Я , |
|
о |
|
X |
|
|
|
|
|
|
|
1 + 2 а/ (n) — |
arctg В |
2 a‘i («) x‘ (”) — *p |
|
|
|
|
|
|
|
t= 0 |
|
|
|
|
|
|
X arctg В |
N |
|
(8-13) |
|
|
|
|
|
2 +7 (») +• («) |
|
|
|
|
|
|
|
|
i=0 |
|
|
|
|
% ( « + !) = fly («) + |
*[Jt— &(**. л)1т |
db (xk, n) X |
|
|
|
|
|
|
|
|
|
|
dxk |
|
|
Кn |
|
|
|
|
|
В2а,- («) Xf (n) |
|
|
X |
У |
|
|
|
|
2 |
X |
|
7 |
|
|
я, |
|
|
Г я |
|
|
|
|
|
|
|
|
|
в 1+ 2 ai |
№ |
I T arctgB |
2 a‘i W X{ ~ kP |
|
|
Г |
1 |
/ = l |
|
|
|
|
L t'= o |
|
|
|
|
|
X |
|
N |
|
(8-14) |
|
|
|
|
|
1+ |
|
|
|
|
|
|
|
|
|
B 2 a‘i (") ** (”) |
|
|
|
|
|
|
|
|
;=o |
|
|
b(xk, n + l ) = b(xk, n) + K***[x — b(xk, n)]. (8-15)
Алгоритм был реализован на ЦВМ и представляет собой последовательность следующих этапов:
1) в память ЦВМ вводятся случайные или определен ные начальные значения координат центров классов и на
страиваемых коэффициентов данной |
двухслойной СР; |
2 ) производится подсчет векторов |
db (хк)/дхк, |
3)на вход СР поступает образ х;
4)по данному х и состоянию многослойной СР в данный момент времени вычисляется значение хк,
5)выбираются векторы b (л:*) и db (xk)/dxk, соответст вующие данному хк\
6 ) с использованием результатов пп. 3, 5 вычисляются новые значения настраиваемых коэффициентов СР и цент ров классов;
7) при подаче на вход следующего образа повторяется алгоритм по пп. 4—6 ;
8 ) после нахождения локального экстремума алгоритм повторяется по пп. 1—7.
На рис. 8-39 представлены лиции равного значения плот ности распределения / (х), используемой при исследовании данного алгоритма. Оптимальные значения настраиваемых
коэффициентов |
ЛПЭ |
первого слоя данной СР: а1г — 9; |
а 1 2 — 15:> а13 =: |
2 1 ; |
аи = |
1 ;I |
# 2 2 |
~ 1 |
; |
1> а31 |
— 1 |
; |
1’> |
а34 |
— 1 . |
Рис. 8 -39. Линии равных зна-
чений плотности распределе ния f (х).
1 — оптимальное положение разде ляю щ их гиперплоскостей; 2 — л и нии равного значения плотности распределения входного сигнала для различных дисперсий распре делений, представляю щ их моды / (х).
ЛПЭ второго слоя с /Ср = 5 решениям должен реализо вать логическую функцию, представленную в табл. 8 -6 . Условием формирования правильного решения xk является формирование соответствующего промежуточного значе ния аналогового выходного сигнала g (п) = xk — 0,5. На основании этого может быть составлена система алгебраи-
Т а б л и ц а 8 - 6
xk |
1 |
% |
3 |
4 |
5 |
4 i |
— 1 |
1 |
1 |
l |
1 |
Xk2 |
— 1 |
— 1 |
1 |
l |
1 |
Чз |
— 1 |
— 1 |
— 1 |
i |
1 |
xkl |
— 1 |
— 1 |
— 1 |
— 1 |
1 |
ческих уравнений для определения оптимальных коэффи циентов ЛПЭ второго слоя:
— at—а 2—а3—а4 + |
2,5 = |
0,5; |
a i— а 2— аз— а* + |
|
2,5 = |
1,5; |
а1 + |
а2 — а3 — а4 |
+ |
2,5 |
= |
2,5; |
а 4 + |
а 2 + а3 — о4 |
+ |
2,5 |
= |
3,5; |
а\ а 2 + аз + а4 |
|
2,5 = |
4,5. |
Отсюда |
|
|
|
|
|
| |
а1 = |
й2 = а3 = а4 = |
0,5. |
|
Эксперименты на ЦВМ с рассматриваемой двухслойной СР проводились в соответствии со следующим планом:
1. Эксперимент с различными дисперсиями распределе ний, составляющих моды / ( х ) (рис. 8-39).
2. Коэффициенты ЛПЭ второго слоя оптимальны, зна чения центров классов оптимальны. Для коэффициентов ЛПЭ первого слоя задавались следующие различные ус ловия:
а) коэффициенты ЛПЭ первого слоя оптимальны;
б) |
начальные |
значения |
коэффициентов |
ЛПЭ |
первого |
слоя |
задавались |
с равным |
отклонением от оптимальных; |
в) |
начальные |
значения |
коэффициентов |
ЛПЭ |
первого |
слоя задавались с различными по величине и по знаку от клонениями от оптимальных.
3. Коэффициенты ЛПЭ второго слоя оптимальны; при неоптимальных начальных значениях центров классов про водились эксперименты, аналогичные пп. 2 а и 26.
4.Коэффициенты ЛПЭ первого слоя и значения центров классов оптимальны. Начальные значения коэффициентов ЛПЭ второго слоя не оптимальны.
5.Эксперименты, аналогичные п. 3, но с неоптималь ными начальными значениями центров классов.
6 . Коэффициенты ЛПЭ первого и второго слоя и значе ния центров классов не оптимальны.
7. Все перечисленные выше эксперименты проводились при различных, недетерминированных начальных условиях. Завершающим явился эксперимент со случайными началь ными условиями на коэффициенты ЛПЭ и центры классов.
Эксперимент п. 1а показал устойчивость двухслойной СР в глобальном экстремуме специальной средней функции риска. Для случая, когда начальные значения коэффициентов
ЛПЭ обоих слоев оптимальны, а центры классов не опти мальны, результаты эксперимента приведены на рис. 8-40. Для случая, когда начальные значения коэффициентов ЛПЭ первого слоя были не оптимальны, а начальные значения коэффициентов ЛПЭ второго слоя и значе ния центров классов опти мальны, результаты экспе римента ' приведены на рис. 8-41. Как видно из ре зультатов данного экспери мента, выбранное располо жение мод плотности рас-
Рис. 8-40. Динамика настройки по координатам центров клас сов.
Рис. 8-41. Результаты исследования двухслойной СР в режиме самообучения.
—----------------------- |
— н ачальн ое полож ение ги п ерплоскостей ; |
— оп ти м альн ое |
полож ен ие ги п ерплоскостей ; |
— ---------------- |
-------------------------------- |
---------------- п олож ен ие ги п ерп лоскостей че |
пределения входного сигнала делает гиперплоскости (/, II, III, IV) мало чувствительными к повороту. Здесь при срав нительно большом диапазоне угла поворота плоскостей величина функционала качества не изменяется (при усло вии неизменного порога а 1;). Этот факт, очевидный из фи зических соображений, подтверждается экспериментом. Приведенные рассуждения позволяют считать целесообраз-
Рис. 8-42. Результаты исследования двухслой ной СР в режиме самообучения.
1 — н ачальн ое полож ен ие гиперп лоскостей ; I I — оп ти |
|
м альн ое полож ен ие ги п ерп лоскостей ; |
II I — п олож ен ие |
|
ги п ерп лоскостей через 3 000 |
и тераций . |
|
ным в дальнейшем при данном расположении мод / (х) |
ис |
следование лишь динамики настройки порогов ац (/ = |
1, |
2, 3, 4) и только в отдельных исключительных случаях исследовать также и динамику настройки коэффициентов наклона гиперплоскостей.
Для случая, когда начальные значения коэффициентов ЛПЭ второго слоя оптимальны, а начальные значения ко эффициентов ЛПЭ первого слоя и значения центров классов брались с одинаковыми по величине отклонениями в одну сторону (отклонения отрицательны), результаты экспери-
Рис. 8-43. Результаты исследования двухслойной СР в ре жиме самообучения.
/ —4 ™ конечные положения гиперплоскостей, реализуемых ЛПЭ1 — ЛПЭ4 первого слоя соответственно.
мента приведены на рис. 8-42. Динамика настройки поро гов приведена на рис. 8-43 (сплошная линия). В случае по ложительных отклонений динамика настройки также про иллюстрирована на рис. 8-43 (штрих-пунктирная линия). Для случая, когда начальные значения коэффициентов ЛПЭ второго слоя оптимальны, а начальные значения ко эффициентов ЛПЭ первого слоя и центров классов брались с различными по величине и знаку отклонениями от опти-
Рис. 8-44. Результаты исследования двухслойной СР
врежиме самообучения.
/— начальное положение гиперплоскостей; II — оптимальное положение гиперплоскостей; III — положение гиперплоскостей
после 3 000 итераций.
мальных, результаты эксперимента приведены на рис. 8-43 (пунктир) и 8-44.
Цель эксперимента п. 6 состояла в выяснении влияния дисперсии распределений, представляющих моды fx (х), на качество распознавания. Эксперименты этой группы проводились при одних и тех же начальных условиях (типа
начальных условий |
эксперимента, |
представленного на |
рис. 8-42) и различных дисперсиях а 2 (рис. 8-45). |
Сравнивая результаты экспериментов этой группы, |
можно сделать вывод |
о том, что для |
данного расстояния |
между модами плотности распределения входного сигнала задача самообучения может быть решена для а„акс = 1,5 . Этот экспериментальный факт имеет ясное физическое обо-
Рис. 8-45. Результаты исследования двухслойной СР в ре жиме самообучения.
------------а2 = 1 ; |
----------------------- с 2 = 1,5; |
— ---------- |
о2 = 2; |
----------- |
а 2 = 2,5. |
|
|
снование, так как при большом а 2 (сильно пересекающиеся классы) невозможно выделить группы локально сосредото ченных объектов и, следовательно, методы самообучения (на данном этапе своего развития), основанные на выделе нии таких групп, оказываются неработоспособными.
ООО 800 1200 WOO 2000 2000 2800 32003600 0000
Рис. 8-46. Результаты исследования двухслойной СР в режиме самообучения.
Рис. 8-47. Результаты исследования двухслойной СР в режиме самообучения.
/, I I , I I I , IV —номера соответствующих ЛПЭ первого слоя;
---------- — оптимальное |
положение |
гиперплоскостей; |
------------------- — начальное положение; |
— • — --------- |
полож е |
ние |
после 5 000 итераций. |
|
Для случая, когда начальные значения коэффициентов ЛПЭ первого слоя и начальные значения центров классов оптимальны, а начальные значения коэффициентов ЛПЭ второго слоя не оптимальны, динамика процесса настройки
|
|
|
|
|
|
|
|
|
|
коэффициентов ЛПЭ второго слоя |
и результаты экспери |
|
мента |
|
представлены |
на |
|
|
|
рис. 8-46. Все экспери |
|
|
|
менты были проведены при |
|
|
|
памяти |
системы |
тп — 1. |
|
|
|
В этом |
смысле |
следует |
|
|
|
учесть тот факт, |
что |
уве |
|
|
|
личение |
памяти, |
вообще |
|
|
|
говоря, уменьшает случай |
|
|
|
ную |
ошибку |
измерения. |
|
|
|
К технической стороне реа |
|
|
|
лизации |
алгоритмов |
сле |
|
|
|
дует |
добавить, |
что крите |
|
|
|
рием |
остановки |
процесса |
|
|
|
являлось вхождение |
кри |
Рис. 8-48. Результаты исследова |
|
вых в «трубку» |
диаметром |
|
ния |
двухслойной СР в режиме |
|
0,2 (рис. 8-46) |
|
и длиной |
|
самообучения. |
|
500 итераций. |
|
|
|
1—4 — номера соответствующих ЛПЭ |
|
Эксперимент иллюстри |
|
первого слоя. |
руется рис. 8-47.
На рис. 8-48 представлены результаты работы двухслой ной СР в режиме самообучения с несколько другим видом типовой плотности fx (х).
8-11. О некоторых инженерных методах выбора параметров матриц в алгоритмах настройки многослойных СР по замкнутому циклу
При построении алгоритмов настройки СР по замкну тому циклу с оценкой только первой производной функ ционала оптимизации вряд ли мы будем иметь информацию для того, чтобы сделать матрицу К* недиагональной. В простейшем случае это единичная матрица, умноженная на постоянный или переменный во времени, как в методе стохастической аппроксимации, коэффициент. Правда уже сейчас, как показано выше в экспериментах, есть основа ния этот коэффициент делать различным для настройки коэффициентов различных слоев многослойной СР. Как указывалось в гл. 7, основная цель применения методов стохастической аппроксимации заключается в обеспечении