Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОНС / лабораторные работы / Методички / НКС_лаб_раб_№1_1_2012_ОНС.docx
Скачиваний:
44
Добавлен:
27.04.2015
Размер:
66.23 Кб
Скачать

4.2.2. Формальное описание целевого вектора

Формат ответов НС в явном виде часто оказывается непонятным для интерпретации человеком полученных результатов. Ответ, выдаваемый НС, как правило, является вещественным числовым вектором. Если при решении какой-то прикладной задачи требуется получить ответ, например, в градусах по шкале Кельвина, в дюймах или в виде образа (графического, звукового), то необходимо преобразование (интерпретация) выходного вектора. Рассмотрим основные способы интерпретации, т.е. способы задания целевого вектора ОВ. От способа задания целевого вектора зависит не только качество обучения НС, но и назрядность целевого вектора и количество выходных нейронов сети.

Метод вероятностей. В данном методе размер целевого вектора равен числу распознаваемых классов – М. Если классов много, для реализации метода требуется много выходных нейронов.

Решение задачи (выходные сигналы сети) можно представить в виде вектора:

, 0сi1, NJ=М (6)

где сi — вероятность, с которой объект относится к классу Сi.

Если рассматривать сi как вероятности, то должно выполняться условие

. (7)

К примеру, выходной вектор НС со значениями с1=0,9, с2=0,1 означает, что объект с данным набором параметров p с вероятностью 0,9 относится к классу C1 и с вероятностью 0,1 – к классу C2 .

Приведем пример задания трёх эталонов методом вероятностей. Пусть НС обучается на задаче исправления ошибок в словах, состоящих из 5-и букв. Тогда таблица соответствия значений целевого вектора ОВ эталонным словам выглядит следующим образом

Эталонное слово

Значения целевого вектора

весна

1

0

0

осень

0

1

0

ветер

0

0

1

Почему на выходе будут получены именно вероятности сi и будет ли выполняться условие (7)? Если обучение прошло успешно, то НС наверняка сформирует на выходе что-то похожее на вероятности. Это определяется алгоритмом обучения. Но чаще всего оказывается, что компоненты выходного вектора могут быть меньше 0 или больше 1, и условие (7) выполняется лишь приблизительно. Неточность результатов работы нейронной сети – это следствие аналоговости нейронных сетей. Большинство результатов, даваемых нейросетями, неточно. Кроме того, при обучении сети указанные условия, накладываемые на вероятности, не вводятся в сеть непосредственно, а неявно содержатся во множестве данных, на которых обучается сеть. Это – вторая причина некорректности результата. Такой способ формализации – не единственный, но один из удачных.

Метод номеров классов. Размер целевого вектора в данном случае будет равен единице. Таким образом, у нейронной сети будет только один выход, который будет задавать непосредственно номер класса. Если обучение прошло успешно, то когда на вход сети подан вектор Х, характеризующий объект, на выходе будет получено число М, и нами принимается решение о принадлежности Х к классу CМ . На первый взгляд такой способ формализации более экономичен: используется всего один выход. Но существует важный недостаток.

Пусть требуется разделить объекты по двум признакам х1 и х2 на три класса, М=3 (рис.2). Если входной вектор х примет значение, обозначенное жирной точкой, то выход сети, при правильном обучении, примет значение М=2, т.е. объект будет отнесен к классу 2, совершенно неподходящему.

Данное явление возникает, т.к. сеть склонна интерполировать входные и выходные данные. Если функции активации плавные, весовые коэффициенты не слишком большие, и количество слоев не слишком велико, то выход сети тоже будет гладким и непрерывным. Для близких Х будут получены близкие М на выходе. Но при решении задачи классификации такое допущение бывает неверным. Отсюда неправильное решение.

Чтобы избежать ошибок, можно применить другие способы формализации или упорядочить номера классов М так, чтобы близким М соответствовали близкие в пространстве классы. Также можно использовать различные способы кодирования классов, например:

1) последовательный ряд чисел (1,2,3,…);

2) последовательный ряд чисел с шагом 10 (10,20,30, …);

3) последовательный ряд чисел с шагом 100 (100,200,300, …);

4) несортированная последовательность чисел (7,138,16,51, …).

Знаковая интерпретация требует log2M компонент целевого вектора. Номер класса представляется двоичным кодом. При работе НС выходные сигналы интерпретируются следующим образом. Допустим, что y1,y2,…,ym – совокупность выходных сигналов нейронов. Если используется активационная функция с областью значений [1,0], то положительные числа в этой последовательности заменяются единицами, а отрицательные – нулями. Полученная последовательность нулей и единиц рассматривается как номер класса в двоичной записи.

Порядковая интерпретация позволяет для М выходных нейронов описать принадлежность к М! классам (а в знаковой 2М). Если провести сортировку выходных сигналов y1,y2,…,ym и обозначить ni – номер i-го сигнала после сортировки (1 соответствует самому маленькому сигналу, М – самому большому), то перестановку

Соседние файлы в папке Методички