Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОНС / лабораторные работы / Методички / НКС_лаб_раб_№1_1_2012_ОНС.docx
Скачиваний:
44
Добавлен:
27.04.2015
Размер:
66.23 Кб
Скачать

4.2.1.2. Приведение данных к требуемому диапазону значений

Приведение данных к определенному диапазону выполняется методами масштабирования (нормирования) или центрирования для того, чтобы каждая компонента входного вектора в зависимости от используемой в нейронах сети активационной функции лежала в допустимом диапазоне, обычно на отрезке [0,1] или [-1,1]. Если этого не сделать, то может возникнуть ряд проблем:

1) нейроны входного слоя или окажутся в постоянном насыщении или будут все время заторможены;

2) весовые коэффициенты примут очень большие или очень малые значения при обучении (в зависимости от дисперсии), и, как следствие, растянется процесс обучения и снизится точность.

Существует множество способов нормирования, которые используются исходя из условий конкретной задачи. Рассмотрим основные из этих способов.

1. Один из распространенных способов:

р= (x-m)c, (1)

где x – исходный вектор; р – масштабированный; m – вектор усредненных значений совокупности входных данных; с – масштабный коэффициент.

2. При известном диапазоне изменения входной переменной используют следующий вид преобразований:

, (2)

где [a,b] – диапазон приемлемых входных сигналов; [xmin, xmax] – диапазон изменения значений входной переменной х; р – преобразованный входной сигнал.

3. Способ, использующий минимальные и максимальные значения компонентов векторов. Каждая компонента входного вектора данных xi заменяется величиной

, (3)

и ,

где ximax и ximin – соответственно максимальное и минимальное значения для данной компоненты, вычисленные по всей обучающей выборке.

По этой же формуле выполняется нормирование и компонентов выходных векторов (векторов ответов).

В качестве min и max-величин берут данные либо из существующего на настоящий момент задачника, либо эти величины задаются пользователем по его оценкам. Эти величины должны вводиться в момент создания сети и в дальнейшем не зависеть от обучающей выборки!

Выходы сети так же масштабируются. Смысл выходного вектора задается разработчиком при создании сети. Поэтому необходимо подготовить данные так, чтобы диапазон изменения выходных сигналов лежал на рабочем участке функции активации.

4.2.1.3. Параметры формализации входного вектора

Многослойный персептрон может рассчитывать выходной вектор Y для любого входного вектора X, т.е. задавать значение некоторой векторной функции Y=f(X). Следовательно, условие любой задачи, которая может быть поставлена персептрону, должно являться множеством векторов {X1XiXm}, где m – размер обучающей выборки c NI компонентами каждый:

. (4)

Решением задачи будет множество векторов {D1Dm}, каждый вектор Dm с NJ компонентами: Yi=f(Xm), где i=1..m — номер предъявляемого образа

. (5)

Число таких обучающих пар существенно меньше общего числа возможных сочетаний значений входных и выходных сигналов.

Таким образом, формальное описание входного вектора ОВ должно состоять из следующих параметров:

1) набор параметров, характеризующих исследуемый объект;

2) обоснование использование шкалы представления данных для каждого параметра:

- тип параметра;

- диапазон изменения значений параметра;

- шкала преобразований параметра;

- способ кодирования номинальных переменных;

- таблица соответствия значений и кодов;

3) формат входного вектора ОВ, включая его фактическую длину (формат состоит из следующих разделов:

- № п/п параметра в векторе;

- название параметра;

- длина параметра в векторе.

Соседние файлы в папке Методички