Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОНС / конспекты лекций / Конспект_НКС_11-3.docx
Скачиваний:
66
Добавлен:
27.04.2015
Размер:
587.45 Кб
Скачать

2. Особенности решения задач на нс

2.1. Предобработка данных

На общую технологию настройки НС на решение конкретной задачи сказывается специфика самих нейронных сетей (рис.3.14).

Рис. 3.14. Технология настройки НС на решаемую задачу

Прежде всего необходимо решить проблемы, связанные с представлением обучающей информации, поскольку от этого во многом зависит скорость и качество обучения НС. Это входит в этап предварительной обработки данных (препроцессирование, предобработка), который заключается в формализации векторов обучающей выборки.

Сигналы, подаваемые на вход НС, должны быть представлены в соответствующем формате данных. При этом очень часто приходиться их масштабировать, чтобы в максимальной степени использовать диапазон их изменения. Поэтому необходимо проводить предобработку входных сигналов, причем для каждого вида должен быть реализован определенный способ предобработки.

Формализация векторов обучающей выборки состоит в подготовке входных данных на НС и их формальное описание. При этом, в зависимости от решаемого класса задач, определяются следующие параметры:

обоснование способа интерпретации ответа сети (выходного вектора);

форматы входного и целевого векторов;

диапазон изменения компонент этих векторов;

способы кодирования компонент;

таблица эталонных образов и т.п.

Предобработка заключается в следующем:

1. Выбор шкалы для представления входных сигналов на нейронную сеть.

Данные, подаваемые на вход нейронной сети, могут быть измерены в различных шкалах. Шкала задает множество объектов с их свойствами и способ преобразования этих объектов (способ отображения «эмпирической системы» на некоторую знаковую систему). В нейронных сетях чаще всего используются следующие шкалы.

Шкала отношений.

Шкала интервалов.

Шкала порядка.

Шкала наименования.

2. Выбор метода интерпретации целевого вектора.

Формат ответов НС в явном виде часто оказывается непонятным для интерпретации человеком полученных результатов. Ответ, выдаваемый НС, как правило, является вещественным числовым вектором. Если при решении какой-то прикладной задачи требуется получить ответ, например, в градусах по шкале Кельвина, в дюймах или в виде образа (графического, звукового), то необходимо преобразование (интерпретация) выходного вектора. Основными способами интерпретации считаются следующие.

Метод вероятностей.

Метод номеров классов.

Знаковая интерпретация.

Порядковая интерпретация.

Интерпретацию 2-на-2- кодирование.

Метод корректных образов.

Перечень приведенных способов интерпретации ответов НС не является полным. Для каждой предметной области при решении конкретных задач необходимо их экспериментальное исследование.

3. Кодирование данных.

Нейронные сети могут работать только с числовыми данными, лежащими в определенном ограниченном диапазоне. Однако ис­ходные данные, подаваемые на НС, могут включать номинальные переменные, указывающие на принадлежность к одному из нескольких классов, даты, целочисленные значения, текстовые строки, графические данные и т.д., поэтому необходимо кодирование данных.

Нечисловые данные нужно преобразовать в числовую форму. Значения дат и времени, если они нужны, можно преобразовать в числовые. С произвольными текстовыми полями (например, фамилиями людей) работать нельзя.

При кодировании параметров исследуемых объектов необходимо учитывать тип переменных, которые описывают этот объект: непрерывные, дискретные или качественные, количественные.

4. Статистическая обработка данных.

С целью удобства работы проводят статисти­ческую обработку данных, исключение аномальных наблюдений, отбор входных сигналов на основе показателей значимости. Здесь определяют, является ли выборка репрезентативной (охватывает все множество ситуаций), нет ли в ней противоречивых примеров. В выборке часть данных может отсутствовать, т.е. могут встречать пропуски данных в векторах.

5. Нормирование данных.

Как правило, на вход сети нельзя подавать входные сигналы в их истинном диапазоне величин и снимать с ее выходов сигналы в требуемом диапазоне. Данные, подаваемые на вход сети и снимаемые с выхода, должны быть правильно подготовлены, т.е. их необходимо нормировать.

Нормирование – это приведение значений входных и/или выходных векторов к некоторому диапазону. Наиболее часто нормирование выполняют в диапазон значений [-1,1] или [0,1].

Существует множество способов нормирования. Одним из наиболее простых является способ, использующий минимальные и максимальные значения компонентов векторов. Каждая компонента входного вектора данных xiзаменяется величиной

, (3.4)

и ,

где ximax и ximin – соответственно максимальное и минимальное значения для данной компоненты, вычисленные по всей обучающей выборке.

По этой же формуле выполняется нормирование и компонентов выходных векторов (векторов ответов).

В качестве min и max-величин берут данные либо из существующего на настоящий момент задачника, либо эти величины задаются пользователем по его оценкам. Эти величины должны вводиться в момент создания сети и в дальнейшем не зависеть от обучающей выборки!

Соседние файлы в папке конспекты лекций