Глава 4 практические советы по решению задач

В этой главе будет рассказано, как применять пакет ST Neural Networks для решения задач. Мы затронем следующие темы: подготовка данных и их пре-процессирование, выбор архитектуры сети и настройка ее параметров.

Следует отметить, что эти разделы теории нейронных сетей развиты недостаточно, и материал этой главы скорее отражает мнение авторов, чем общепринятую точку зрения. Мы настоятельно рекомендуем читателю не полагаться исключительно на те советы, которые будут даны в этой главе, и обращаться к другим источникам информации. Необходимо также иметь в виду, что эффективность методов может зависеть от особенностей конкретной задачи.

В пакете ST Neural Networks реализован ряд новейших инструментов, предназначенных для решения указанных проблем. Это функция для автоматического построения сети и Генетический алгоритм отбора входных данных - Genetic Algorithm Input Selection. Однако даже эти методы, отражающие самое современное состояние вопроса, не гарантируют отыскания оптимального решения. Как правило, они позволяют получить просто хороший вариант ответа.

Представление данных

Обсуждение

Первое, с чем сталкивается пользователь при работе с нейронными сетями, - представление данных в нужном виде.

Сеть умеет обрабатывать только числовые значения; более того, она воспринимает значения только из определенного диапазона. Ваши данные, однако, могут включать номинальные переменные, указывающие на принадлежность к одному из нескольких классов, даты, целочисленные значения и текстовые строки, а также числовые переменные, меняющиеся в самых различных диапазонах. Чтобы справиться с этими сложностями, в системе ST Neural Networks предусмотрен ряд средств пре/пост-процессирования для автоматического преобразования типов данных.

Представление переменных

Обычно переменные разных типов представляются в программах следующим образом.

Непрерывные (числовые) значения. Представляются одной вещественной переменной. Все вопросы, связанные и диапазоном значений, решаются в системе ST Neural Networks путем масштабирования (шкалирования), которое является составной частью процедуры пре/пост-процессирования.

Целочисленные. Представляются в вещественном эквиваленте.

Даты и время. Преобразуются в числовые значения вычислением положения момента времени относительно заданного начала отсчета.

Номинальные переменные (атрибуты). В ST Neural Networks имеют специальное представление как номинальные переменные. Специальные средства позволяют преобразовывать их к виду, понятному для нейронной сети. Пример номинальной переменной: Род - Gender ={Муж - Male, Жен - Female}.

Номинальные переменные с двумя состояниями, принимающие два значения, представляются в бинарном виде (переменной соответствует один элемент сети, который активируется или нет в зависимости от значения переменной).

Любую номинальную переменную можно записать методом кодирования 1-из-N: при этом одной номинальной переменной соответствует N элементов сети (здесь N - число различных номинальных значений переменной), один из которых бывает активен, а остальные - нет. Кодирование методом 1-из-N - это стандартный способ записи номинальных переменных, которые могут принимать более двух значений. Для переменных, принимающих только два значения, стандартным является бинарное представление, хотя можно использовать и кодирование 1-из-N (за одним исключением: выходная переменная вероятностной нейронной сети всегда кодируется методом 1-из-N, даже если у нее всего два возможных состояния).

Если номинальная переменная может принимать очень много различных значений, то для нее можно использовать метод кодирования N – в - одну: различным вариантам соответствуют различные целочисленные значения единственной переменной. В пакете ST Neural Networks для этого нужно выбрать вариант кодирования Явное - Explicit, Минимакс - Minimax или Нет - None. Различным номинальным значениям будут поставлены в соответствие числа 1,2,3..., после чего они будут естественным образом упорядочены. Как правило, такой способ записи хуже, чем 1-из- N, но в отдельных случаях - когда кодирование 1-из-N приводит к сети слишком большого размера - может оказаться более предпочтительным.

Текстовые строки. Нейронная сеть не сможет обрабатывать произвольные строки текста, пока вы не укажете ей осмысленный способ приписывать им числовые значения или 1-из-N коды.

Дальнейшая обработка

Иногда бывает целесообразно проделать дополнительную числовую обработку данных. Например, если известно, что некоторая переменная имеет экспоненциальное распределение, для лучшего представления ее значений имеет смысл ее прологарифмировать.

При анализе временных рядов иногда бывает лучше рассматривать не сами значения ряда, а разности соседних значений. Если во временном ряду просматривается тренд, то стоит или выделить его (например, подогнать линейную модель, а нейросетевую модель применять к ряду остатков прогноза линейной модели), или использовать нормированные разности (а_i –а_i_-1)/а_i_.

Совет. Для пре-процессирования лучше всего использовать средства базовой системы STATISTICA. При этом данные для обработки в сети, полученные из исходных данных по определенным формулам, будут размещены в отдельной таблице.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2618 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.03.2016359.83 Кб13научная деятельность.pdf
#
19.03.201613.22 Кб42Начальная школа до и после 2011.docx
#
18.05.201522.53 Кб88Не знал, что столько дает человеку собака.doc
#
11.11.201933.27 Кб3Невербальное общение1.docx
#
08.11.2018166.91 Кб4Неисковые производства.doc
#
01.04.20252.73 Mб0НЕЙРОСЕТИ_уч_Боровков.doc
#
18.05.2015258.05 Кб33немецкий язык ОЗО.doc
#
18.05.20153.34 Mб145Никифоров Практикум по психологии здоровья.doc
#
01.05.2025415.74 Кб0Николаенко. Химически опасные объекты и химичес...doc
#
01.05.202550.9 Кб1Никольская О. Ребенок с аутизмом в обычной школ...docx
#
09.11.201949.32 Кб5НИР, ТЗ НШ 3 на растерзание.docx