
- •Федеральное агентство по образованию
- •Интеллектуальные информационные системы анализ данных с помощью карт кохонена
- •080801 - «Прикладная информатика (в экономике)»
- •3.2. Порядок работы с картами Кохонена
- •3.3. Карта выходов нейронов
- •3.4. Карта частот
- •3.5. Карта входов нейронов
- •3.6. Взаимосвязь между картами
- •3.7. Программное обеспечение
- •4. Последовательность выполнения практического задания
- •4.1. Запуск модуля
- •4.2. Мастер обучения самоорганизующихся карт
- •4.2.1. Мастер обучения - шаг 1: выбор режима работы
- •4.2.2. Мастер обучения - шаг 2: выбор полей, используемых для обучения
- •4.2.3. Мастер обучения - шаг 3: настройка параметров обучения
- •4.2.4. Мастер обучения - шаг 4: параметры визуализации карты
- •4.2.5. Мастер обучения - шаг 5: описание карты
- •Мастер обучения – шаг 6: обучение карты
- •Обучающая выборка
- •Рабочая выборка
- •4.5. Визуализация построенных карт
- •4.6. Работа с картами
- •4.7. Статистика по построенным картам
- •4.8. Окно эксперимента
- •1. Цель работы.
3.5. Карта входов нейронов
При анализе карт Кохонена проводится оценка не только выходов нейронов, но также и весов нейронов. Для каждого входа нейрона рисуется своя карта (рис.3), которая раскрашивается в соответствие со значением соответствующего веса нейрона.
Рис.3. Карты входов
У нейронной сети, обучаемой с учителем, веса нейронов не имеет физического смысла и не используются в анализе. При обучении же без "учителя", веса нейронов подстраиваются под точные значения входных переменных и отражают их внутреннюю структуру. Для идеально обученной нейронной сети вес нейрона равен соответствующей компоненте входного примера. Обычно анализируют одновременно несколько карт входов. Сначала на одной карте выделяют области одинакового цвета. В этой области группируются входные примеры, имеющие одинаковое значение соответствующего входа. Далее нейроны из этой области изучаются на других картах на предмет цветового распределения.
3.6. Взаимосвязь между картами
При работе с картами Кохонена важно понимать, что все рассмотренные выше карты - это разные раскраски одних и тех же нейронов. При этом каждый обучающий пример имеет одно и то же расположение на каждой из рассмотренных карт. Любой бар на графике цены имеет "свое" место на всех картах.
Анализ финансовых рядов предполагает одновременный просмотр карты и графика цен (бары и свечки), для соотнесения точки на карте и графике, как показано на рис.4.
Рис.4. Одновременный просмотр карты и графика
3.7. Программное обеспечение
Как любая нейронная технология, карты Кохонена требуют соответствующего программного обеспечения. На сегодняшний момент в мире существует несколько программ, позволяющих работать с картами Кохонена - это программы SoMine, Statistica, NeuroShell и новый программный пакет NeuroScalp.
В пакет NeuroScalp входит модуль "Карты Кохонена". Наверное, это первая программа, всесторонне реализующая алгоритм самоорганизующихся карт в применении к финансовым рядам данных. В программе реализован собственный язык программирования, позволяющий использовать индикаторы технического анализа. Реализован богатый инструментарий для проведения анализа карт Кохонена.
Проецирование - метод анализа данных, основанный на визуализации исходной многомерной выборки на плоскость. При этом те элементы выборки, которые находятся рядом в исходном многомерном пространстве, оказываются рядом и на плоскости.
Кластеризация - один из методов анализа данных, позволяющий классифицировать многомерные наблюдения, каждое из которых описывается набором переменных Х1,Х2...Хn. Целью кластеризации является образование групп схожих между собой объектов.
Нейрон-победитель - нейрон карты, который в наибольшей степени соответствует вектору входов (обычно имеет минимальное расстояние до него). Именно этот нейрон определяет к какому классу относится пример и модифицируется при обучении.
Радиус обучения - параметр, который определяет сколько нейронов кроме нейрона-победителя участвуют в обучении. В процессе обучения радиус обучения постепенно уменьшается так, что на заключительных этапах в обучении участвует только нейрон-победитель.
Обычно, нейроны располагаются в узлах двумерной сетки с прямоугольными или шестиугольными ячейками. При этом нейроны также взаимодействуют друг с другом. Величина этого SOM подразумевает использование упорядоченной структуры нейронов. Обычно используются одно- и двумерные сетки. При этом, каждый нейрон представляет собой n-мерный вектор-столбец, где n определяется размерностью исходного пространства (размерностью входных векторов).
Обычно, нейроны располагаются в узлах двумерной сетки с прямоугольными или шестиугольными ячейками. При этом, как было сказано выше, нейроны также взаимодействуют друг с другом. Величина этого взаимодействия определяется расстоянием между нейронами на карте. На рисунке 5 дан пример расстояния для шестиугольной и четырехугольной сеток.
Рис.5. Пример расстояния для шестиугольной и четырехугольной сеток
При этом количество нейронов в сетке определяет степень детализации результата работы алгоритма, и, в конечном счете, от этого зависит точность обобщающей способности карты.