Добавил:

aovakur Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский авиационный институт (национальный исследовательский университет)

Предмет:

Моделирование информационных систем

Файл:

Отчет №1.docx

Скачиваний:

Добавлен:

10.05.2018

Размер:

619.57 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 85 6 7 8 > Следующая >>>

Задание 4. Реализация алгоритмов построенияunsupervised моделей

Согласно данной концепции на вход любого алгоритма подаются исходные данные в виде потока представленного классом MiningInputStream . Кроме данных перед работой алгоритма должны быть выполнены соответствующие настройки. Они делятся на два типа: настройки специфичные для решаемой задачи (строящейся модели) и настройки специфичные для конкретного алгоритма. Первые реализуются с помощью наследования от класса MiningSettings, второй тип наследование от класса MiningAlgorithmSpecification. Результат работы алгоритма представляется в виде моделей являющихся экземплярами класса MiningModel. Сами алгоритмы наследуются от класса MiningAlgorithm.

В библиотеке Xelopes реализованы классы настроек, моделей и алгоритмов для основных задач data minig (табл.1). Необходимо заметить, что входные данные не зависят от решаемой задачи и для любого алгоритма представляются в виде экземпляра класса MiningInputStream.

Таблица 1. Основные классы библиотеки Xelopes

№	Задача	Класс настроек	Класс модели	Класс алгоритма
1	Статистические задачи	StatisticsMiningSettings	StatisticsMiningModel	StatisticsAlgorithm
2	Поиск ассоциативных правил	AssociationRulesSettings	AssociationRulesMiningModel	AssociationRulesAlgorithm
3	Сиквинциальный анализ	SequentialSettings	SequentialMiningModel	SequentialAlgorithm
4	Сиквинциальный анализ	CustomerSequentialSettings	CustomerSequentialMiningModel	CustomerSequentialAlgorithm
5	Кластеризация	ClusteringMiningSettings	ClusteringMiningModel	ClusteringAlgorithm
6	Регрессии	SupportVectorSettings	SupportVectorMiningModel	SupportVectorAlgorithm
7	Регрессии	SparseGridsSettings	SparseGridsMiningModel	SparseGridsAlgorithm
8	Классификации	DecisionTreeSettings	DecisionTreeMiningModel	DecisionTreeMiningModel

Будем использовать arff файл сегментации потребителей:

@relation 'travel'

@attribute sex {m, f}

@attribute age real

@attribute numb_journeys real

@attribute favor_country { Spain, Turkey, Poland, USA, France, Russia, Germany, Canada}

@attribute money_spent real

@data

f 33 3 Spain 10500

f 28 1 Turkey 645

m 16 1 Poland 433

m 34 2 USA 15230

f 52 12 Spain 12450

f 19 1 Spain 1426

f 45 5 Russia 4900

f 72 7 Germany 8560

f 23 4 Spain 17870

m 49 4 Spain 5400

PMML файл, построенный unsupervised алгоритмом

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE PMML PUBLIC "pmml20.dtd" "pmml20.dtd">

</Header>

</DataField>

</DataField>

</DataField>

</DataField>

</DataField>

</DataDictionary>

</MiningSchema>

</ComparisonMeasure>

</Cluster>

</Cluster>

</Cluster>

</ClusteringModel>

</PMML>

В результате данные были разбиты на три сегмента:

Клиенты среднего возраста, предпочитающие поездки в южные страны;
Пожилые клиенты, которые посещают европейские страны;
Молодые клиенты, которые мало путешествуют

Что такое unsupervised модели?

Обучение без учителя (самообучение, спонтанное обучение) — один из способов машинного обучения, при котором испытуемая система спонтанно обучается выполнять поставленную задачу без вмешательства со стороны экспериментатора. С точки зрениякибернетики, это является одним из видовкибернетического эксперимента. Как правило, это пригодно только для задач, в которых известны описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости, закономерности, существующие между объектами.

Обучение без учителя часто противопоставляется обучению с учителем, когда для каждого обучающего объекта принудительно задаётся «правильный ответ», и требуется найти зависимость между стимулами и реакциями системы.

Что такое описательные модели?

Описательные модели используются для свертывания и компактного представления экспериментальных данных без изучения механизма процесса. В этом и состоит одна из задач математической статистики, определяемой иногда как наука о редукции данных. Такой подход имеет безусловные достоинства для практика. Зная эмпирические закономерности, имея формулу, описывающую, например, изменение элюирующей силы при варьировании состава подвижной фазы, изотерму или изобару того или иного свойства, легко найти нужное решение, подставив в формулу соответствующее значение независимой переменной величины

Какие модели относятся к типу unsupervised?

Задачи кластеризации

Эксперимент обучения без учителя при решении задачи распознавания образовможно сформулировать как задачукластерного анализа.Выборка объектов разбивается на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Исходная информация представляется в виде матрицы расстояний.

Методы решения

Графовые алгоритмы кластеризации
Статистические алгоритмы кластеризации
Иерархическая кластеризацияилитаксономия
Нейронная сеть Кохонена
Метод ближайших соседей (k-means)
Автоассоциатор
Глубокая сеть доверия

Кластеризация может играть вспомогательную роль при решении задач классификациии регрессии.Для этого нужно сначала разбить выборку на кластеры, затем к каждому кластеру применить какой-нибудь совсем простой метод, например, приблизить целевую зависимость константой.

Методы решения

Нейронная сеть встречного распространения
Метод радиальных базисных функций

<<< < Предыдущая 1 2 3 45 / 85 6 7 8 > Следующая >>>