Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
STBDiIS шпоры1.doc
Скачиваний:
16
Добавлен:
26.09.2019
Размер:
275.46 Кб
Скачать

27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.

-это процесс обнаружения знаний в сырых данных , ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации данных, необходимых для принятия решений в различных сферах человеческой деятельности.

-это процесс выделения из данных неявной и неструктурированной инф-ции и представления ее в виде, пригодном для использования.

Дисциплины: алгоритмизация, машинное обучение, теория баз данных, визуализация, распознавание образов, искусственный интеллект

Data miningалгоритм:1.поиск закономерностей.2построение моделей и правил.3прогнозирование.

28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.

-это процесс обнаружения знаний в сырых данных , ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации данных, необходимых для принятия решений в различных сферах человеческой деятельности.

Задачи:1.классификация.2класстеризация.3.ассоциации(поиск).4.прогнозирование.5.анализ отклонений.

1.- решает задачи обнаружения признаков, которые образуют группы объектов исследуемого набора данных- классы; по этим признакам любой новый объект можно отнести к тому или иному классу.

2- логическое продолжение идеи классификации. Особенно – классы объектов изначально неопределенны.

Характеристика

Классификация

Кластеризация

Контролируемость обучения

контролируемо

неконтролируемо

Стратегия обучения

Обучение с учителем

Обучение без учителя

Наличие метки класса

В обучающем множестве у объектов есть метки классов

Нет меток класса

Основание для классификации

Новые данные классифицируются на основании обучающего мн-ва

Дано мн-во данных с целью установления сущ-я классов или класстеров

29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.

Задачи:1.классификация.2класстеризация.3.ассоциации(поиск).4.прогнозирование.5.анализ отклонений.

3.- в ходе решения задач поиска ассоциативных правил отыскиваются закономерности между связанными событиями в наборе данных. Поиск закономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями , которые происходят одновременно. Пример: Банк выпускает кредитные карточки только если они будут максимально востребованы среди определенных клиентов.

4- возможность на основе особенности исторических данных оценить пропущенные или будущие значения целевых численных показателей

5.- цель: обнаружение , анализ данных, наиболее отличающихся от общего мн-ва данных, выявление «нехарактерных шаблонов»

30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.

Метод- норма или правило, определенный путь, способ, прием решений задачи теоретического, практического, познавательного, управленческого характера.

Алгоритм- это точное предписание относительно последовательности действий(шагов), преобразующих исходные данные в исполненный результат.

Классификация стадий:1. Выявление закономерностей, их свободный поиск.2.Использование выявленных закономерностей для предсказания неизвестных значений.Валидация- проверка закономерностей.3.Анализ исключений

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]