- •1. Базы знаний. Основные определения и назначение дисциплины.
- •2. Знания и данные.
- •3. Модели представления знаний. Формальные логические модели. Продукционные модели.
- •4. Модели представления знаний. Семантические сети. Фреймы.
- •5. Формальные логические модели представления знаний.
- •6. Метод резолюций.
- •7. Продукционная модель представления знаний. Виды продукций (3).
- •8. Процесс разработки продукционной модели знаний. И-Или граф.
- •9. Экспертные системы. Методология разработки экспертных систем. Стратегии разрешения конфликтов.
- •10. Деревья решений. Определение, назначение.
- •11. Алгоритмы обучения деревьев решений. Алгоритм id3. Критерии разбиений.
- •12. Алгоритм c4.5
- •13. Алгоритм cart. Построение дерева классификации и регрессии.
- •14. Ансамбли деревьев решений. Алгоритм Random Forest.
- •15. Алгоритм cart. Метод Cost complexity tree pruning.
- •16. Алгоритм сart. Выбор итогового дерева решений. Метод V-fold cross-validation.
- •17. Модель представления знаний на основе семантических сетей.
- •18. Ассоциативные сети.
- •19. Концептуальные графы.
- •20. Фреймовая модель представления знаний. Описание модели.
- •21. Применение фреймовых моделей.
- •22. Ооп как модель представления знаний.
- •24. Семантические технологии Web (Semantic Web). Определение и общее назначение технологии. Преимущества семантических сетей для интернета.
- •25. Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий и как они приведут к реализации Semantic Web.
- •26. Технологии Semantic Web. Xml. XmlSchema.
- •27. Технологии Semantic Web. Rdf.
- •29. Особенности поисковых систем. Структура организации и алгоритм работы.
- •30. Язык запросов поисковых систем.
- •31. Семантическая поисковая система.
- •34. Процесс разработки онтологий.
- •35. Технологии Semantic Web. Owl.
- •36. Компоненты онтологического языка Web на основе owl.
- •37. Применение онтологий. Значение онтологий для бизнеса.
- •38. Система разработки онтологий Protйgй. Назначение. Модель
- •39. Data Mining. Определение, назначение и решаемые задачи.
- •40. Data Mining. Классификация.
- •41. Data Mining. Кластеризация.
- •42. Date Mining. Прогнозирование.
10. Деревья решений. Определение, назначение.
Деревья решений – один из методов автоматического анализа данных и принятия решений в бизнесе.
Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.
Под правилом понимается логическая конструкция, представленная в виде "если ... то ...".
Область применения деревья решений в настоящее время широка, но все задачи, решаемые этим аппаратом могут быть объединены в следующие три класса:
Описание данных: Деревья решений позволяют хранить информацию о данных в компактной форме, вместо них мы можем хранить дерево решений, которое содержит точное описание объектов.
Классификация: Деревья решений отлично справляются с задачами классификации, т.е. отнесения объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения.
Регрессия: Если целевая переменная имеет непрерывные значения, деревья решений позволяют установить зависимость целевой переменной от независимых(входных) переменных. Например, к этому классу относятся задачи численногопрогнозирования(предсказания значений целевой переменной).
В узлах дерева, не являвшимися листьями, находятся атрибуты, по которым различаются ситуации.
В листьях – значения целевой функции.
На ребрах – значения атрибута, из которого исходит это ребро.
ДР строятся следующим образом:
1. Выбирается атрибут A и помещается в корень. Для всех значений этого атрибута строим ребра.
2. Выбирается значение целевой функции для измерения значений ребра.
ДР не позволяет извлечь какие-либо закономерности из данных, оно позволяет только наиболее эффективно принимать решения и предсказывать значения целевых атрибутов.
Цель: построить самое короткое дерево, таким образом, чтобы в его корне стоял наиболее важный атрибут, позволяющий наиболее эффективную классификацию.
Достоинства:
быстрый процесс обучения;
генерация правил в областях, где эксперту трудно формализовать свои знания;
извлечение правил на естественном языке;
интуитивно понятная классификационная модель;
высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);
построение непараметрических моделей.
В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.
Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining). В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя
Деревья решений успешно применяются для решения практических задач в следующих областях:
Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.
Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.
Медицина. Диагностика различных заболеваний.
Молекулярная биология. Анализ строения аминокислот.