
- •1. Базы знаний. Основные определения и назначение дисциплины.
- •2. Знания и данные.
- •3. Модели представления знаний. Формальные логические модели. Продукционные модели.
- •4. Модели представления знаний. Семантические сети. Фреймы.
- •5. Формальные логические модели представления знаний.
- •6. Метод резолюций.
- •7. Продукционная модель представления знаний. Виды продукций (3).
- •8. Процесс разработки продукционной модели знаний. И-Или граф.
- •9. Экспертные системы. Методология разработки экспертных систем. Стратегии разрешения конфликтов.
- •10. Деревья решений. Определение, назначение.
- •11. Алгоритмы обучения деревьев решений. Алгоритм id3. Критерии разбиений.
- •12. Алгоритм c4.5
- •13. Алгоритм cart. Построение дерева классификации и регрессии.
- •14. Ансамбли деревьев решений. Алгоритм Random Forest.
- •15. Алгоритм cart. Метод Cost complexity tree pruning.
- •16. Алгоритм сart. Выбор итогового дерева решений. Метод V-fold cross-validation.
- •17. Модель представления знаний на основе семантических сетей.
- •18. Ассоциативные сети.
- •19. Концептуальные графы.
- •20. Фреймовая модель представления знаний. Описание модели.
- •21. Применение фреймовых моделей.
- •22. Ооп как модель представления знаний.
- •24. Семантические технологии Web (Semantic Web). Определение и общее назначение технологии. Преимущества семантических сетей для интернета.
- •25. Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий и как они приведут к реализации Semantic Web.
- •26. Технологии Semantic Web. Xml. XmlSchema.
- •27. Технологии Semantic Web. Rdf.
- •29. Особенности поисковых систем. Структура организации и алгоритм работы.
- •30. Язык запросов поисковых систем.
- •31. Семантическая поисковая система.
- •34. Процесс разработки онтологий.
- •35. Технологии Semantic Web. Owl.
- •36. Компоненты онтологического языка Web на основе owl.
- •37. Применение онтологий. Значение онтологий для бизнеса.
- •38. Система разработки онтологий Protйgй. Назначение. Модель
- •39. Data Mining. Определение, назначение и решаемые задачи.
- •40. Data Mining. Классификация.
- •41. Data Mining. Кластеризация.
- •42. Date Mining. Прогнозирование.
42. Date Mining. Прогнозирование.
Data mining – это процесс выделения их данных неявной объективной и практически полезной информации и представление ее в виде, пригодном для использования.
выделяют 5 стандартных типов закономерностей, которые позволяют выявить методы Data Mining:
1) ассоциация
2) классификация
3) кластеризация
4) Последовательность
5) прогнозирование
Прогнозирование направлено на определение динамики конкретного объекта или события на основе ретроспективных данных, т.е. анализа его состояний в прошлом и настоящем.
Для решения задач прогнозирования обязательной и необходимой является обучающая выборка, которая также называется временным рядом.
Временной ряд – последовательность наблюдаемых значений какого-либо признака, упорядоченног в неслучайные моменты времени.
Отличием временного ряда от случайной выборки является предположение о равных промежутках времени мужду наблюдениями и их хронологический порядок.
Анализ временного ряда осуществляется с целью:
1) определение природы ряда
2) прогнозирование будущих значений
В процессе определения структуры и закономерностей временного ряда предполагается обнаружение шумов и выбросов, тренда, сезонной компоненты, циклической компоненты.
Тренд является систематической компонентой временного ряда, отражающей изменение значений ряда во времени.
Тренды бывают сезонными и несезонными.
Сезонный тренд – периодически повторяющиеся значения через примерно равные промежутки времени.
Процесс прогнозирования:
Перед началом прогнозирования необходимо ответить на след. вопросы:
1) что нужно прогнозировать
2) в каких временных параметрах
3) с какой точностью
В 1) нужно определить те параметры, которые будут прогнозироваться, их значения и колебания этих значений.
Второй этап- определение периода прогнозирования, горизонта прогнозирования и интервала.
Период отвечает на вопрос, на сколько делается прогноз.
Горизонт – число периодов, на которые делается прогноз.
интервал – частота, с которой делается прогноз.
Краткосрочный прогноз – прогноз на несколько шагов, не > 3% от длины выборки
Среднесрочный прогноз – 7 -12 шагов или 5-7% выборки.