
- •1.Система поддержки принятия решений (сппр), ее основные задачи. Классификация сппр. Схема типичной сппр.
- •2.Сравнительный анализ аналитической и oltp систем.
- •3.Хранилище данных. История возникновения понятия, определение, основные свойства.
- •4.Основные подходы к реализации хранилищ данных.
- •Реализация хранилищ и витрин данных
- •Понятие и суть etl-процесса, основные преобразования данных.
- •Определение качества данных. Методика оценки качества, основанная на 4-х основных показателях.
- •8.Определение качества данных.Уровневая методика оценки качества.
- •11.Повышение качества данных: предварительная замена, классификация, структуризация.
- •12.Повышение качества данных: верификация, нормализация.
- •14.Понятия запроса и объекта запроса. Основные этапы поиска информации. Классификация задачи поиска.
- •15.Особенности решение задачи поиска в структурированных источниках на всех этапах.
- •Методы поиска Адресный поиск
- •Семантический поиск
- •Документальный поиск
- •Фактографический поиск
- •16.Оценка эффективности поисковых инструментов.
- •17. Суть многомерного анализа данных, основные понятия. Возможные операции над гиперкубом. Понятие olap.
- •18. 12 Правил Кодда.
- •19. 6 Дополнительных правил Кодда. Группы правил.
- •20.Определение olap через 5 ключевых понятий теста fasmi.
- •21.Основные подходы к реализации olap, их преимущества и недостатки.
- •23.Единая система нси. Требования идентифицируемости и уникальности, принципы построения.
- •Принципы построения единой системы нси.
- •24. Система нси: 1-3 типовые ошибки.
- •25.Система нси: 4-6 типовые ошибки.
- •26. Система нси: 7-10 типовые ошибки.
- •27.Понятие Data Mining. Дисциплины, использованные при создании Data Mining. Основные действия выполняемые Data Mining. Основные ограничения использования.
- •28.Основные задачи Data Mining. Классификация и кластеризация: суть, сравнительный анализ.
- •29.Основные задачи Data Mining. Поиск ассоциативных правил, прогнозирование, анализ отклонений.
- •30.Определение метода и алгоритма. Классификация стадий Data Mining. Свободный поиск.
- •31.Определение метода и алгоритма. Классификация стадий Data Mining. Прогностическое моделирование.
- •32.Определение метода и алгоритма. Классификация стадий Data Mining. Анализ исключений.
- •33.Основные этапы процесса подготовки к Data Mining. Анализ предметной области, постановка задачи, подготовка данных.
- •34.Понятие Text Mining. Основные этапы.
- •35.Понятие Text Mining. Основные задачи.
- •36. Предварительная обработка данных, основные приемы.
- •38.Oracle Data Mining (odm). Возможности, архитектура, характеристики. Используемые алгоритмы.
- •39.Функциональные возможности odm. Алгоритм Naïve Bayes.
- •40.Функциональные возможности odm. Алгоритм Support Vector Machine.
- •41.Функциональные возможности odm. Алгоритм k-means. Проверка качества кластеризации.
- •Алгоритм k-means.
- •42.Функциональные возможности odm. Алгоритмы Apriori.
- •43.Workflow.(поток работы) Суть, базовые понятия и их взаимосвязь.
- •44.Workflow. Структура системы, основные компоненты и их взаимосвязь.
- •45.Workflow. Условия представления бизнес-процесса как процесса Workflow. Порядок представления бизнес процесса в графическом виде (idef0).
- •49.Категории операций бизнес-процесса. Типовые параметры описания бизнес-процесса. Условия перехода между операциями.
- •46.Типовые цели внедрения проекта Workflow. Цикл управления эксплуатацией и развитием системы.
- •47.Понятие агентов. Типы агентов. Способности обучающихся агентов.
- •48.Понятие субагентов, типы субагентов. Свойства автономного агента
- •49.Мультиагентная система (мас). Определение, основные характеристики, классификация мас.
- •50.Методы организации работы в мас. Условия размещения агента на сервере. Операции над агентами. Примеры использования мас.
31.Определение метода и алгоритма. Классификация стадий Data Mining. Прогностическое моделирование.
Метод- норма или правило, определенный путь, способ, прием решений задачи теоретического, практического, познавательного, управленческого характера.
Алгоритм- это точное предписание относительно последовательности действий(шагов), преобразующих исходные данные в исполненный результат.
Классификация стадий:1. Выявление закономерностей, их свободный поиск.2.Использование выявленных закономерностей для предсказания неизвестных значений.Валидация- проверка закономерностей.3.Анализ исключений
Прогностическое моделирование:
2 направления:1.прогнозирование.2.предсказание неизвестных значений(классификация, кластеризация) если возраст >35, зарплата > 3000 руководитель.
32.Определение метода и алгоритма. Классификация стадий Data Mining. Анализ исключений.
Метод- норма или правило, определенный путь, способ, прием решений задачи теоретического, практического, познавательного, управленческого характера.
Алгоритм- это точное предписание относительно последовательности действий(шагов), преобразующих исходные данные в исполненный результат.
Классификация стадий:1. Выявление закономерностей, их свободный поиск.2.Использование выявленных закономерностей для предсказания неизвестных значений.Валидация- проверка закономерностей.3.Анализ исключений
Анализ исключений.основная задача-обнаружение и анализ данных, наиболее отличающихся от общего мн-ва данных, выявления так называемых нехарактерных шаблонов.
Анализ исключений входит: 1.выявление закономерностей.2.прогностическое моделирование.+3.валидация.4анализ исключений.
33.Основные этапы процесса подготовки к Data Mining. Анализ предметной области, постановка задачи, подготовка данных.
3 этапа:1.анализ предметной области.2.постановка задачи.3.подготовка данных.
1.Анализ. Исследование- это процесс познания определенной предметной области, объекта или явления с определенной целью. Предметная область- мысленно ограниченная область реальной действительности, подлежащая описанию или моделированию и исследованию.
Стандарты: SADT- методика структурного анализа, IDEFO- частично базируется на SADT
UML- активно заменяет IDEFO для разработки бизнес – процессов.
2.Постановка задачи.
1.сформулировать задачу(определить контингень клиентов)
2.формализация задачи(более подробное описание с использованием специфических терминов)
3.подготовка данных(создание базы данных под задачи дата мининг)
3.1определить и проанализировать требования к данным(состав,структура,определенность,формат)
3.2.Сбор данных
3.3 Предварительная подготовка данных обеспечение приемлемого кач-ва данных.
34.Понятие Text Mining. Основные этапы.
Text Mining - это набор технологий и методов, предназначенных для извлечения информации из текстов. Основная цель - дать аналитику возможность работать с большими объемами исходных данных за счет автоматизации процесса извлечения нужной информации. Назовем основные технологии Text Mining.
Этапы:
1.не знаю
2.этап предварительной обработки документов.
3.извлечение информации.
4.применение метода текст мининг
1.задача классификации- отнесение документов к нужной тематике
2.задача кластеризации- выявить семантически похожие группы данных
3.автоматитческое аннотирование- несколько фраз, наиболее полно отражающих весь текст.
4.извлечение ключевых понятий- выявить факты, взаимосвязанные с основным
5.навигация по тексту.
Этап №5.Интерпретация результатов , как представить результат работы.