Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РП Интел анализ данных.rtf
Скачиваний:
8
Добавлен:
08.05.2015
Размер:
232.52 Кб
Скачать

5.2. Практические занятия, семинары

№занятия

№раздела

Наименование или краткое содержание практического занятия, семинара

Кол-вочасов

1

1

Технологии анализа данных с помощью StatGraphics Plus Version 5.0 – пример применения пошаговой множественной регрессии для минимизации количества независимых переменных

6

2

1

Решение примеров на алгоритм обучения нейронной сети: алгоритм обратного распространения ошибки (BackProp)

6

3

2

Технологии работы в системе See5/C5.0 для построения деревьев решений

4

4

2

Технологии работы с программой WizWhy — системой поиска логических правил в данных

8

5

3

Базовые навыки и технологии работы с программой Deductor 5 как аналитической платформой для создания законченных прикладных решений в области анализа структурированных данных

8

6

3

Характеристики продуктов RCO Morphology (морфологический анализ), RCO Semantic Network (семантический анализ), RCO Syntactic Engine (синтаксический анализ). Архитектура ИАС извлечение ассоциаций из естественных текстов.

4

5.3. Лабораторные работы

Не предусмотрены

5.4. Самостоятельная работа студента и ее контроль

Выполнение СРС

Контроль СРС

Вид работы и содержание задания

Список литературы (с указанием разделов, глав, страниц)

Кол-во часов

Форма контроля

Содержание контроля

Кол-во часов

подготовка к практикам и семинарам

1. Паклин, Н.Б. Бизнес-аналитика:от данных к знаниям. / Н.Б. Паклин, В.И. Орешков. – СПб.: 2010. – 701 с.

20

доклады и отчеты

оценка материалов

2

написание реферата

http://www.rulequest.com http://www.interface.ru/sysmod/ http://www.basegroup.ru/deductor/

20

текст реферата

оценка реферата

2

подготовка к зачету

Паклин, Н.Б. Бизнес-аналитика:от данных к знаниям. / Н.Б. Паклин, В.И. Орешков. – СПб.: 2010. – 701 с.

9

зачет

оценка

1

6. Образовательные технологии, используемые в учебном процессе данной дисциплины

6.1. Интерактивные формы обучения

Интерактивные формы обучения

Вид работы(Л, ПЗ, ЛР)

Краткое описание

Кол-во ауд. часов

Компьютерная симуляция

Практические занятия и семинары

Методика анализа данных: Knowledge Discovery in Databases - обнаружение знаний в базах данных; Data Mining - добыча данных.

20

6.2. Встречи с представителями российских и зарубежных компаний, государственных и общественных организаций

Не предусмотрены

6.3. Инновационные способы и методы, используемые в образовательном процессе

Наименование

Краткое описание и примеры использования в темах и разделах

Использование информационных ресурсов и баз данных

http://www.rulequest.com http://www.basegroup.ru/deductor/

7. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины и учебно-методическое обеспечение самостоятельной работы студентов

Темы эссе, рефератов, курсовых работ и пр.

Темы рефератов: 1. Технологии Data mining в современном процессе управления территориями. 2. Подготовка исходных данных в практике интеллектуального анализа данных. 3. Современные средства Data mining. 4. Современное состояние технологии интеллектуального анализа данных. 5. Перспективы развития систем поддержки принятия решение на основе средств Data mining. 6. Современные аналитические платформы для создания систем поддержки принятия решений. 7. Системы компьютерного анализа текста на естественном языке, проблемы и подходы к их созданию.

Контрольные вопросы и задания для проведения текущего контроля

Контрольные вопросы по практическим занятиям Занятие 1 1. Вид уравнения множественной регрессии. 2. Каков порядок построения модели множественной регрессии для всех переменных? 3. Как осуществляется пошаговый отбор переменных? Занятие 2 1. Каковы параметры алгоритма конструирования классификатора в программе See5? 2. Как преобразовать полученное дерево решений в набор правил If….Then? 3. Как можно уменьшить ошибки классификации? Занятие 3 1. Какой алгоритм положен в основу работы программы WizWhy для поиска логических правил в данных? 2. Какие параметры следует задать для работы процедуры поиска правил? 3. Какие отчеты готовит система WizWhy? 4. Каковы возможности использования обнаруженных правил для предсказания значений целевого показателя на новом материале? Занятие 4 1. Какова основная идея обучения с учителем нейронной сети на примере BackProp? 2. Дайте пояснения по блок-схеме алгоритма обратного распространения ошибки. 3. Как рассчитываются коррекции для весов нейронов скрытого слоя? Занятие 5 1. Каков перечень решаемых задач и состав аналитической платформы Deductor 5? 2. В чем заключена новизна взгляда на данные при применении аналитической платформы Deductor? 3. Какой объем выборки данных может обрабатывать демоверсия Deductor 5? 4. Какие задачи очистки данных можно решать с помощью аналитической платформы Deductor 5? 5. Перечислите известные области применения аналитической платформы Deductor 5.

Контрольные вопросы и задания для проведения промежуточной аттестации по итогам освоения дисциплины

Вопросы к зачету 1. Общие сведения об анализе данных: хранилища данных и OLAP-технологии, очистка и предобработка данных, алгоритмы анализа данных. 2. Классификация методов анализа данных. Использование арсенала классической статистики анализа данных (дисперсионный, корреляционный, регрессионный анализ). 3. Методика интеллектуального анализа данных: Knowledge Discovery in Databases - обнаружение знаний в базах данных. 4. Интеллектуальный анализ данных (Data Mining): задачи и стадии интеллектуального анализа данных. Типы закономерностей. 5. Понятие о классах систем интеллектуального анализа данных Data Mining и их примеры. 6. Обнаружение логических закономерностей в данных. Примеры логических правил в социологии, в экономике и управлении финансами, в медицине. Точность и полнота правил. Традиционные методы обнаружения логических закономерностей. 7. Логистическая регрессия как разновидность множественной регрессии. Логистическое или логит-преобразование. 8. Кластеризация – одна из фундаментальных задач в области анализа данных и Data Mining. Задача кластеризации категорийных и транзакционных данных: алгоритм кластеризации CLOPE. 9. Основные понятия из теории деревьев решений. Этапы построения деревьев решений. 10. Нейронные сети: схема нейрона, активационная функция – сигмоид. Нейронные сети обратного распространения (back propagation). 11. Система See5/C5.0 для построения деревьев решений и система WizWhy для поиска логических правил в данных. 12. Решения аналитических задач: корпоративная отчетность, прогнозирование, сегментация, поиск закономерностей с помощью аналитической платформы Deductor. 13. Базовые навыки и технологии работы с программой Deductor 5 как аналитической платформой для создания законченных прикладных решений в области анализа структурированных данных 14. Использование искусственного интеллекта в системах анализа текста.

Контрольные вопросы и задания для проведения промежуточной аттестации по итогам освоения дисциплины

Не предусмотрены