Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РП Интел анализ данных.rtf
Скачиваний:
8
Добавлен:
08.05.2015
Размер:
232.52 Кб
Скачать

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ОК-10, ОК-12, ПК-2, ПК-4

В результате освоения дисциплины студент должен:

а) знать:

  • модели представления и методы интеллектуальной обработки массивов данных

б) уметь:

  • применять современные системные программные средства интеллектуального анализа данных при исследовании социально-экономических процессов

в) владеть:

  • методами интеллектуального анализа и проектирования баз данных и знаний

4. Объём и виды учебной работы

Общая трудоемкость дисциплины составляет 3 зачётных единиц, 108 часов.

Вид учебной работы

Всего часов

Распределение по семестрам в часах

Номер семестра

7

Общая трудоёмкость дисциплины

108

108

Аудиторные занятия

54

54

Лекции (Л)

18

18

Практические занятия, семинары и (или) другие виды аудиторных занятий (ПЗ)

36

36

Лабораторные работы (ЛР)

0

0

Самостоятельная работа (СРС)

49

49

подготовка к практикам и семинарам

20

20

подготовка к зачету

9

9

подготовка реферата

20

20

Контроль самостоятельной работы студента (КСР)

5

5

защита докладов и отчетов

2

2

защита реферата

2

2

зачет

1

1

Вид итогового контроля (зачет, экзамен)

зачет

5. Содержание дисциплины

№раздела

Наименование разделов дисциплины

Объем аудиторных занятий по видам в часах

Всего

Л

ПЗ

ЛР

1

Общие сведения о методиках анализа данных, включая Knowledge Discovery in Databases, Data Mining

18

6

12

0

2

Развитие новых методов анализа данных и извлечения знаний: кластеризация, деревья решений, алгоритмы ограниченного перебора, системы для визуализации многомерных данных, нейронные сети и их программная реализация.

18

6

12

0

3

Знакомство с аналитической платформой, предоставляющей полный набор инструментов решения задач анализа данных для создания систем поддержки принятия решений (на примере Deductor).

18

6

12

0

5.1. Лекции

№лекции

№раздела

Наименование или краткое содержание лекционного занятия

Кол-вочасов

1

1

Общие сведения об анализе данных: хранилища данных и OLAP-технологии, очистка и предобработка данных, алгоритмы анализа данных. Классификация методов анализа данных. Использование арсенала классической статистики анализа данных (дисперсионный, корреляционный, регрессионный анализ).

2

2

1

Общая характеристика методов эволюционного моделирования и машинного обучения. Нейронные сети.

2

3

1

Методика интеллектуального анализа данных: Knowledge Discovery in Databases - обнаружение знаний в базах данных. Data Mining - добыча данных: задачи и стадии анализа, типы закономерностей, классы систем DM и их примеры

2

4

2

Логистическая регрессия как разновидность множественной регрессии. Логистическое или логит-преобразование. Нахождение коэффициентов логистической регрессии на основе использования метода максимального правдоподобия. Представление логистической регрессии в виде однослойной нейронной сети с сигмоидальной функцией активации

2

5

2

Кластеризация – числовые и категорийные атрибуты наборов данных. Масштабируемые и немасштабируемые, иерархические и неиерархические алгоритмы кластеризации. Задача кластеризации категорийных и транзакционных данных: алгоритм кластеризации CLOPE

2

6

2

Основные понятия из теории деревьев решений. Этапы построения деревьев решений: выбор критерия атрибута, по которому пойдет разбиение (теоретико-информационный и статистический критерий), остановки обучения и отсечения ветвей.

2

7

3

Инструментальные средства обнаружения знаний в данных: нейропакет PathFinder для работы с данными в Excel; система See5/C5.0 для построения деревьев решений; WizWhy — система поиска логических правил в данных.

2

8

3

Deductor как аналитическая платформа для создания систем поддержки принятия решений. Возможности Deductor по предоставлению полного набора инструментов для решения следующих задач анализа данных в государственных и муниципальных учреждениях

2

9

3

Системы компьютерного анализа текста на естественном языке, проблемы и подходы к их созданию (статистические и лингвистические). Задачи анализа текста. Примеры систем

2