- •Южно-уральский государственный университет
- •Рабочая программАк ооп________________от №_______________
- •1. Цели и задачи дисциплины
- •2. Место дисциплины в структуре ооп
- •3. Компетенции обучающегося, формируемые в результате освоения дисциплины
- •4. Объём и виды учебной работы
- •5. Содержание дисциплины
- •5.1. Лекции
- •5.2. Практические занятия, семинары
- •5.3. Лабораторные работы
- •5.4. Самостоятельная работа студента и ее контроль
- •6. Образовательные технологии, используемые в учебном процессе данной дисциплины
- •8. Учебно-методическое и информационное обеспечение дисциплины
- •9. Материально-техническое обеспечение дисциплины
3. Компетенции обучающегося, формируемые в результате освоения дисциплины
ОК-10, ОК-12, ПК-2, ПК-4
В результате освоения дисциплины студент должен:
а) знать:
модели представления и методы интеллектуальной обработки массивов данных
б) уметь:
применять современные системные программные средства интеллектуального анализа данных при исследовании социально-экономических процессов
в) владеть:
методами интеллектуального анализа и проектирования баз данных и знаний
4. Объём и виды учебной работы
Общая трудоемкость дисциплины составляет 3 зачётных единиц, 108 часов.
Вид учебной работы |
Всего часов |
Распределение по семестрам в часах |
Номер семестра | ||
7 | ||
Общая трудоёмкость дисциплины |
108 |
108 |
Аудиторные занятия |
54 |
54 |
Лекции (Л) |
18 |
18 |
Практические занятия, семинары и (или) другие виды аудиторных занятий (ПЗ) |
36 |
36 |
Лабораторные работы (ЛР) |
0 |
0 |
Самостоятельная работа (СРС) |
49 |
49 |
подготовка к практикам и семинарам |
20 |
20 |
подготовка к зачету |
9 |
9 |
подготовка реферата |
20 |
20 |
Контроль самостоятельной работы студента (КСР) |
5 |
5 |
защита докладов и отчетов |
2 |
2 |
защита реферата |
2 |
2 |
зачет |
1 |
1 |
Вид итогового контроля (зачет, экзамен) |
|
зачет |
5. Содержание дисциплины
№раздела |
Наименование разделов дисциплины |
Объем аудиторных занятий по видам в часах | |||
Всего |
Л |
ПЗ |
ЛР | ||
1 |
Общие сведения о методиках анализа данных, включая Knowledge Discovery in Databases, Data Mining |
18 |
6 |
12 |
0 |
2 |
Развитие новых методов анализа данных и извлечения знаний: кластеризация, деревья решений, алгоритмы ограниченного перебора, системы для визуализации многомерных данных, нейронные сети и их программная реализация. |
18 |
6 |
12 |
0 |
3 |
Знакомство с аналитической платформой, предоставляющей полный набор инструментов решения задач анализа данных для создания систем поддержки принятия решений (на примере Deductor). |
18 |
6 |
12 |
0 |
5.1. Лекции
№лекции |
№раздела |
Наименование или краткое содержание лекционного занятия |
Кол-вочасов |
1 |
1 |
Общие сведения об анализе данных: хранилища данных и OLAP-технологии, очистка и предобработка данных, алгоритмы анализа данных. Классификация методов анализа данных. Использование арсенала классической статистики анализа данных (дисперсионный, корреляционный, регрессионный анализ). |
2 |
2 |
1 |
Общая характеристика методов эволюционного моделирования и машинного обучения. Нейронные сети. |
2 |
3 |
1 |
Методика интеллектуального анализа данных: Knowledge Discovery in Databases - обнаружение знаний в базах данных. Data Mining - добыча данных: задачи и стадии анализа, типы закономерностей, классы систем DM и их примеры |
2 |
4 |
2 |
Логистическая регрессия как разновидность множественной регрессии. Логистическое или логит-преобразование. Нахождение коэффициентов логистической регрессии на основе использования метода максимального правдоподобия. Представление логистической регрессии в виде однослойной нейронной сети с сигмоидальной функцией активации |
2 |
5 |
2 |
Кластеризация – числовые и категорийные атрибуты наборов данных. Масштабируемые и немасштабируемые, иерархические и неиерархические алгоритмы кластеризации. Задача кластеризации категорийных и транзакционных данных: алгоритм кластеризации CLOPE |
2 |
6 |
2 |
Основные понятия из теории деревьев решений. Этапы построения деревьев решений: выбор критерия атрибута, по которому пойдет разбиение (теоретико-информационный и статистический критерий), остановки обучения и отсечения ветвей. |
2 |
7 |
3 |
Инструментальные средства обнаружения знаний в данных: нейропакет PathFinder для работы с данными в Excel; система See5/C5.0 для построения деревьев решений; WizWhy — система поиска логических правил в данных. |
2 |
8 |
3 |
Deductor как аналитическая платформа для создания систем поддержки принятия решений. Возможности Deductor по предоставлению полного набора инструментов для решения следующих задач анализа данных в государственных и муниципальных учреждениях |
2 |
9 |
3 |
Системы компьютерного анализа текста на естественном языке, проблемы и подходы к их созданию (статистические и лингвистические). Задачи анализа текста. Примеры систем |
2 |