
- •Методичні вказівки до лабораторних та практичних занять з дисципліни «аналіз даних»
- •Упорядник: в.О. Гороховатський
- •5 Застосування кластерного аналізу……………….………………………….. 25
- •1 Перевірка статистичних гіпотез
- •1.1 Мета роботи
- •1.2 Вказівки по організації самостійної роботи студентів
- •Варіанти індивідуальних завдань
- •1.4 Контрольні запитання і завдання
- •2 Кореляція і регресія
- •2.1 Мета роботи
- •2.2 Вказівки по організації самостійної роботи студентів
- •2.3 Варіанти індивідуальних завдань
- •2.4 Контрольні запитання і завдання
- •3 Побудова правил класифікації та дерев рішення
- •3.1 Мета роботи
- •3.2 Вказівки по організації самостійної роботи студентів
- •3.3 Приклад реалізації алгоритму id3
- •3.4 Варіанти індивідуальних завдань
- •3.5 Контрольні запитання і завдання
- •4 Формування асоціативних правил
- •4.1 Мета роботи
- •4.2 Вказівки по організації самостійної роботи студентів
- •4.3 Варіанти індивідуальних завдань
- •5.3 Варіанти індивідуальних завдань
- •5.4 Контрольні запитання і завдання
- •6 Завдання для самостійного виконання
- •7 Комплексне завдання з курсу «Інтелектуальний аналіз даних»
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ
Методичні вказівки до лабораторних та практичних занять з дисципліни «аналіз даних»
ХАРКІВ 2010
Методичні вказівки до лабораторних та практичних занять з дисципліни «Аналіз даних» для cтудентів денної форми навчання спеціальностей: 7.080401, 8.080401 «Інформатика» /Упоряд.: В.О.Гороховатський Х.: ХНУРЕ, 2010. 47с.
Упорядник: в.О. Гороховатський
ЗМІСТ
Загальні положення.................................................................................................4
1 Перевірка статистичних гіпотез……………………………..............................5
2 Кореляція і регресія…………………..………....................................................7
3 Побудова правил класифікації та дерев рішення ………...............................15
4 Формування асоціативних правил....................................................................19
5 Застосування кластерного аналізу……………….………………………….. 25
6 Реалізація завдань АД в пакеті «Статистика»……………………………….25
7 Завдання для самостійного виконання………………….................................25
8 Комплексне завдання з курсу «Інтелектуальний аналіз даних»……………
Перелік посилань...................................................................................................
ЗАГАЛЬНІ ПОЛОЖЕННЯ
Методи аналізу даних (АД) знаходять все більше поширення та застосування тому, що об’єм інформації, який аналізує та обробляє людство у процесі свого розвитку, подвоюється кожні 2-3 роки [1,2]. Єдина надія щось зрозуміти та знайти щось цінне у цьому практично безмежному океані даних – це застосування методів АД, які у сучасній науковій літературі отримали назву Data Mining (здобування даних, виявлення знань та закономірностей для оброблюваних даних).
Data Mining вивчає процес знаходження нових та потенційно корисних знань у базах різноманітних даних. Дисципліна Data Mining знаходиться на перетині декількох наук, головні серед яких – це системи баз даних, статистика та штучний інтелект. Математичний та статистичний підходи є основою для побудови методів Data Mining.
Англомовний термін «Data Mining» не має однозначного переводу на українську мову (здобування, викривання, видобування даних/інформації, інформаційне проходження), тому часто використовується в оригіналі. Найбільш вдалим перекладом вважається термін «інтелектуальний аналіз даних» (ІАД).
Методичні вказівки містять опис лабораторних занять, де для ІАД використовуються як традиційні методи (перевірка гіпотез, кореляція, регресія, кластеризація), так і недавно розроблені методи та засоби (побудова класифікаційних правил, дерев рішень, асоціативних правил, використання технології OLAP) Для вирішення задач Data Mining використовується ряд сучасних програмних пакетів, серед яких є Statistica та MatLab (Матлаб).
Завдання до лабораторних занять виконуються групою у складі 2-3 студентів, написання звіту та захист роботи здійснюється індивідуально. Звіт з лабораторного заняття повинен містити:
1) мету і задачі лабораторної роботи;
2) опис процесу виконання завдання та коментарі щодо отриманих проміжних результатів із вмістом таблиць і графіків;
3) інтерпретацію отриманих результатів та висновки.