Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АД_МетодЛБ_Финал.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.93 Mб
Скачать

31

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ

Методичні вказівки до лабораторних та практичних занять з дисципліни «аналіз даних»

ХАРКІВ 2010

Методичні вказівки до лабораторних та практичних занять з дисципліни «Аналіз даних» для cтудентів денної форми навчання спеціальностей: 7.080401, 8.080401 «Інформатика» /Упоряд.: В.О.Гороховатський  Х.: ХНУРЕ, 2010.  47с.

Упорядник: в.О. Гороховатський

ЗМІСТ

Загальні положення.................................................................................................4

1 Перевірка статистичних гіпотез……………………………..............................5

2 Кореляція і регресія…………………..………....................................................7

3 Побудова правил класифікації та дерев рішення ………...............................15

4 Формування асоціативних правил....................................................................19

5 Застосування кластерного аналізу……………….………………………….. 25

6 Реалізація завдань АД в пакеті «Статистика»……………………………….25

7 Завдання для самостійного виконання………………….................................25

8 Комплексне завдання з курсу «Інтелектуальний аналіз даних»……………

Перелік посилань...................................................................................................

ЗАГАЛЬНІ ПОЛОЖЕННЯ

Методи аналізу даних (АД) знаходять все більше поширення та застосування тому, що об’єм інформації, який аналізує та обробляє людство у процесі свого розвитку, подвоюється кожні 2-3 роки [1,2]. Єдина надія щось зрозуміти та знайти щось цінне у цьому практично безмежному океані даних – це застосування методів АД, які у сучасній науковій літературі отримали назву Data Mining (здобування даних, виявлення знань та закономірностей для оброблюваних даних).

Data Mining вивчає процес знаходження нових та потенційно корисних знань у базах різноманітних даних. Дисципліна Data Mining знаходиться на перетині декількох наук, головні серед яких – це системи баз даних, статистика та штучний інтелект. Математичний та статистичний підходи є основою для побудови методів Data Mining.

Англомовний термін «Data Mining» не має однозначного переводу на українську мову (здобування, викривання, видобування даних/інформації, інформаційне проходження), тому часто використовується в оригіналі. Найбільш вдалим перекладом вважається термін «інтелектуальний аналіз даних» (ІАД).

Методичні вказівки містять опис лабораторних занять, де для ІАД використовуються як традиційні методи (перевірка гіпотез, кореляція, регресія, кластеризація), так і недавно розроблені методи та засоби (побудова класифікаційних правил, дерев рішень, асоціативних правил, використання технології OLAP) Для вирішення задач Data Mining використовується ряд сучасних програмних пакетів, серед яких є Statistica та MatLab (Матлаб).

Завдання до лабораторних занять виконуються групою у складі 2-3 студентів, написання звіту та захист роботи здійснюється індивідуально. Звіт з лабораторного заняття повинен містити:

1) мету і задачі лабораторної роботи;

2) опис процесу виконання завдання та коментарі щодо отриманих проміжних результатів із вмістом таблиць і графіків;

3) інтерпретацію отриманих результатів та висновки.