Міністерство
освіти і науки, молоді та спорту України
Національний
університет “Львівська політехніка”
Кафедра
автоматизованих систем управління
Методичні вказівки
до лабораторної роботи № 3
“Методи побудови математичних функцій стосовно класифікації і регресії.”
з дисципліни
“ Інтелектуальний аналіз даних ”
для студентів базового напрямку підготовки по спеціальності
“ Комп’ютерні науки ” (шифр 0804)
Львів - 2013
Методичні вказівки до лабораторної роботи № 6 «Методи побудови математичних функцій стосовно класифікації і регресії.» з дисципліни «Інтелектуальний аналіз даних» для студентів спеціальності - шифр 0804 “Комп’ютерні науки”/ Укл. доц. Ковівчак Я.В., Львів: Національний університет «Львівська політехніка», 2013.
Методичні вказівки обговорено та схвалено на засіданні кафедри АСУ Протокол № ___________ від «___»___________2013 р.
Завідувач кафедрою АСУ ______________ Рашкевич Ю. М.
Методичні вказівки обговорено та схвалено на засіданні методичної комісії базового напрямку підготовки
Протокол № ___________ від «___»___________2013 р.
Лабораторна робота № 3
Класифікація та регресія. Методи побудови математичних функцій.
Мета: Ознайомитись з методами побудови математичних функцій.
Завдання: Навчитись розв’язувати завдання, використовуючи один з методів побудови математичних функцій.
Теоретична частина
Data Mining - дослідження і виявлення «машиною» (алгоритмами, методами штучного інтелекту) в сирих даних прихованих знань, які раніше не були відомі, нетривіальні, корисні на практиці, доступні для інтеграції людиною.
Методи Data Mining допомагають вирішити безліч завдань, з якими стикається аналітик. Серед них основними є: класифікація, регресія, пошук асоціативних правил и кластеризації.
Розглянемо методи класифікації і регресії.
Класифікація і регресія. Постановка задачі.
Класифікація — система розподілення об'єктів (процесів, явищ) за класами (групами тощо) відповідно до визначених ознак. Інколи вживають термін категоризація у значенні "розподілення об'єктів на категорії".
Регресійний аналіз — розділ математичної статистики, присвячений методам аналізу залежності однієї величини від іншої.
В задачі класифікації і регресії необхідно визначити значення залежної змінної об’єкту на основі інших змінних, що характеризують даний об’єкт. Формально задачу класифікації і регресії можна описати наступним чином. Існує множина об’єктів:
I={i1, i2,…, ij, …, in} (1)
де ij – об’єкт вивчення. Прикладом таких об’єктів може бути інформація про проведення ігор при різних метео умовах
Таблиця 1
Спостереження |
Температура |
Вологість повітря |
Вітер |
Гра |
Сонце |
Жарко |
Висока |
Нема |
Нема |
Сонце |
Жарко |
Висока |
Є |
Нема |
Хмарно |
Жарко |
Висока |
Нема |
Є |
Дощ |
Норма |
Висока |
Нема |
Є |
Хмарно |
Холодно |
Норма |
Є |
Є |
Кожен об’єкт характеризується набором змінних:
Ij={x1, x2, …, xh, …, xm,, y} (2)
Кожна змінна xh може приймати значення з деякої множини:
Ch= {ch1, ch2,…} (3)
Якщо значеннями змінної є елементи скінченної множини, то кажуть, що вона має категоріальний тип. Наприклад, змінна спостереження набуває значення з множини значень {сонце, хмарно, дощ}.
Якщо множина значень C={c1, c2, …, cr, …, ck} змінної у скінченна, то задача називається задачею класифікації.
Якщо змінна у приймає значення на множині дійсних чисел R, то задача називається задачею регресії.
В задачах класифікації і регресії знайдена функціональна залежність між змінними може бути представлена одним зі способів:
Класифікаційні правила;
Дерева рішень;
Математичні функції.
