- •Методичні вказівки
- •Содержание
- •Введение
- •Знакомство с программой интеллектуального анализа данных weka и подготовка данных Цель работы
- •Основные теоретические сведения
- •Формат файлов данных arff
- •Предварительная обработка данных
- •Отбор атрибутов
- •Пропущенные значения
- •Нормализация данных
- •Дискретизация числовых атрибутов
- •Выборка (sampling)
- •Задание на лабораторную работу
- •Контрольные вопросы
- •Параметры настройки алгоритмов классификации
- •Методы оценки ошибок классификации
- •Критерии сравнения работы классификаторов
- •Интерпретация результатов классификации в weka (Classifier output)
- •Задание на лабораторную работу
- •Контрольные вопросы
- •Методы оценки качества прогнозирования
- •Задание на лабораторную работу
- •Контрольные вопросы
- •Параметры настройки алгоритмов
- •Интерпретация результатов кластеризации в weka (Clusterer output)
- •Задание на лабораторную работу
- •Контрольные вопросы
- •Интерпретация результатов
- •Задание на лабораторную работу
- •Контрольные вопросы
- •Содержание отчета
- •Литература
- •Приложение а. Интерфейс программы weka
- •Основное окно программы
- •Модуль Explorer
- •Загрузка и предварительная обработка данных (Preprocess)
- •Классификация (Classify)
- •Кластеризация (Cluster)
- •Ассоциативные правила (Associate)
- •Отбор атрибутов (Selecting attributes)
- •Визуализация (Visualizing)
- •Модуль Experimenter
- •Модуль Knowledge flow
- •Приложение б. Варианты индивидуальных заданий
- •Приложение в. Контрольная работа для заочников
Міністерство освіти і науки України
Запорізький національний технічний університет
Методичні вказівки
до лабораторних робіт
з дисципліни
“ІНТЕЛЕКТУАЛЬНИЙ АНАЛІЗ ДАНИХ”
для студентів напрямів підготовки 6.050103 “Програмна інженерія” та 6.050101 “Комп’ютерні науки”
всіх форм навчання
2016
Методичні
вказівки до лабораторних робіт з
дисципліни “Інтелектуальний аналіз
даних” для студентів напрямів підготовки
6.050103 “Програмна інженерія” та 6.050101
“Комп’ютерні науки” всіх форм навчання
/ Т.В. Юр. – Запоріжжя: ЗНТУ, 2013.
–
Автори: Т.В. Юр, к.т.н., доцент
Рецензент: В.І. Дубровін, к.т.н., проф., зав. кафедрою ПЗ
Відповідальний
за випуск: Т.В. Юр, к.т.н., доцент
|
Затверджено на засіданні кафедри програмних засобів
Протокол №1 від “21” серпня 2013 р. |
Содержание
Введение 4
Лабораторна робота № 1 Знакомство с программой интеллектуального анализа данных WEKA и подготовка данных 6
Лабораторна робота № 2 Задача классификации 19
Лабораторна робота № 3 Прогнозирование, задача регрессии 34
Лабораторна робота № 4 Задача кластеризации 40
Лабораторна робота № 5 Поиск ассоциативных правил 50
Литература 57
Приложение А. Интерфейс программы WEKA 58
Приложение Б. Варианты индивидуальных заданий 84
Приложение В. Контрольная работа для заочников 86
Введение
Целью практической части курса "Интеллектуальный анализ данных" является получение практических навыков использования рассмотренных на лекциях методов анализа для решения практических задач.
WEKA (Waikato Environment for Knowledge Analysis) – библиотека алгоритмов машинного обучения для решения задач интеллектуального анализа данных (data mining). Система позволяет непосредственно применять алгоритмы к выборкам данных, а также вызывать алгоритмы из программ на языке Java.
WEKA – продукт университета Уайкато (Новая Зеландия), который впервые был выпущен в его современном виде в 1997 году. WEKA распространяется по лицензии GNU General Public License. Это программное обеспечение написано на языке Java и обеспечивает графический пользовательский интерфейс для работы с файлами данных и генерации визуальных результатов (в виде таблиц и графиков). Кроме того, имеется возможность интегрировать WEKA, как и любую другую библиотеку, в свои собственные разрабатываемые приложения, например, для автоматизации анализа данных на стороне сервера, используя стандартный API.
Цели проекта – создать современную среду для разработки методов машинного обучения и применения их к реальным данным, сделать методы машинного обучения доступными для повсеместного применения. Предполагается, что с помощью данной среды специалист в прикладной области сможет использовать методы машинного обучения для извлечения полезных знаний непосредственно из данных очень большого объема.
Пользователями WEKA являются исследователи в области машинного обучения и прикладных наук. Она также широко используется в учебных целях.
Теоретические сведения, посвященные используемым алгоритмам интеллектуального анализа данных, можно получить из конспекта лекций по дисциплине «Интеллектуальный анализ данных» либо из рекомендуемых литературных источников. При выполнении лабораторных работ следует разобраться с кодом реализации рассматриваемых алгоритмов в программе WEKA.
