Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИАД_методичка.doc
Скачиваний:
70
Добавлен:
07.02.2016
Размер:
622.59 Кб
Скачать

25

Міністерство освіти і науки, молоді та спорту України

Запорізький національний технічний університет

Методичні вказівки

до лабораторних робіт

з дисципліни

Інтелектуальний аналіз даних”

для студентів

напряму підготовки 6.050103

“Програмна інженерія”

всіх форм навчання

2012

Методичні вказівки до лабораторних робіт з дисципліни “Інтелектуальний аналіз даних” для студентів напряму підготовки 6.050103 “Програмна інженерія” всіх форм навчання / Т.В. Юр, В.М. Льовкін. – Запоріжжя: ЗНТУ, 2012. – ХХ с.

Автори: Т.В. Юр, ст. викладач,

В.М. Льовкін, асистент

Рецензент:

Відповідальний

за випуск:

Затверджено

на засіданні кафедри

програмних засобів

Протокол №Х

від “__” _________ 2012 р.

Содержание

Введение 4

Лабораторная работа №1 Знакомство с программой интеллектуального анализа данных Weka 5

Література 25

Введение

  1. Знакомство с программой интеллектуального анализа данных Weka

    1. Цель работы

Ознакомиться и получить навыки работы с GUI интерфейсом библиотеки data mining алгоритмов WEKA

    1. Основные теоретические сведения

WEKA (Waikato Environment for Knowledge Analysis) – библиотека алгоритмов машинного обучения для решения задач интеллектуального анализа данных (data mining) [2]. Система позволяет непосредственно применять алгоритмы к выборкам данных, а также вызывать алгоритмы из программ на языке Java.

WEKA – продукт университета Уайкато (Новая Зеландия), который впервые был выпущен в его современном виде в 1997 году. WEKA распространяется по лицензии GNU General Public License (GPL). Это программное обеспечение написано на языкеJava™ и обеспечивает графический пользовательский интерфейс для работы с файлами данных и генерации визуальных результатов (в виде таблиц и графиков). Кроме того, вы можете интегрировать WEKA, как и любую другую библиотеку, в свои собственные приложения, например, для автоматизации анализа данных на стороне сервера, используя стандартный API.

Цели проекта – создать современную среду для разработки методов машинного обучения и применения их к реальным данным, сделать методы машинного обучения доступными для повсеместного применения. Предполагается, что с помощью данной среды специалист в прикладной области сможет использовать методы машинного обучения для извлечения полезных знаний непосредственно из данных, возможно, очень большого объёма.

Пользователями Weka являются исследователи в области машинного обучения и прикладных наук. Она также широко используется в учебных целях.

Weka содержит средства для предварительной обработки данных, классификации, регрессии, кластеризации, отбора признаков, поиска ассоциативных правил и визуализации. Weka хорошо подходит для разработки новых подходов в машинном обучении.

      1. Начало работы

Основное окно программы Weka GUI Chooser (см. рис. 1.1). Опишем более подробно назначение управляющих элементов данного окна.

Рис. 1.1. Основное окно программы WEKA.

Основное окно предоставляет доступ к четырем модулям программы:

• Explorer– среда для исследования данных;

• Experimenter– среда для проведения сравнительного анализа работы различных алгоритмов при обработке одного и того же набора данных;

• KnowledgeFlow– данная среда поддерживает такую же функциональность, как иExplorer, но с применением интерфейсаdrug-and-drop; его достоинство заключается в том, что он поддерживает инкрементное обучение;

• SimpleCLI– командный интерфейс для непосредственного исполнения команд WEKA.

Главное меню программы состоит из четырех пунктов:

  1. Program

  • LogWindowоткрывает окно логов, которое сохраняет всю информацию, выводимую в потоки stdout или stderr. Полезно для сред типа MSWindows, в которых обычно WEKA не запускается из терминала.

  • Memory usage – использование памяти.

  • Exit.

  1. Tools– Другие полезные средства.

  • ArffViewer– редактор arff-файлов.

  • SqlViewerмодуль просмотра баз данных, для SQL запросов к базам данных посредством JDBC.

  • Bayesnet editor– модуль для редактирования, визуализации и обучения Байесовых сетей (Bayes nets).

  1. Visualization– средства визуализации данных WEKA.

  • • Plot – отображения 2D-графика набора данных.

  • • ROC – отображает ранее сохраненную ROC-кривую.

  • • TreeVisualizer– отображает направленные графы, т.е. деревья решений.

  • • GraphVisualizer– визуализирует графику в формате XML BIF или DOT для Байесовых сетей.

  • • BoundaryVisualizer –позволяет визуализировать границы решений классификаторов в двух измерениях.

  1. Help– Online ресурсы, посвященные WEKA.

  • • Weka homepage– открывает домашнюю страницу проекта WEKA.

  • • HOWTOs, code snippets, etc. – WekaWiki, содержащая множество примеров и HOWTOs касающихся разработки и использования WEKA.

  • • Weka on Sourceforge– страница проекта WEKA на Sourceforge.net.

  • • SystemInfo– содержит значения некоторых переменных среды Java/WEKA.