Скачиваний:
51
Добавлен:
16.04.2021
Размер:
1.79 Mб
Скачать

ГУАП

КАФЕДРА № 82

ОТЧЕТ

ЗАЩИЩЕН С ОЦЕНКОЙ

ПРЕПОДАВАТЕЛЬ

кандидат тех. наук

В.С. Блюм

должность, уч. степень, звание

подпись, дата

инициалы, фамилия

ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №2

ПРЕОБРАЗОВАНИЕ ДАННЫХ

по курсу: Интеллектуальные информационные системы

РАБОТУ ВЫПОЛНИЛА

СТУДЕНТКА ГР.

4716

С.А. Янышева

подпись, дата

инициалы, фамилия

Санкт-Петербург

2020

Лабораторная работа № 2

Преобразование данных

  1. Цель работы

Ознакомится со структурой типов данных RapidMiner и возможностями стандартного преобразования типов данных с помощью встроенных в среду RapidMiner операторов.

  1. Выполнение работы

Создан новый процесс для преобразования типа данных numerical в nominal. Для выполнения преобразования выбран встроенный набор данных «Termination Data», представленный на рисунке 1, и оператор Format. Разработанный блок преобразования приведён на рисунке 2. Вывод программы с преобразованным типом данных показан на рисунке 3.

Рисунок 1 – Строение набора данных «Termination Data»

Рисунок 2 – Преобразование данных типа numerical в nominal

Рисунок 3 – Строение данных с преобразованным типом

Рисунок 4 – Преобразование типа данных nominal в numerical

Рисунок 5 – Результат обратного преобразования типа nominal в numerical

Рисунок 6 – Таблица данных

  1. Выводы о проделанной работе

Выполнено знакомство со структурой типов данных RapidMiner и возможностями стандартного преобразования типов данных с помощью встроенных в среду RapidMiner операторов.

  1. Ответы на контрольные вопросы

  1. Nominal (текстовые значения), numeric (числовые), integer (целые числа), real (дробные числа), text (свободный текст), binominal (текстовый, допускающий два значения), polynominal (текстовый, более двух значений), date_time (дата и время), date, time.

  2. Является именем колонки, которое используется при работе с таблицами. Исключает использование конкретного физического адреса памяти для обращения к конкретной ячейке.

  3. Используется для фиксации типа значения.

  4. Является параметром атрибута, используется для поиска случайных выбросов в реальных данных. Вычисляется автоматически.

  5. Параметр фиксирует факт наличия или отсутствие в составе колонки пропущенных данных. Если они присутствуют в таблице, то при составлении алгоритма решения задачи могут дополнительно потребоваться специальные действия.

  6. Указывает назначение таблицы или атрибута.

  7. Label указывает, что соответствующий атрибут используется для обучения. Такой атрибут может называться «целевой переменной» или «классом».

  8. Используется для указания записи таблицы.

  9. Значение роли prediction означает, что этот атрибут является результатом прогнозирования. Такие колонки появляются в таблицах после выполнения оператора ApplyModel, например, в результате решения задачи регрессии. Аналогичная ситуация и со значением роли cluster. Атрибут с ролью кластера указывает на принадлежность таблицы с данными к определенному кластеру. Например, оператор k-means добавляет такое значение.

  10. Weight указывает вес примеров по отношению к, используемой в сочетании с ним, роли label. Веса используются в процессах обучения для определения важности предметов. Batch указывает на принадлежность атрибута к определённому пакету (группе).

Соседние файлы в предмете Интеллектуальные информационные системы