Скачиваний:
0
Добавлен:
12.04.2025
Размер:
868.54 Кб
Скачать

ГУАП

КАФЕДРА № 82

ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ

ПРЕПОДАВАТЕЛЬ

доцент, канд. техн. наук

А.Д. Державина

должность, уч. степень, звание

подпись, дата

инициалы, фамилия

ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №2

ПРЕОБРАЗОВАНИЕ ДАННЫХ

по курсу: ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

РАБОТУ ВЫПОЛНИЛ

СТУДЕНТ гр. №

4116

подпись, дата

инициалы, фамилия

Санкт-Петербург 2024

Цель работы: ознакомиться с типами данных RapidMiner и возможностями стандартного преобразования типов данных с помощью встроенных в среду RapidMiner операторов.

Ход работы

Выбран набор данных Golf (Рисунок 1-2).

Рисунок 1 – Набор данных Golf

Рисунок 2 – Статистика Golf

Создан процесс, которые преобразует данные типа числовые (numerical) в nominal (Рисунок 3-4).

Рисунок 3 – Процесс преобразования

Рисунок 4 – Результат выполнения процесса

Реализован процесс для обратного преобразования столбцов, которые были integer (numerical) (Рисунок 5-6).

Рисунок 5 – Процесс обратного преобразования

Рисунок 6 – Результат обратного преобразования

Взят набор данный food и тип данных date преобразован в тип данных numeric, чтобы от даты остался только год (Рисунок 7-11)

Рисунок 7 – Набор данных food

Рисунок 8 – Статистика food

Рисунок 9 – Процесс преобразования даты

Рисунок 10 – Статистика после преобразования

Рисунок 11 – Набор данных после преобразования

Выбран набор данных Weighting и создан процесс для преобразования Real в Integer с округление в большую сторону (Рисунок 12-16).

Рисунок 12– Набор данных weighting

Рисунок 13 – Статистика weighting

Рисунок 14 – Процесс для преобразования Real в Integer

Рисунок 15 – Статистика weighting после преобразования

Рисунок 16 – Набор данных Products после преобразования

Вывод: в ходе выполнения лабораторной работы были освоены навыки работы с преобразованиями типов данных, разработаны процессы изменения типов данных для разных наборов данных.

Ответы на контрольные вопросы:

  1. Какие типы данных могут быть использованы в RapidMiner?

  • Nominal - все виды текстовых значений полиноминальные и биноминальные)

  • Numeric - все виды числовых значений (дата, время, целые и дробные)

  • Integer - целые числа

  • Real - дробные числа

  • text - случайный свободный текст без структуры.

  • Binominal – частный случай текстовых данных, допускающий только два значения.

  • polynominal - частный случай биноминальных данных больше, чем с двумя значениями

  • date_time - дата, и время

  • date - дата без времени

  • time - время без даты

  1. Какой смысл параметра Name?

Это уникальный идентификатор для каждого столбца данных, который помогает отличать различные атрибуты друг от друга.

  1. Какой смысл параметра Type?

Параметр Type определяет тип данных атрибута. От того, какой тип зависит, то какие процессы можно совершить над атрибутами.

  1. Какой смысл параметра Range?

Параметр Range определяет допустимый диапазон значений для атрибута. Его смысл заключается в том, чтобы определить, какие значения атрибут может принимать.

  1. Какой смысл параметра Missing?

Параметр Missing указывает, есть ли в наборе данных отсутствующие значения для конкретного атрибута.

  1. Какой смысл параметра Role?

Параметр Role определяет назначение атрибута в процессе анализа данных. Например, целевая переменная, идентификатор, прогнозируемое значение.

  1. Какой смысл роли label?

Роль label назначается атрибуту, который является целевой переменной в задаче машинного обучения. Переменная, значение которой патаются предсказать, основываясь на других атрибутах.

  1. Какой смысл роли id?

Роль ID используется для уникальных идентификаторов записей. Этот атрибут должен быть уникальным для каждой строки данных

  1. Какой смысл ролей prediction, cluster?

Атрибут с ролью prediction представляет прогнозируемое значение, которое модель выдает после обработки данных. Это предсказание основано на обучении модели на целевой переменной.

Атрибут с ролью cluster представляет кластер, к которому относится запись в процессе кластеризации.

  1. Какой смысл ролей weight, batch?

Атрибут с ролью weight используется для указания весов наблюдений. Веса позволяют моделям учитывать важность или значимость каждой записи.

Роль batch используется для обработки данных партиями. Это может быть полезно для обработки большого объема данных, разделенного на блоки, или для выполнения вычислений в несколько этапов.

Соседние файлы в предмете Интеллектуальные информационные системы