Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
перевод статьи.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
55.81 Кб
Скачать

Результат и обсуждение

В следующей таблице 2 приведено сравнение между рабочими различных алгоритмов решения на основе различных параметров.

ALGO

ID3 & C4.5

CART

SLIQ

Измерение

Энтропия Информация усиления

Джини индекс разнообразия

Индекс Джини

Процедура

Вверх-вниз дерево решений конструкция

Создает двоичное дерево решений

Строительство Дерево решений в ширину первым способом

Сокращение

Предварительно обрезки с использованием одного алгоритма прохода

Сообщение обрезки на основе стоимостно-сложных измерений

Сообщение обрезки на основе принципа MDL (Minimum description length) минимальной длины описания

Для моего исследования, я беру набор данных из 600 студентов, принимая входные параметры или атрибуты т.е. класс, знаки и опции. Исходя из этих данных, anj.csv файл был создан. На рисунке показано окно проводника с WEKA инструмента с набором данных 600 студентов загружалась. Классифицировать панель позволяет пользователю применять SliQ алгоритм дерева решений, чтобы результирующий набор данных, чтобы оценить точность полученного прогнозной модели. Результаты моделирования разбивается на несколько подпунктов для облегчения анализа и оценки.

Мы видим, что SLIQ лучше, чем random forest, random tree. Время генерации, неправильно классифицированы экземпляры менее random forest и random tree, и это может определить более правильный классификация чем random forest и random tree.

Заключение и будущие возможности

Эффективность всех алгоритмов деревьев решение может анализироваться на основе их точности и времени, необходимого для получения дерево. Основными недостатками последовательного алгоритма дерева решений являются низкая точность классификации, когда данные обучение велика. Эта задача решается путем SliQ алгоритма дерева решений. SLIQ удаляет все ограничения памяти и точности проблему, которая приходит в других существующих алгоритмов. Это быстрый и масштабируемый, чем другие, потому что он может быть реализован как в последовательной и параллельной модификации для хорошего размещения данных и балансировки нагрузки. Результаты этого тезиса заключаются в следующих направлениях исследований, которые могут быть необходимы для дальнейшего совершенствования.

· Мы сможем узнать достижений студента на основе их выбора также предмет.

· Параллельная реализация SliQ среды могут быть использованы для расширения пространства поиска.