Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
перевод статьи.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
55.81 Кб
Скачать

Оценка эффективности в системе образования, используя SliQ (Supervised Learning In Quest) дерево решений, классификация, алгоритм

Аннотация

В настоящее время, объем данных, сохраненных в образовательной базе данных стремительно растет. Эти базы данных содержат скрытую информацию для улучшение производительности студента. Дерево решений является наиболее полезно алгоритмом классификации в учебном интеллектуального анализа данных за простота исполнения и легче понять по сравнению с другими алгоритмамми. Алгоритмы деревьев решений ID3, C4.5 и CART были применены по данным студентов прогнозировать их эффективность. Но все эти 3 алгоритмы используются только для небольшой базы данных. Для большой базы мы используем новый алгоритм т.е. SliQ который удаляет все проблема ограничение памяти и точность приходит в другой алгоритмы. Это быстрый и масштабируемый, чем другие, потому что это может быть реализованы как в последовательной и параллельной стиля для хорошего данных размещение и балансировки нагрузки. В этой статье, я хотел бы реализации SliQ алгоритм дерева решений, а затем сравнить свои результаты с другими алгоритмами, как Random Forest и Random Tree, чтобы выяснить, что дает лучшую производительность для прогнозирования улучшение производительность студентов.

Ключевые слова: Data Mining, Обучающий интеллектуальный анализ данных, Классификация, Алгоритм, Деревья решений, ID3, C4.5, CART, SLIQ.

Введение

Образование является важным элементом для улучшения и прогресса страны. Это делает народ страны цивилизованными и воспитанными. Добыча в образовательной среде называется учебное интеллектуального анализа данных. Обучающие интеллектуального анализа данных является предстоящее поле связано с несколькими прочно установившимися областях исследований, включая электронное обучение, адаптивной гипермедиа, интеллектуальных обучающих систем, веб добычи и данных добыча и т.д. Как известно, большое количество данных хранится в образовательной базе данных; интеллектуального анализа данных является процесс обнаружения интересные знания из этих больших объемов данных, хранящихся в базе данных, хранилища данных или других информационных хранилищ. Ряд методов добычи данных уже было сделано по воспитательной интеллектуального анализа данных для повышения производительности студентов, как регрессия, генетический алгоритм, заливов классификации, К-средних кластеризации, ассоциированных правила, прогноз и т.д. методы добычи данных могут быть использованы в образовательной сфере в повысить наше понимание процесса обучения, чтобы сосредоточиться на выявлении, извлечения и оценки переменных, связанных с процессом обучения студентов. Классификация является одним из наиболее часто изучал проблемы по интеллектуального анализа данных и машинного обучения исследователей. Он состоит из прогнозирования значение категорического атрибута на основе значения других атрибутов. Классификация методов, как деревья решений, добычи правило, байесовских сетей и т.д. могут быть применены на учебных данных для предсказания поведения студентов, производительность в экзаменационной т.д. Схема принятия решений является блок-схема, как древовидная структура, где каждый внутренний узел обозначается прямоугольники и листовые узлы обозначены овалами. Легко понять, для пользователей. Это самый полезный алгоритм, поскольку он прост в реализации. Исход дерева решений предсказал количество студентов, которые, вероятно, чтобы пройти, неудачу или повышен до следующего года. Дерево решений может быть построена относительно быстро по сравнению с другими методами классификации. Деревья могут быть легко преобразованы в SQL заявления, которые могут быть использованы доступа к базам данных эффективно. Схема принятия решений классификаторы получить похожи и иногда лучше точность по сравнению с другими методами классификации.