Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МНа Экзамен Ответы_окончательно.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
950.78 Кб
Скачать
  1. Виснаження простору версій;

Пространство версий - это набор всех гипотез, состоящих в тестовых данных.

Алгоритмы обучения концептам не работают с зашумленными или противоречивыми данными. В случае противоречивых данных мы получим истощение пространства версий. Оно происходит когда исчезает хотя бы одна из границ. Противоречивые примеры - это варианты шума, примеры с same значениями атрибутов, но с разными значениями классов.

  1. Особливості побудови дерев рішень. + та -. Передумови застосування д. рішень;

Каждый внутренний узел соответствует атрибуту, каждая ветвь, выходящая из узла соответствует возможному значению атрибута. Каждый лист соответствует значению целевой функции или классу. Каждая ветвь представляет собой конъюнкцию, между ветвями установлено отношение дизъюнкции.

Основная рекурсивная процедура построения дерева:

-выбираем наилучший решающий атрибут для текущего узла;

-for each значения этого атрибута строим ветви и намечаем потомков;

-сортируем текущие обучающие примеры к намеченным потомкам;

-if в потомке все примеры одинаково классифицированы, ставим лист и останавливаемся,

else вызываем эту функцию для узла потомка.

На каждом шаге выбираем тот атрибут, который ведет к самому короткому дереву (индуктивное предубеждение).

Предпосылки использования деревьев решений:

- примеры описываются парами Атрибут – Значение;

- целевая функция принимает дискретные значения;

- может требоваться дизъюнктивная гипотеза в результате обучения;

- возможно небольшое зашумление обучающих примеров.

Достоинства метода:

- быстрый процесс обучения;

- генерация правил в областях, где эксперту трудно формализовать свои знания;

- извлечение правил на естественном языке;

- интуитивно понятная классификационная модель;

- высокая точность прогноза, сопоставимая с другими методами

Недостатки:

- Очень часто алгоритмы построения деревьев решений дают сложные деревья, которые "переполнены данными", имеют много узлов и ветвей. Такие "ветвистые" деревья очень трудно понять. К тому же ветвистое дерево, имеющее много узлов, разбивает обучающее множество на все большее количество подмн-в, сост. из все меньшего количества объектов. 

  1. Алгоритм id3;

Алгоритм индукции дерева решений ID3 – это жадный алгоритм, который строит дерево сверху вниз (от корня к листьям), в каждом узле выбирая атрибут, который наилучшим образом классифицирует локальные обучающие примеры. Этот процесс продолжается рекурсивно, пока дерево не будет идеально классифицировать все обучающие примеры, или пока не будут использованы все атрибуты.

Входные параметры: Examples – текущие обучающие примеры, целевой атрибут, Attributes – множество атрибутов-кандидатов.

Алгоритм ID3:

1. Создаем корневой узел дерева Root.

2. if все обучающие примеры отрицательные, возвращаем дерево, которое состоит из одного корня с листом «-».

3. if все обучающие примеры положительные, возвращаем дерево, которое состоит из одного корня с листом «+».

4. if множество Attributes пустое, возвращаем дерево, которое состоит из одного корня с пометкой, которая соответствует самому распространенному значению целевого атрибута в множестве Examples.

5. else: цикл:

-выбираем атрибут А из множества Attributes, который наилучшим образом классифицирует примеры Examples;

-ставим атрибут в текущий корень Root;

-for each возможного значения vi атрибута А:

- добавляем новую ветвь от корня Root, соответствующую проверке А= vi;

- выделяем Examplesvi – множество примеров, где А= vi;

- если множество Examplesvi пустое:

-тогда на конце этой ветви добавляем лист с пометкой, соответствующей самому распространенному значению целевого атрибута Examples;

-else на конце ветви строим поддерево ID3 (Examplesvi, целевой атрибут, {Attributes – А}).

6. Возвращаем Root.

Поиск в пространстве гипотез ID3 происходит от общего к частному.

Специфические характеристики:

+ Пространство гипотез ID3 является полным.

- ID3 поддерживает только одну общую гипотезу в процессе поиска.

- ID3 не позволяет возвращаться назад в процессе поиска.

+ ID3 исп мн-во обуч примеров в процессе поиска для принятия статических решений отн улучшения текущей гипотезы. Уменьшается риск принятия ошибочного решения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]