
- •1. Процес набуття знань. Його мета, основні складнощі. Функції його учасників.
- •2. Основні стадії процесу набуття знань та їх взаємодія.
- •3. Види методів витягу знань з експерта.
- •4. Оболонки експертних систем. Система emysin, як універсальна оболонка.
- •5. Система teiresias як універсальний інтерфейс експертної системи
- •6. Що таке дані? Набори даних, види даних.
- •7. Дані. Шкалування даних.
- •8. Інтелектуальний аналіз даних. Основні стадії.
- •9. Задачі інтелектуального аналізу даних.
- •10.Задача класифікації, як задача інтелектуального аналізу даних.
- •11. Процесс розв’язання задачі класифікації інтелектуального аналізу даних
- •12.Задача кластерізації, як задача інтелектуального аналізу даних.
- •Методы кластеризации
- •13. Порівняння задач класифікації та кластерізації.
- •15. Дерево прийняття рішень як апроксимація булевської функції
- •16. Дерева прийняття рішень. Ентропія, як характеристика цільової функції.
- •17. Критерій приросту інформації. Проблеми з критерієм приросту інформації.
- •18. Дерева прийняття рішень. Оверфіттінг
- •19. Генетичний алгоритм. Загальна схема генетичного алгоритма.
- •20. Генетична операція «кроссовер».
- •21. Представлення даних у вигляді бітових рядків.
- •22. Відбір, як основний елемент генетичного алгоритму.
- •23. Покажіть на прикладі «метод рулетки» та «ранговий метод», як методи відбору генетичного алгоритму.
- •24. Відображення теорій Ламарка та Болдуіна у генетичних алгоритмах.
21. Представлення даних у вигляді бітових рядків.
З курсу біології ми знаємо, що будь-який організм може бути поданий своїм фенотипом, який фактично визначає, чим є об'єкт у реальному світі, і генотипом, який містить інформацію про об'єкт на рівні хромосомного набору. При цьому кожен ген, тобто елемент інформації генотипу, має своє відображення у фенотипі. Таким чином, для розв'язання задач нам необхідно зобразити кожну ознаку об'єкта у формі, придатній для використання в генетичному алгоритмі. Усе функціонування генетичного алгоритму вимагає лише інформацію про генотип, тобто інформація про об'єкт не потрібна. Найпоширенішим різновидом кодування є побітове, тобто використання бітових рядків. При цьому кожному атрибуту об'єкта у фенотипі відповідає один ген у генотипі. Для кодування ознак можна скористатись найпростішим варіантом: двійковим значенням цієї ознаки. Тоді легко використовувати бітові рядки фіксованої довжини для подання всіх можливих значень цієї ознаки. Наприклад, десяткові числа 7 і 8 можна легко закодувати у двійкові числа B(7)=011 і B(8)=100, використовуючи двійкову техніку. Проте, якщо ми хочемо переміститися з фенотипу 7 у фенотип 8, то повинні змінити всі чотири біти в їх зображенні від B(7)=011 до B(8)=100. Інакше кажучи, при роботі ГА необхідні чотири окремі дії для переміщення від розв'язку 7 до розв'язку 8, які призведуть до додаткових витрат часу. З іншого боку, якщо ми хочемо переміститися від розв'язку 7 до розв'язку 8, то нам необхідна лише одна операція. Це ускладнює використання ГА й погіршує його збіжність. Щоб уникнути цього, краще використовувати кодування, в якому значення розрізняються на один біт. Таким є код Ґрея.
22. Відбір, як основний елемент генетичного алгоритму.
Генети́ческий
алгори́тм (англ. genetic algorithm) — это
эвристический алгоритм поиска,
используемый для решения задач
оптимизации и моделирования путём
случайного подбора, комбинирования и
вариации искомых параметров с
использованием механизмов, напоминающих
биологическую эволюцию. Является
разновидностью эволюционных вычислений.
Отличительной особенностью генетического
алгоритма является акцент на использование
оператора «скрещивания», который
производит операцию рекомбинации
решений-кандидатов, роль которой
аналогична роли скрещивания в живой
природе. Отбор.
На
этапе отбора нужно из всей популяции
выбрать определенную ее долю, которая
останется «в живых» на этом этапе
эволюции. Есть разные способы проводить
отбор. Вероятность выживания особи h
должна зависеть от значения функции
приспособленности Fitness(h). Сама доля
выживших s обычно является параметром
генетического алгоритма, и ее просто
задают заранее. По итогам отбора из N
особей популяции H должны остаться sN
особей, которые войдут в итоговую
популяцию H'. Остальные особи погибают.
Отбор в генетическом алгоритме
производится на основе ф-ции
приспособленности:
Correct(h)
– количество примеров, которые правильно
распознаны гипотезой Total
Exampless
– общее количество примеров.