- •1. Процес набуття знань. Його мета, основні складнощі. Функції його учасників.
- •2. Основні стадії процесу набуття знань та їх взаємодія.
- •3. Види методів витягу знань з експерта.
- •4. Оболонки експертних систем. Система emysin, як універсальна оболонка.
- •5. Система teiresias як універсальний інтерфейс експертної системи
- •6. Що таке дані? Набори даних, види даних.
- •7. Дані. Шкалування даних.
- •8. Інтелектуальний аналіз даних. Основні стадії.
- •9. Задачі інтелектуального аналізу даних.
- •10.Задача класифікації, як задача інтелектуального аналізу даних.
- •11. Процесс розв’язання задачі класифікації інтелектуального аналізу даних
- •12.Задача кластерізації, як задача інтелектуального аналізу даних.
- •Методы кластеризации
- •13. Порівняння задач класифікації та кластерізації.
- •15. Дерево прийняття рішень як апроксимація булевської функції
- •16. Дерева прийняття рішень. Ентропія, як характеристика цільової функції.
- •17. Критерій приросту інформації. Проблеми з критерієм приросту інформації.
- •18. Дерева прийняття рішень. Оверфіттінг
- •19. Генетичний алгоритм. Загальна схема генетичного алгоритма.
- •20. Генетична операція «кроссовер».
- •21. Представлення даних у вигляді бітових рядків.
- •22. Відбір, як основний елемент генетичного алгоритму.
- •23. Покажіть на прикладі «метод рулетки» та «ранговий метод», як методи відбору генетичного алгоритму.
- •24. Відображення теорій Ламарка та Болдуіна у генетичних алгоритмах.
21. Представлення даних у вигляді бітових рядків.
З курсу біології ми знаємо, що будь-який організм може бути поданий своїм фенотипом, який фактично визначає, чим є об'єкт у реальному світі, і генотипом, який містить інформацію про об'єкт на рівні хромосомного набору. При цьому кожен ген, тобто елемент інформації генотипу, має своє відображення у фенотипі. Таким чином, для розв'язання задач нам необхідно зобразити кожну ознаку об'єкта у формі, придатній для використання в генетичному алгоритмі. Усе функціонування генетичного алгоритму вимагає лише інформацію про генотип, тобто інформація про об'єкт не потрібна. Найпоширенішим різновидом кодування є побітове, тобто використання бітових рядків. При цьому кожному атрибуту об'єкта у фенотипі відповідає один ген у генотипі. Для кодування ознак можна скористатись найпростішим варіантом: двійковим значенням цієї ознаки. Тоді легко використовувати бітові рядки фіксованої довжини для подання всіх можливих значень цієї ознаки. Наприклад, десяткові числа 7 і 8 можна легко закодувати у двійкові числа B(7)=011 і B(8)=100, використовуючи двійкову техніку. Проте, якщо ми хочемо переміститися з фенотипу 7 у фенотип 8, то повинні змінити всі чотири біти в їх зображенні від B(7)=011 до B(8)=100. Інакше кажучи, при роботі ГА необхідні чотири окремі дії для переміщення від розв'язку 7 до розв'язку 8, які призведуть до додаткових витрат часу. З іншого боку, якщо ми хочемо переміститися від розв'язку 7 до розв'язку 8, то нам необхідна лише одна операція. Це ускладнює використання ГА й погіршує його збіжність. Щоб уникнути цього, краще використовувати кодування, в якому значення розрізняються на один біт. Таким є код Ґрея.
22. Відбір, як основний елемент генетичного алгоритму.
Генети́ческий алгори́тм (англ. genetic algorithm) — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию. Является разновидностью эволюционных вычислений. Отличительной особенностью генетического алгоритма является акцент на использование оператора «скрещивания», который производит операцию рекомбинации решений-кандидатов, роль которой аналогична роли скрещивания в живой природе. Отбор. На этапе отбора нужно из всей популяции выбрать определенную ее долю, которая останется «в живых» на этом этапе эволюции. Есть разные способы проводить отбор. Вероятность выживания особи h должна зависеть от значения функции приспособленности Fitness(h). Сама доля выживших s обычно является параметром генетического алгоритма, и ее просто задают заранее. По итогам отбора из N особей популяции H должны остаться sN особей, которые войдут в итоговую популяцию H'. Остальные особи погибают. Отбор в генетическом алгоритме производится на основе ф-ции приспособленности: Correct(h) – количество примеров, которые правильно распознаны гипотезой Total Exampless – общее количество примеров.