Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
DEK.doc
Скачиваний:
7
Добавлен:
10.09.2019
Размер:
1.85 Mб
Скачать

24. Сутність алгоритмів класифікації та їх застосування в сппр.

Класифікація – системний розподіл предметів, явищ, процесів по видах, типах, по будь-яких істотних ознаках для зручності їх дослідження; групування вихідних понять та розташування їх в певному порядку, що відображає ступінь їх схожості.

Класифікація – впорядкована за деяким принципом множина об’єктів, які мають схожі класифікаційні ознаки (одну або декілька властивостей), вибраних для визначення схожості або відмінності між цими об’єктами.

Основні тези:

  1. Є множина об’єктів (ситуацій), розділених деяким чином на класи. Різноманітність класів відома заздалегідь.

  2. Задана кінцева множина об’єктів (навчальна вибірка), при чому відомо, до яких класів вони відносяться.

  3. Класова приналежність решти об’єктів не відома.

  4. Потрібно побудувати алгоритм, здатний класифікувати довільний об’єкт з початкової множини.

  5. Класифікувати об’єкт - значить вказати номер (або найменування класу), до якого він відноситься.

  6. Класифікація об’єкту – номер або найменування класу, що видається алгоритмом класифікації в результаті застосування його до даного конкретного об’єкту.

Процес класифікації складається із двох етапів:

  1. Конструювання моделі:

1.1. Кожен приклад набору даних належить до одного класу.

1.2. На цьому етапі використовується навчальна вибірка, на якій і відбувається власне конструювання моделі.

1.3. Отримана модель представляється класифікаційними правилами, деревом рішень або математичною формулою.

2. Використання моделі:

2.1. Оцінка правильності моделі:

- відомі значення з тестового прикладу порівнюються з результатами використання отриманої моделі.

- рівень точності – відсоток правильно класифікованих прикладів в тестовій множині.

- тестова множина неповинна залежати від навчальної вибірки.

2.2. Точність прийнятна – можливе використання моделі для класифікації нових об’єктів, клас яких невідомий.

25. Скорингові моделі в банківській діяльності.

Кредитний скоринг – це метод, що використовує математичні або статистичні моделі, які на основі кредитних історій «минулих» клієнтів банку намагаються передбачити повернення (або неповернення) кредиту новим клієнтом.

Кредитний скоринг передбачає побудову математичної моделі (скорингової моделі), на

вхід якої подаються певні характеристики клієнта (вік, дохід, стаж роботи і т.д.), а на виході

формується інтегрований показник («score» – бал), який визначає ймовірність повернення

або неповернення кредиту. На основі цієї ймовірності приймається рішення про видачу/

невидачу кредиту.

Скорингові моделі – це загальний інструмент. Їх потрібно реалізовувати за допомогою конкретних алгоритмів. Найпростіший – це побудувати скорингову таблицю , що часто роблять експерти, але більш ефективним вважається використання самонавчальних алгоритмів, що мають здатність до адаптації, тобто автоматичного врахування нових даних, і переналаштуванню параметрів моделі.

Для цією мети використовують:

1. Логістичну регресію.

2. Дерева рішень.

3. Нейронні мережі.

Кожен з цих алгоритмів має свої плюси та мінуси. Загальне правило таке: чим точніші результати алгоритму, тим складніше сам алгоритм і інтерпретація його результатів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]