Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора - жежнич.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
240.06 Кб
Скачать

6. Розпізнавання графічних даних

Теорія розпізнавання образів - розділ інформатики, що розвиває теоретичні основи і методи класифікації та ідентифікації предметів, явищ, процесів, сигналів, ситуацій і т. п. об'єктів, які характеризуються кінцевим набором деяких властивостей і ознак. Такі завдання вирішуються досить часто, наприклад, при переході або проїзді вулиці за сигналами світлофора. Розпізнавання кольору загорівся лампи світлофора та знання правил дорожнього руху дозволяє прийняти правильне рішення про те, можна чи не можна переходити вулицю в даний момент.

Створення штучних систем розпізнавання образів залишається складною теоретичною і технічною проблемою. Необхідність у такому розпізнаванні виникає в самих різних областях - від військової справи і систем безпеки до оцифровки всіляких аналогових сигналів.

Традиційно задачі розпізнавання образів включають у коло задач штучного інтелекту.

Можна виділити два основних напрямки:

  • Вивчення здібностей до розпізнавання, якими володіють живі істоти, пояснення і моделювання їх;

  • Розвиток теорії та методів побудови пристроїв, призначених для вирішення окремих завдань в прикладних цілях.

Деякі методи розпізнавання графічних образів

Для оптичного розпізнавання образів можна застосувати метод перебору виду об'єкта під різними кутами, масштабами, зсувами і т. д. Для букв потрібно перебирати шрифт, властивості шрифту і т. д.

Другий підхід - знайти контур об'єкта і досліджувати його властивості (зв'язність, наявність кутів і т. д.)

Ще один підхід - використовувати штучні нейронні мережі. Цей метод вимагає або великої кількості прикладів завдання розпізнавання (з правильними відповідями), або спеціальної структури нейронної мережі, що враховує специфіку даної задачі.

Розпізнавання аудіо інформації

На сьогоднішній день, під поняттям "розпізнавання мови" ховається ціла сфера наукової та інженерної діяльності. Загалом, кожна задача розпізнавання мовлення зводиться до того, щоб виділити, класифікувати і відповідним чином відреагувати на людську мову з вхідного звукового потоку. Це може бути і виконання певної дії на команду людини, і виділення певного слова-маркера з великого масиву телефонних переговорів, і системи для голосового введення тексту.

Малюнок 1. Класифікація систем розпізнавання мовлення

Розпізнавання мови - це багаторівнева задача розпізнавання образів, в якій акустичні сигнали аналізуються і структуруються в ієрархію структурних елементів (наприклад, фонем), слів, фраз і пропозицій. Кожен рівень ієрархії може передбачати деякі тимчасові константи, наприклад, можливі послідовності слів або відомі види вимови, які дозволяють зменшити кількість помилок розпізнавання на більш низькому рівні. Чим більше ми знаємо (або припускаємо) апріорної інформації про вхідному сигналі, тим якісніше ми можемо його обробити й розпізнати.

Малюнок 2. Структура Стандартної системи розпізнавання мовлення

    1. 8. Графічні растрові формати

TIFF – формат для зберігання зображень з великою глибиною кольору.

JPEG – даний формат використовує сильне стиснення, рівень якого можна регулювати, із втратою інформації.

DjVu – використовує спеціальний алгоритм, що дозволяє отримувати файли меншого розміру при стисненні без втрат.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]