- •Місце автоматичного синтаксичного аналізу в загальній схемі опрацювання текстів природною мовою.
- •Поняття автоматичного синтаксичного аналізу.
- •Мови програмування
- •Поняття безпосередніх складників.
- •Ознаки безпосередніх складників.
- •Вихідні дані для побудови контекстно-вільної граматики.
- •Поняття контекстно-вільної граматики.
- •Формальне визначення контекстно-вільної граматики.
- •Структура np виразу англійської мови та її представлення в квг.
- •Реалізація явища узгодження в правилах квг.
- •Структура vp виразу англійської мови та її представлення в квг.
- •Вплив класів дієслів на правила для vp в квг.
- •Синтаксично розмічені корпуси Treebanks.
- •Використання Treebank для побудови квг.
- •Лексикалізовані квг.
- •Поняття еквівалентності граматик.
- •Поняття нормальної форми Хомського граматик.
- •Поняття граматики залежностей.
- •Синтаксичний аналіз, як пошукова задача.
- •Стратегії здійснення синтаксичного аналізу.
- •Побудова таблиці в алгоритмі cky. Приклад.
- •Відтворення дерева розбору в алгоритмі cky. Приклад
- •Проблеми використання алгоритму cky.
- •Загальна характеристика алгоритму Ерлі.
- •Поняття імовірнісної квг.
- •Способи вирішення проблем імовірнісних квг.
- •Лексикалізована імовірнісна квг.
- •Параметри оцінки синтаксичних аналізаторів.
- •Автоматичний семантичний аналіз (аСемА). Визначення.
- •Способи представлення смислу.
- •Вимоги до представлення значення.
- •Вимога забезпечення можливості перевірки.
- •Вимога однозначності представлення.
- •Канонічна форма представлення.
- •Способи отримання канонічної форми.
- •Вивід та використання змінних.
- •Виразність а всеохопність представлення значення.
- •Поняття формальної семантики.
- •Модель «світу » в формальній семантиці.
- •Загальна характеристика логіки першого порядку.
- •Основні поняття логіки першого порядку.
- •Проблеми опису станів та подій в лпп.
- •Представлення часу в лпп.
- •Здійснення семантичного аналізу на основі принципу композиційності.
- •Збагачення правил квг семантичної інформацією.
Побудова таблиці в алгоритмі cky. Приклад.
ОСКІЛЬКИ, ГРАМАТИКА В НОРМАЛЬНІЙ ФОРМІ, ТО КОЖЕН НЕТЕРМІНАЛЬНИЙ СИМВОЛ (НЕТЕРМІНАЛЬНИЙ ВУЗОЛ ДЕРЕВА ) МОЖЕ МАТИ ТІЛЬКИ ДВІ “ДОНЬКИ”
ПРОСТА ДВОВИМІРНА МАТРИЦЯ ВИКОРИСТОВУЄТЬСЯ ДЛЯ ЗБЕРЕЖЕННЯ СТРУКТУРИ ВСЬОГО ДЕРЕВА
ДЛЯ РЕЧЕННЯ ДОВЖИНОЮ N БУДУЄТЬСЯ МАТРИЦЯ РОЗМІРОМ (N+1)*(N+1)
КОЖЕН ЕЛЕМЕНТ (I,J) МАТРИЦІ МІСТИТЬ НАБІР НЕТЕРМІНАЛЬНИХ СИМВОЛІВ, ЩО ПРЕДСТАВЛЯЮТЬ ВСІ СКЛАДОВІ, ЯКІ ОХОПЛЮЮТЬ ПОЗИЦІЇ ВІД I ДО J ВХІДНИХ ЕЛЕМЕНТІВ
В КОМІРЦІ МАТРИЦІ (0,N) , ЯКА ПРЕДСТАВЛЯЄ ВСЕ РЕЧЕННЯ ОЧІКУЄТЬСЯ СИМВОЛ S
Відтворення дерева розбору в алгоритмі cky. Приклад
ДЛЯ ПРАВИЛА ВИДУ A ® B C ПОВИННО БУТИ ДЕЯКЕ К ТА B Є В ПРОМІЖКУ [І,К] ТА C В ПРОМІЖКУ [К,J].
ЯКЩО A ВІДПОВІДАЄ ПРОМІЖКУ I,J З ВХІДНОЇ ПОСЛІДОВНОСТІ І A ® B C ЦЕ ПРАВИЛО З ГРАМАТИКИ, ТО ПОВИННО БУТИ B В ПРОМІЖКУ [І,К] ТА C В ПРОМІЖКУ [К,J] ДЛЯ i<k<j
ПОЧАТКОВА ЗАДАЧА ПРАВИЛЬНО ЗАПОВНИТИ МАТРИЦЮ (ТАБЛИЦЮ)
МАТРИЦЯ ЗАПОВНЮЄТЬСЯ ЗНИЗУ-ВВЕРХ І ЗЛІВА - НАПРАВО
МАТРИЦЯ (ТАБЛИЦЯ) ЗАПОВНЕНА
ПОТРІБНО ОТРИМАТИ ДЕРЕВО
ПРИ ЗАПОВНЕНІ МАТРИЦІ ПОТРІБНО ЗБЕРІГАТИ ІНФОРМАЦІЮ ПРО ТЕ, НА ОСНОВІ ЯКИХ КОМІРОК ОТРИМАНО ПОТОЧНИЙ НЕТЕРМІНАЛЬНИЙ СИМВОЛ
ПРИ ЗАПОВНЕННІ МАТРИЦІ В КОМІРЦІ ПОТРІБНО ЗБЕРІГАТИ РІЗНІ ВЕРСІЇ ТОГО САМОГО НЕТЕРМІНАЛЬНОГО СИМВОЛУ
ЗАПОВНЕНА ТАКИМ СПОСОБОМ МАТРИЦЯ ДОЗВОЛИТЬ ПОБУДУВАТИ ВСІ ДЕРЕВА РУХАЮЧИСЬ ВІД S ПО ЙОГО СКЛАДНИКАХ.
Проблеми використання алгоритму cky.
ПОБУДОВА ВСІХ ДЕРЕВ ДУЖЕ ДОРОГА ОПЕРАЦІЯ
ВИМОГА ВИКОРИСТАННЯ НОРМАЛЬНОЇ ФОРМИ ХОМСЬКОГО ПРИВОДИТЬ ДО:
НЕОБХІДНОСТІ РОЗРОБНИКАМ ГРАМАТИКИ ПОВИННІ ЦЮ ВИМОГУ
СКЛАДНОЩІВ ПРИ ВИКОРИСТАННІ ЧУЖИХ ГРАМАТИК
ВИНИКНЕННЯ ПРОБЛЕМ ПРИ ВИКОРИСТАННІ ТАКОЇ ГРАМАТИКИ ПРИ СЕМАНТИЧНОМУ АНАЛІЗІ
ОСНОВНА ПРОБЛЕМА: ВСІ АЛГОРИТМИ ЗНИЗУ-ВВЕРХ ПРИ СИНТАКСИЧНОМУ АНАЛІЗІ ПРИВОДЯТЬ ДО ПОБУДОВИ ВЕЛИКОЇ КІЛЬКОСТІ СКЛАДНИКІВ, ЯКІ НАСПРАВДІ НІКОЛИ НЕ БУДУТЬ ВИКОРИСТАНІ
Загальна характеристика алгоритму Ерлі.
ДОЗВОЛЯЄ ВИКОРИСТОВУВАТИ ЗВИЧАЙНУ КОНТЕКСТНО-ВІЛЬНУ ГРАМАТИКУ
СТРАТЕГІЯ ЗВЕРХУ-ВНИЗ
ЗА ОДИН ПРОХІД ЗЛІВА-НАПРАВО ПО ВХІДНИХ ДАНИХ ЗАПОВНЮЄТЬСЯ МАСИВ СПИСКІВ РОЗБОРУ (CHARTS)
МАСИВ МІСТИТЬ N+1 ЕЛЕМЕНТІВ; N – КІЛЬКІСТЬ СЛІВ У РЕЧЕННІ
ЕЛЕМЕНТАМИ СПИСКІВ РОЗБОРУ Є СТАНИ В ЯКИХ ЗБЕРІГАЄТЬСЯ ІНФОРМАЦІЯ ТРЬОХ ТИПІВ
ПРО СФОРМОВАНІ СКЛАДНИКИ ТА ЇХ МІСЦЕЗНАХОДЖЕННЯ
СКЛАДНИКИ В ПРОЦЕСІ ФОРМУВАННЯ
СКЛАДНИКИ, ФОРМУВАННЯ ЯКИХ ОЧІКУЄТЬСЯ
Поняття стану в алгоритмі Ерлі.
СТАНИ ОПИСУЮТЬСЯ ЗА ДОПОМОГОЮ ПРАВИЛ ГРАМАТИКИ ТА ДОДАВАННЯМ КРАПКИ “.”, ЯКА Є ІНДИКАТОРОМ ФОРМУВАННЯ ПІДДЕРЕВА
dotted-rules.
S ® · VP VP ОЧІКУЄТЬСЯ
NP ® Det · Nominal NP В ПРОЦЕСІ ФОРМУВАННЯ
VP ® V NP · VP ПОБУДОВАНО
Поняття стану та позиції в алгоритмі Ерлі.
Поняття стану та позиції
S ® l VP [0,0] VP ОЧІКУЄТЬСЯ НА ПОЧАТКУ РЕЧЕННЯ
NP ® Det l Nominal [1,2] NP В ПРОЦЕСІ ФОРМУВАННЯ
Det ОБРОБЛЕНО В ПОЗИЦІЇ [1 , 2]
VP ® V NP l [0,3] VP ПОБУДОВАНО ДЛЯ ПОЗИЦІЙ ВХІДНИХ ДАНИХ ВІД 0 ДО 3
Основні операції алгоритму Ерлі.
АЛГОРИТМ ДИНАМІЧНОГО ПРОГРАМУВАННЯ
РЕЗУЛЬТАТИ ЗБЕРІГАЮТЬСЯ В ТАБЛИЦІ
ПРИСУТНІСТЬ СТАНУ
S ® α l [0,N]
ВКАЗУЄ НА УСПІШНИЙ АНАЛІЗ (РОЗБІР) РЕЧЕННЯ
ДЛЯ РОБОТИ ЗІ СТАНАМИ В CHARTS (СПИСКИ РОЗБОРУ) ВИКОРИСТОВУЮТЬСЯ ОПЕРАЦІЇ:
PREDICTOR
COMPLETER
SCANNER
КОЖНА ОПЕРАЦІЯ ОТРИМУЄ НА ВХОДІ ОДИН СТАН І БУДУЄ НОВИЙ
СТАНИ ДОДАЮТЬСЯ ДО СПИСКІВ РОЗБОРУ
Операція передбачення алгоритму Ерлі. Приклад.
PREDICTOR – ДОДАЄ СТАНИ ДО ПОТОЧНОГО СПИСКУ РОЗБОРУ
ЗАСТОСОВУЄТЬСЯ ДО СТАНІВ ДЕ ПІСЛЯ КРАПКИ ЙДЕ НЕТЕРМІНАЛЬНИЙ СИМВОЛ , АЛЕ НЕ РОS ТЕГ
Операція завершення алгоритму Ерлі. Приклад.
COMPLETER - ДОДАЄ СТАНИ ДО ПОТОЧНОГО СПИСКУ РОЗБОРУ
ЗАСТОСОВУЄТЬСЯ ДО СТАНІВ З КРАПКОЮ В КІНЦІ ПРАВИЛА
Операція сканування алгоритму Ерлі. Приклад.
SCANNER - ДОДАЄ СТАНИ ДО НОВОГО СПИСКУ РОЗБОРУ
ЗАСТОСОВУЄТЬСЯ ДО СТАНІВ ДЕ ПІСЛЯ КРАПКИ ЙДЕ НЕТЕРМІНАЛЬНИЙ СИМВОЛ - РОS ТЕГ
Поняття списків розбору в алгоритмі Ерлі.
Алгоритм Ерлі по вхідному ланцюжку та граматиці породжує список розобру для даного вхідного ланцюжка в заданій граматиці. Списком розбору будемо називати послідовність списків ситуацій |0, |1,… |n.
Побудова списків розбору в алгоритмі Ерлі. Приклад.
Book that flight
ПОТРІБНО ЗНАЙТИ ДЕРЕВА, ЯКІ ВІДПОВІДАЮТЬ ПОЗИЦІЯМ ВІД 0 ДО 3
ВИКОРИСТОВУЄТЬСЯ КОНТЕКСТНО – ВІЛЬНА ГРАМАТИКА З ПОПЕРЕДНЬОЇ ЛЕКЦІЇ
Відтворення дерева розбору в алгоритмі Ерлі. Приклад.
ПОБУДОВА CHARTS ТА СТАНІВ НЕ ДОЗВОЛЯЄ ЗДІЙСНИТИ АНАЛІЗ РЕЧЕННЯ
CHARTS ТА СТАНИ МІСТЯТЬ ІНФОРМАЦІЮ ТІЛЬКИ ПРО МОЖЛИВІ ПІДДЕРЕВА
ДЛЯ ВІДТВОРЕННЯ ДЕРЕВА ПОТРІБНО ДОПОВНИТИ КОЖЕН СТАН ІНФОРМАЦІЄЮ ПРО ЗАВЕРШЕНІ СТАНИ ЗГЕНЕРОВАНІ СКЛАДНИКОМ
ДО СТАНІВ, ЯКІ БУДУЮТЬСЯ COMPLETER ДОДАЄТЬСЯ ВКАЗІВНИК НА ПОПЕРЕДНІ СТАНИ , ЯКІ ВІДПОВІДАЮТЬ СКЛАДНИКАМ ЦЬОГО СТАНУ
Проблеми алгоритмів АСА.
ДЛЯ РЕЧЕННЯ З ТРЬОХ СЛІВ ПОБУДОВАНО ЧОТИРИ CHARTS ТА 36 СТАНІВ
КОРИСНА ІНФОРМАЦІЯ МІСТИТЬСЯ ТІЛЬКИ В 7 СТАНАХ
БАГАТО СТАНІВ БУДУЮТЬСЯ ДЛЯ ДАНИХ, ЯКІ НЕ Є У ВХІДНІЙ ПОСЛІДОВНОСТІ
ПРОБЛЕМУ НЕОДНОЗНАЧНОСТІ СИНТАКСИЧНОГО АНАЛІЗУ АЛГОРИТМИ НЕ ВИРІШУЮТЬ
АЛГОРИТМИ ДОЗВОЛЯЮТЬ ПОБУДУВАТИ НАБОРИ ДЕРЕВ ДЛЯ ЕЛЕМЕНТІВ [0,N]
АЛГОРИТМИ ЕФЕКТИВНО ЗБЕРІГАЮТЬ ПІДДЕРАВА, ЯКІ СПІЛЬНО ВИКОРИСТОВУЮТЬСЯ ПРИ АНАЛІЗІ
ПІДДЕРЕВА ВИВОДЯТЬСЯ ТІЛЬКИ ОДИН РАЗ
АЛЕ ВІДПОВІДІ ЧИ ПРАВИЛЬНУ СИНТАКСИЧНУ СТРУКТУРУ МИ ОТРМУЄМО ОТРИМАТИ НЕ МОЖЕМО.
