- •Місце автоматичного синтаксичного аналізу в загальній схемі опрацювання текстів природною мовою.
- •Поняття автоматичного синтаксичного аналізу.
- •Мови програмування
- •Поняття безпосередніх складників.
- •Ознаки безпосередніх складників.
- •Вихідні дані для побудови контекстно-вільної граматики.
- •Поняття контекстно-вільної граматики.
- •Формальне визначення контекстно-вільної граматики.
- •Структура np виразу англійської мови та її представлення в квг.
- •Реалізація явища узгодження в правилах квг.
- •Структура vp виразу англійської мови та її представлення в квг.
- •Вплив класів дієслів на правила для vp в квг.
- •Синтаксично розмічені корпуси Treebanks.
- •Використання Treebank для побудови квг.
- •Лексикалізовані квг.
- •Поняття еквівалентності граматик.
- •Поняття нормальної форми Хомського граматик.
- •Поняття граматики залежностей.
- •Синтаксичний аналіз, як пошукова задача.
- •Стратегії здійснення синтаксичного аналізу.
- •Побудова таблиці в алгоритмі cky. Приклад.
- •Відтворення дерева розбору в алгоритмі cky. Приклад
- •Проблеми використання алгоритму cky.
- •Загальна характеристика алгоритму Ерлі.
- •Поняття імовірнісної квг.
- •Способи вирішення проблем імовірнісних квг.
- •Лексикалізована імовірнісна квг.
- •Параметри оцінки синтаксичних аналізаторів.
- •Автоматичний семантичний аналіз (аСемА). Визначення.
- •Способи представлення смислу.
- •Вимоги до представлення значення.
- •Вимога забезпечення можливості перевірки.
- •Вимога однозначності представлення.
- •Канонічна форма представлення.
- •Способи отримання канонічної форми.
- •Вивід та використання змінних.
- •Виразність а всеохопність представлення значення.
- •Поняття формальної семантики.
- •Модель «світу » в формальній семантиці.
- •Загальна характеристика логіки першого порядку.
- •Основні поняття логіки першого порядку.
- •Проблеми опису станів та подій в лпп.
- •Представлення часу в лпп.
- •Здійснення семантичного аналізу на основі принципу композиційності.
- •Збагачення правил квг семантичної інформацією.
Поняття нормальної форми Хомського граматик.
Нормальна форма Хомського (НФХ - бінарна нормальна форма) встановлюється для приведеної контекстно-вільної (КС) граматики, всі правила якої мають вигляд:
1. A->BC, де A,B,C належать N (множині нетермінальних символів)
2. A-> a, де a належить Σ
3. S ->
,
якщо
L(G)
Поняття граматики залежностей.
СИНТАКСИЧНА СТРУКТУРА ОПИСУЄТЬСЯ В ТЕРМІНАХ ОКРЕМИХ СЛІВ ТА І БІНАРНИХ СИНТАКСИЧНИХ АБО СЕМАНТИЧНИХ ЗВЯЗКАХ МІЖ ЦИМИ СЛОВАМИ. Особливість КЗ граматик в тому, що правила виводу здійснюють заміну нетермільнального символу лише у визначеному контексті.
Дерева залежностей дають можливість розрізнити характер зв'язків між словами. Якщо в результаті роботи алгоритму АСА встановлюються зв'язки, які більш-менш відповідають інтуїтивним уявленням носіїв мови, значить синтаксична структура речення "визначена" правильно.
За І. Севбо є такі основні принципи побудови ГЗ.
^Речення будується з одиниць одного таксономічного (англ. Іахопотіс - однаковий) рівня - зі словоформ. Службові слова, як і повнозначні, розглядаються як мінімальні елементи синтаксичної структури.
^Слова в реченні зв'язані відношенням підпорядкування, яке є узагальненням традиційних синтаксичних відношень керування, узгодження, прилягання (сурядність й однорідність вписуються в загальну систему підпорядкування).
реченні є одне абсолютно незалежне слово - присудок. Усі інші слова підпорядковуються якомусь "хазяїну", причому тільки одному (у слова не може бути одночасно відразу двох керуючих). Однак одне слово може підпорядковувати більше двох слів. У системі підпорядкування можна виділити два типи зв'язку у групі слів: гілкування, коли одному слову підпорядковано кілька слів, та ланцюжок підпорядкувань, коли кожне наступне слово залежить від попереднього.
Синтаксичний аналіз, як пошукова задача.
ЗНАЙТИ ВСІ ДЕРЕВА, В ЯКИХ КОРІНЬ S І ЯКІ МІСТЯТЬ ВСІ СЛОВА З ВХІДНОЇ ПОСЛІДОВНОСТІ
АЛГОРИТМ ДЛЯ ЗДІЙСНЕННЯ ТАКОГО ПОШУКУ ПОВИНЕН ВРАХОВУВАТИ ЦІ ОБМЕЖЕННЯ
ПИТАННЯ, ЯКЕ З ДЕРЕВ Є ПРАВИЛЬНИМ ДЛЯ ДАНОГО РЕЧЕННЯ І ЯКИМ ЧИНОМ ЦЕ ДЕРЕВО ВИБРАТИ З МНОЖИНИ ДЕРЕВ, ЗАЛИШАЄТЬСЯ ВІДКРИТЕ
ДВІ СТРАТЕГІЇ (ТИПИ АЛГОРИТМІВ) ЗДІЙСНЕННЯ СИНТАКСИЧНОГО АНАЛІЗУ : ЗВЕРХУ-ВНИЗ, ЗНИЗУ-ВВЕРХ
Стратегії здійснення синтаксичного аналізу.
ДВІ СТРАТЕГІЇ (ТИПИ АЛГОРИТМІВ) ЗДІЙСНЕННЯ СИНТАКСИЧНОГО АНАЛІЗУ : ЗВЕРХУ-ВНИЗ, ЗНИЗУ-ВВЕРХ
ЗВЕРХУ-ВНИЗ
ШУКАЄМО ДЕРЕВО РОЗБОРУ “ВИВОДУ” ПОЧИНАЮЧИ ВІД S І ДОНИЗУ ДО ЛИСТКІВ.
ПЕРЕХОДИ ДОНИЗУ ЗДІЙСНЮЮТЬСЯ НА ОСНОВІ ПРАВИЛ ГРАМАТИКИ
ЗНИЗУ-ВВЕРХ
АНАЛІЗ ПОЧИНАЄТЬСЯ З РОЗГЛЯДУ СЛІВ, ЯКІ ПОСТУПИЛИ НА ВХІД АНАЛІЗАТОРУ
ПОСЛІДОВНІ СПРОБИ ВИКОРИСТОВУЮЧИ ПРАВИЛА ГРАМАТИКИ ПОБУДУВАТИ ДЕРЕВО
Побудова дерева розбору на основі стратегії зверху-вниз.
ШУКАЄМО ДЕРЕВО РОЗБОРУ “ВИВОДУ” ПОЧИНАЮЧИ ВІД S І ДОНИЗУ ДО ЛИСТКІВ.
ПЕРЕХОДИ ДОНИЗУ ЗДІЙСНЮЮТЬСЯ НА ОСНОВІ ПРАВИЛ ГРАМАТИКИ
Побудова дерева розбору на основі стратегії знизу-вверх.
АНАЛІЗ ПОЧИНАЄТЬСЯ З РОЗГЛЯДУ СЛІВ, ЯКІ ПОСТУПИЛИ НА ВХІД АНАЛІЗАТОРУ
ПОСЛІДОВНІ СПРОБИ ВИКОРИСТОВУЮЧИ ПРАВИЛА ГРАМАТИКИ ПОБУДУВАТИ ДЕРЕВО
Переваги стратегії зверху-вниз.
ЗДІЙСНЮЄТЬСЯ ПОШУК ДЕРЕВ, ЯКІ МАЮТЬ S В КОРЕНІ
Недоліки стратегії зверху-вниз.
БУДУЮТЬСЯ ДЕРЕВА, ЯКІ НЕ ВІДПОВІДАЮТЬ ВХІДНІЙ ПОСЛІДОВНОСТІ
Переваги стратегії знизу-вверх.
БУДУЮТЬСЯ ДЕРЕВА, ЯКІ ВІДПОВІДАЮТЬ ВХІДНІЙ ПОСЛІДОВНОСТІ
Недоліки стратегії знизу-вверх.
РОЗГЛЯДАЮТЬСЯ ДЕРЕВА, ЯКІ НІКОЛИ НЕ БУДУТЬ МАТИ КОРЕНЯ S
Типи неоднозначностей при СА.
СТРУКТУРНА НЕОДНОЗНАЧНІСТЬ (МОЖНА ПОБУДУВАТИ БІЛЬШ НІЖ ОДНЕ ДЕРЕВО ДЛЯ ОДНОГО РЕЧЕННЯ) ВКЛЮЧАЄ:
НЕОДНОЗНАЧНІСТЬ ПРИЄДНАННЯ
ONE MORNING I SHOT AN ELEPHANT IN MY PAJAMAS
НЕОДНОЗНАЧНІСТЬ КООРДИНАЦІЇ
OLD MAN AND WOMEN
ЛОКАЛЬНА НЕОДНОЗНАЧНІСТЬ
BOOK THAT FLIGHT
КІЛЬКІСТЬ ДЕРЕВ = еN (N-кількість слів у реченні)
Використання стратегії перебору з поверненням для здійснення АСА.
ЗАДАЧУ ОДНОЧАСНОЇ ПОБУДУДОВИ ВСХ ДЕРЕВ ВИРІШИТИ НЕМОЖЛИВО
ДЕРЕВА БУДУЮТЬСЯ ПОСТУПОВО ОДНЕ ЗА ОДНИМ
ЯКЩО ДЕРЕВО ПОБУДУВАТИ НЕ ВДАЛОСЯ, ТО ПОВЕРТАЄМОСЯ В ПОЧАТКОВИЙ СТАН
НЕОДНОЗНАЧНІСТЬ ГРАМАТИКИ, НАПРИКЛАД ВИБІР ОДНОГО З ПРАВИЛ
Nominal -> Noun
Nominal -> Nominal PP
Використання динамічного програмування для здійснення АСА.
ЗБЕРІГАЮТЬСЯ ВСІ ПРОМІЖНІ РІШЕННЯ ДЛЯ ВИРІШЕННЯ ОСНОВНОЇ ЗАДАЧІ
ПІДДЕРЕВА ДЛЯ ОКРЕМИХ СКЛАДНИКІВ БУДУЮТЬСЯ ОДИН РАЗ І ЗБЕРІГАЮТЬСЯ ДЛЯ ПОВТОРНОГО ВИКОРИСТАННЯ
ВИРІШУЄТЬСЯ ПРОБЛЕМА ПОВТОРНОЇ ПОБУДОВИ ПІДДЕРЕВ
ЧАСТКОВО ВИРІШУЄТЬСЯ ПРОБЛЕМА НЕОДНОЗНАЧНОСТІ – Є ВСІ СКЛАДОВІ ТА ЇХ ЗВЯЗКИ, ЩО ДОЗВОЛЯЄ ПЕРЕБУДОВУВАТИ ДЕРЕВО
Загальна характеристика алгоритму АСА CKY.
АЛГОРИТМ ВИКОРИСТОВУЄ ГРАМАТИКІ ТІЛЬКИ В НОРМАЛЬНІЙ ФОРМІ ХОМСЬКОГО
ПРАВИЛА В НОРМАЛЬНІЙ ФОРМІ ХОМСЬКОГО МАЮТЬ ВИГЛЯД A —> Β C АБО A —> α
БУДЬ-ЯКУ КВГ МОЖНА ПЕРЕТВОРИТИ ДО НОРМАЛЬНОЇ ФОРМИ ХОМСЬКОГО
Перетворення граматики до нормальної форми Хомського.
В ЗВИЧАЙНІЙ ГРАМАТИЦІ МОЖЛИВІ ТАКІ СИТУАЦІЇ:
В ПРАВИЛАХ СПРАВА Є ТЕРМІНАЛЬНІ І НЕ ТЕРМІНАЛЬНІ СИМВОЛИ
В ПРАВИЛАХ СПРАВА Є ОДИН НЕ ТЕРМІНАЛЬНИЙ СИМВОЛ
В ПРАВИЛАХ СПРАВА Є БІЛЬШ НІЖ ДВА НЕ ТЕРМІНАЛЬНІ СИМВОЛИ
КОПІЮВАТИ ВСІ ПРАВИЛА, ЯКІ ВІДПОВІДАЮТЬ ВИМОГАМ В НОВУ ГРАМАТИКУ
ПЕРЕТВОРИТИ ТЕРМІНАЛИ В ПРАВИЛАХ ВВІВШИ ФІКТИВНІ НЕ ТЕРМІНАЛИ
ПЕРЕТВОРИТИ ОДИНИЧНІ ПРАВИЛА
ПЕРЕТВОРИТИ ВСІ ПРАВИЛА НА БІНАРНІ І ДОДАТИ ДО НОВОЇ ГРАМАТИКИ
