- •Місце автоматичного синтаксичного аналізу в загальній схемі опрацювання текстів природною мовою.
- •Поняття автоматичного синтаксичного аналізу.
- •Мови програмування
- •Поняття безпосередніх складників.
- •Ознаки безпосередніх складників.
- •Вихідні дані для побудови контекстно-вільної граматики.
- •Поняття контекстно-вільної граматики.
- •Формальне визначення контекстно-вільної граматики.
- •Структура np виразу англійської мови та її представлення в квг.
- •Реалізація явища узгодження в правилах квг.
- •Структура vp виразу англійської мови та її представлення в квг.
- •Вплив класів дієслів на правила для vp в квг.
- •Синтаксично розмічені корпуси Treebanks.
- •Використання Treebank для побудови квг.
- •Лексикалізовані квг.
- •Поняття еквівалентності граматик.
- •Поняття нормальної форми Хомського граматик.
- •Поняття граматики залежностей.
- •Синтаксичний аналіз, як пошукова задача.
- •Стратегії здійснення синтаксичного аналізу.
- •Побудова таблиці в алгоритмі cky. Приклад.
- •Відтворення дерева розбору в алгоритмі cky. Приклад
- •Проблеми використання алгоритму cky.
- •Загальна характеристика алгоритму Ерлі.
- •Поняття імовірнісної квг.
- •Способи вирішення проблем імовірнісних квг.
- •Лексикалізована імовірнісна квг.
- •Параметри оцінки синтаксичних аналізаторів.
- •Автоматичний семантичний аналіз (аСемА). Визначення.
- •Способи представлення смислу.
- •Вимоги до представлення значення.
- •Вимога забезпечення можливості перевірки.
- •Вимога однозначності представлення.
- •Канонічна форма представлення.
- •Способи отримання канонічної форми.
- •Вивід та використання змінних.
- •Виразність а всеохопність представлення значення.
- •Поняття формальної семантики.
- •Модель «світу » в формальній семантиці.
- •Загальна характеристика логіки першого порядку.
- •Основні поняття логіки першого порядку.
- •Проблеми опису станів та подій в лпп.
- •Представлення часу в лпп.
- •Здійснення семантичного аналізу на основі принципу композиційності.
- •Збагачення правил квг семантичної інформацією.
Місце автоматичного синтаксичного аналізу в загальній схемі опрацювання текстів природною мовою.
Кожен із нас щодня будує десятки, сотні речень. Як це вміння передати машині? Як навчити машину розуміти синтаксичну структуру речення, а також будувати нові правильні речення? Зрозуміло, що наше знання про синтаксичну структуру речення, тобто про лексико-граматичні зв'язки слів у ньому передати ЕОМ неможливо. Адже машина розуміє тільки мову команд, а не мову їхнього розв'язання. Для того, щоб ці правила створити, необхідно пізнати ті закони, які діють у процесі побудови речення.
Із суми спостережень над текстом лінгвіст здобуває первісну уяву про спосіб організації тексту й у вигляді чітких процедур - правил алгоритму - повідомляє автомату свої дії, а потім за його допомогою одержує на більшому матеріалі дані, що цікавлять дослідника.
Завдання АСА полягає у тому, щоб, використовуючи морфологічну інформацію про словоформи, одержану на попередньому морфологічному етапі, побудувати синтаксичну структуру вхідного речення. Об'єктом аналізу є речення, яке до моменту синтаксичного аналізу подається у вигляді інформаційних ланцюжків до словоформ. Виконувати синтаксичний аналіз повинен алгоритм СА, тобто інструкція, яка складається зі стандартних елементів, що здійснюють певну послідовність операцій над словоформами. Результатом аналізу є синтаксична структура речення, представлена як сукупність даних про синтаксичні зв'язки між його одиницями.
Поняття автоматичного синтаксичного аналізу.
Синтакси́чний ана́ліз (англ. parsing) — в інформатиці це процес аналізу вхідної послідовності символів, з метою розбору граматичної структури згідно із заданою формальною граматикою. Синтаксичний аналізатор (англ. parser) — це програма або частина програми, яка виконує синтаксичний аналіз.
Під час синтаксичного аналізу текст оформлюється у структуру даних, зазвичай — в дерево, яке відповідає синтаксичній структурі вхідної послідовності, і добре підходить для подальшої обробки. Зазвичай синтаксичні аналізатори працюють в два етапи: на першому ідентифікуються осмислені токени (виконується лексичний аналіз), на другому створюється дерево розбору.
Мови програмування
Найчастіше парсери використовуються для розбору тексту вихідного коду комп'ютерних мов програмування. Вони мають відносно просту граматику з невеликою кількістю виключень. Парсер мови програмування звичайно заснований на контекстно-вільній граматиці, оскільки на її основі можна написати простий та ефективний парсер.
Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від сфери застосування.
УНІВЕРСАЛЬНІ (ГЛОБАЛЬНІ) (значення форм)
ЧАСТКОВІ (значення форм)
Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від вхідних даних.
СИНТАКСИЧНІ СТРУКТУРИ ВСТАНОВЛЮЮТЬСЯ ЗА ЧАСТИНАМИ МОВИ СЛОВОФОРМ ТА ЇХ СИНТАКСИЧНИМИ РОЛЯМИ
Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від способів виконання.
БЕЗПЕРЕРВНИЙ ПЕРЕГЛЯД ТЕКСТУ
ЦИКЛІЧНИЙ ПЕРЕГЛЯД ТЕКСТУ
Параметри оцінки систем АСА.
ЯКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ
ТОЧНІСТЬ – РІВЕНЬ ПОМИЛОК В ПОБУДОВАНИХ СИНТАКСИЧНИХ СТРУКТУРАХ РЕЧЕНЬ
ПОВНОТА – СТЕПІНЬ ПОКРИТТЯ ТЕКСТУ СИНТАКСИЧНИМИ ЗВ’ЯЗКАМИ
ШВИДКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ
Основні методи АСА.
МЕТОДИ З ФІКСОВАНИМИ, ЗАДАНИМИ НАБОРАМИ ПРАВИЛ
МЕТОДИ ЗДАТНІ ДО САМОНАВЧАННЯ
Використання формальних граматик в АСА.
КОНТЕКСНО-ВІЛЬНА ГРАМАТИКА (Для КВ граматик визначено різні нормальні форми. В нормальних формах Чомскі (НФЧ) скорочуюють праву частину правил виводу, тобто, права частина може складатись або з одного термінального символу, або з двох нетермінальних. Якщо в лівій частині знаходиться початковий символ, права частина може породжувати порожнє слово. Існує алгоритм, який переводить довільну КВ граматику в НФЧ.)
ПРАВИЛА КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ ДЛЯ АНГЛІЙСЬКОЇ МОВИ
TREEBANKS – СИНТАКСИЧНО РОЗМІЧЕНІ КОРПУСИ(корпус являє собою текстовий орпус, в якому кожне речення розібране, тобто з анотацією синтаксичних структур. Синтаксична структура зазвичай представляється у вигляді дерева, звідси і назва Treebank.)
ГРАМАТИКИ ЗАЛЕЖНОСТЕЙ (СИНТАКСИЧНА СТРУКТУРА ОПИСУЄТЬСЯ В ТЕРМІНАХ ОКРЕМИХ СЛІВ ТА І БІНАРНИХ СИНТАКСИЧНИХ АБО СЕМАНТИЧНИХ ЗВЯЗКАХ МІЖ ЦИМИ СЛОВАМИ. Особливість КЗ граматик в тому, що правила виводу здійснюють заміну нетермільнального символу лише у визначеному контексті.)