Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Синтаксис.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
27.6 Кб
Скачать

5, 6. Обробка лінгвістичної письмової інформації на рівні словосполучень, речень, тексту. Автоматичний синтаксичний аналіз тексту.

Автоматичний синтаксичний аналіз (АСА) становить другий важливий модуль систем АПТ, або АСОТ, а його лінгвістичне забезпечення складає другий необхідний компонент комп’ютерної граматики – комп’ютерний синтаксис. Він спрямований на виявлення в тексті синтаксичних структур та їхнє формалізоване представлення. У комп’ютерній лінгвістиці розрізняють кілька типів АСА залежно від сфери його застосування, вихідних елементів та способів виконання. За першою ознакою розрізняють універсальні, або глобальні системи та системи часткові, придатні для розв’язання окремих дослідницьких завдань, наприклад аналізу текстів певної структури та певної предметної галузі. За другою ознакою найбільш ефективними виявилися системи АСА, що встановлюють синтаксичні структури в тексті за частинами мови словоформ та за їхніми синтаксичними ролями, тобто за членами речення. Нарешті за третьою ознакою виділяють системи АСА з безперервним та циклічним (повторюваним) переглядом тексту.

Розрізнення інтегральних та локальних систем АСА прямо пов’язане з різною стратегією здійснення в таких системах процедури розкладу тексту на мінімальні синтагми – пари слів, пов’язані певним типом синтаксичного зв’язку: координації (між членами предикативної пари – підметом та присудком), узгодження, керування або прилягання.

В обговорюваній системі АГАТ модуль АСА на сьогодні здатен аналізувати всі типи синтаксичних структур, як прості, так і ускладнені та складні речення. Залежно від типу речення модуль працює в 4 етапи, на кожному з яких виконує такі процедури:

І-ий етап

Сегментація тексту на відрізки, обмежені опорними точками: розділовими знаками, крім тире, та сполучниками. Всередині виділених сегментів за кодами граматичних класів та підкласів визначають членів предикативної пари. Виявлені в таких сегментах вставні слова та конструкції передають для аналізу спеціальному алгоритму.

ІІ-ий

Внутрішньосегментний аналіз. Він передбачає здійснення двох основних операцій: 1) формування предикативних синтагм зі зв’язком координації, або, інакше кажучи, встановлення в межах сегментів слів, пов’язаних безпосередніми синтаксичними зв’язками з членами предикативної пари, та 2) приєднання до сегментів з предикативними парами в межах речень сегментів, які таких пар не мають.

ІІІ-й

Відокремлення в тексті простих речень, або речень з однією предикативною парою (предикативним центром) від складних речень, або речень з двома і більше предикативними парами (центрами). Ця процедура для аналізу складних речень передбачає виконання трьох операцій: 1) визначення структурного типу речення; 2) встановлення меж частин речення з предикативними парами (центрами), або його предикативних частин та їх нумерація; 3) визначення типу синтаксичного зв’язку між предикативними частинами складного речення.

IV-ий

Аналіз всередині простого речення або предикативних частин складного речення. На цьому етапі роботи модуля АСА передбачено виконання чотирьох операцій: 1) виявлення прислівних зв’язків; 2) аналіз відокремлених зворотів – напівпредикативних синтаксичних одиниць; 3) з’ясування функціонального навантаження розділових знаків; 4) зняття омонімії граматичних форм, яка залишилася після роботи модуля АМА (ФА та КА) та перших трьох етапів роботи модуля АСА.