- •Чинники, що зумовили формування комп’ютерної лінгвістики як науки
- •Поняття кл. Історія розвитку кл
- •Зв’язки кл з іншими нелінгвістичними науками
- •Поняття кл. Основні напрямки кл
- •Основні напрямки кл. Комп’ютерна лексикографія
- •Основні напрямки кл. Аналіз текстів на природній мові
- •Історія розвитку та сучасний стан систем машинного перекладу
- •Прикладні системи розробку яких, забезпечує кл
- •Характеристика об’єкту досліджень в кл
- •Характеристика предмету досліджень в кл
- •Два типи моделей опису мовленнєвої діяльності. Розширена класифікація моделей
- •Класифікація моделей опису мовленнєвої діяльності
- •Етапи створення лінгвістичної моделі
- •Вимоги до побудови лінгвістичних моделей
- •Класифікація лінгвістичних моделей за способом побудови
- •Класифікація лінгвістичних моделей за способом аналізу мовних об’єктів
- •22. Система рівнів абстракції опису лінгвістичних явищ в кл
- •23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
- •24. Граматики, що використовуються для опису в кл
- •25.Загальна схема опрацювання текстів на природній мові
- •26. Аналіз окремих слів. Характеристика етапу
- •27. Аналіз окремих речень. Характеристика етапу
- •28. Аналіз тексту в цілому. Характеристика етапу
- •29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
- •30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
- •Загальна умовна структура системи ама
- •32. Основні принципи розробки систем ама
- •33.34.35 Основні групи методів ама
- •37. Етапи ма з використанням словників
- •38. Етапи створення швидкодіючого алгоритму ма
- •39. Які основні вимоги висуваються до систем ама
- •40.Основні поняття морфологічної моделі мови флективного типу
- •41.Основні складові лінгвістичного забезпечення систем ма.
- •43. Які складові необхідні для опису мови в її морфологічній моделі?
- •44. Поняття таблиці морфів. Навести приклад
- •45. Поняття списки масок. Навести приклад
- •46. Поняття списки морфів. Навести приклад
- •47. Поняття технічної частини мови
- •48 Яку інформацію повинен містити кожен запис у словнику основ
- •49. Порівняння методів ма «справа-наліво» і «зліва-направо»
- •50. Переваги методів ма «зліва-направо»
- •51. Характеристика задачі побудови словника основ і пошуку в ньому, як задачі керування базою даних
- •52. Загальна структура словника основ, яка забезпечує мінімум звертань до диска
- •53. Алгоритм пошуку у словнику основ. Навести приклад
- •54.Алгоритм роботи «стека вкладених ключів». Навести приклад
- •55.Алгоритм формування словника основ. Навести приклад
- •57.Типи граматичних правил для зняття омонімії
- •58.Використання прихованої моделі Маркова в алгоритмах зняття омонімії
- •60.Алгоритм зняття омонімії методом на основі нормалізуючи підстановок і позицій сусідніх слів
28. Аналіз тексту в цілому. Характеристика етапу
синтаксичну структуру, яку отримуємо після синтаксичного аналізу називають поверхневою, після якої потрібно будувати глибинну структуру.
Побудова глибинних структур дозволяє на їх основі будувати семантичну структуру речення, використовуючи додаткову інфу.
На семантичному рівні теж теж розглядаються поверхневі і глибинні семантичні структури. Поверхневий рівень відповідає глибинній синтаксичній структурі, а глибинна семантична структура передає цілий клас однотипних ситуацій.
29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
АСОТ – лігвістична інтелектуальна система, призначена для аналізу будови тексту на морфологічному, синтаксичному, семантичному рівнях та ідентифікації складників тексту в термінах відповідних модулів компютерної граматики. Виділяють два основних підходи:
1)словниковий-передбачає створення допоміжних лінгвістичних баз даних(словників) для виконання розроблених алгоритмів.
2)безсловниковий(незалежний) – передбачає представлення всіх потрібних відомостей про мовні одиниці у вигляді алгоритмічних правил.
30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
АМА передбачає здійснення:
-морфологічного аналізу (встановлення по словоформі-лексеми, а також морфологічних характеристик доної словолформи)
- морфологічний синтез словоформ(задача зворотнього співставлення знаходження форми заданого слова за відмінком, родом...)
-виявлення та виправлення помилок в тексті(встановлення існування чи неіснування даної словоформи в мові та знаходження за помилковою словоформою вірних словоформ)
-нормалізація слів
-автоматичне виявлення словарних характеристик нових слів
Під автоматичним визначенням орфографічних помилок ми встановлюємо чи належить дана словоформа до тої чи іншої мови.
При автоматичному виправленні помилок ми за помилковою словоформою шукаємо близьку до даної.
Важливе значення при розробці аналізаторів має швидкодія
Загальна умовна структура системи ама
32. Основні принципи розробки систем ама
-точна морфологія(використання морфологічних словників великого обєму)
ми маємо морфологічний словник, що містить основні словоформи даної мови і кожній словоформі ставиться у відповідність якийсь код. На основі системи правил можна побудувати всі словоформи мови.
-неточна морфологія(викоримтовуються системи правил, що допомагають вситановлювати морфологічні характеристики заданої словоформи)
наявність тих чи інших морфем може чітко вказати на певні морфологічні характеристики.
-ймовірнісний підхід(аналіз поєднуваності словоформи з іншими словоформами)
the love іменник
to love любити
33.34.35 Основні групи методів ама
1)МА зі словником основ(34)
крім словника основ слів використовуються і допоміжні таблиці. Словник основ містить основи простих і сладних слів. Якщо слово має декілька основ, то словник містить усі. Кожній основі словника ставиться у відповідність сполучення коду основозмінного класу і коду флективного класу, а омонімічній основі – серія сполучень таких кодів.. аналіз починається з морфемного аналізу і увага звертається на флекцію. Визначається основа слова, замінюється її буквений склад порядковим номером за словником і визначається граматична інфа слова.
2)МА зі словником словоформ(35)
метод дуже простий. Маємо слово і шукаємо відповідні йому характеристики. В результаті аналізу ми отримуєм граматичну інформацію аналізованої словоформи, а також і її канонічний варіант. Якщо слово відсутнє у словнику тои аналіз нових слів проводиться з використанням морфемного аналізу. Метою такого аналізу є поділ слова на окремі морфеми(префікси, корені, суфікси і закінчення) і ці лексеми –морфи надають інформацію про граматичні дані слова. Маємо словник словник морфем , маємо множину всіх лексем. Формуємо новий словник морфем з вказаннням типів цих морфем. Префікс йде на початку слова , закінчення в кінці. Звичайно такі словники доповнюють модулями(таблицями, правилами словоформи)
3)МА шляхом логічного множення
4)МА без словника за допомогою таблиць