Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПАРТИКО З. ЗАГАЛЬНЕ РЕДАГУВАННЯ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
4.58 Mб
Скачать
  1. Синтаксеми

Для синтетичних мов, до яких належить і українська, важливим є проведення контролю синтаксичної зв’язності слів у реченнях. Такий контроль дає змогу знаходити в тексті помилки на зразок з веселий сміхом. Його суть полягає в перевірці всіх означень, що стоять у препозиції до іменника, на наявність синтаксичного узгодження в роді, числі та відмінку з означуваним іменником. Такий контроль без особливих труднощів може бути реалізований за допомогою комп’ютерного словника української мови, який дає змогу здійснювати морфологічний аналіз тексту1. Для інших синтетичних мов (наприклад, російської) операції такого контролю вже функціонують.

На рівні речень актуальним є також контроль правильності синтаксичного підпоряд­кування слів (як було вказано вище в розділі 13.5.3, у дереві синтаксичних залежностей між словами дуги не можуть перехрещуватися). Проведення такого автоматичного синтак­сичного контролю в СР є достатньо складним, але цілком можливим.

Не виключаємо також можливості, що на основі моделей порядку слів у реченні (див. розділ 13.5.1) можуть бути розроблені відповідні програми контролю.

Перспективним для рівня синтаксем є також контроль таких лінгвістичних помилок:

  • тавтологій (наявність у фрагменті повідомлення великої кількості варіантів слова з одним і тим самим коренем, тобто низький ступінь урізноманітнення тексту для образних та образно-понятійних повідомлень);

  • подвійних заперечень (як встановлено психолінгвістичними дослідженнями, будь- який елемент тексту з запереченням складніший, ніж той самий елемент без заперечення);

  • речень у пасивному стані (як встановлено психолінгвістами, будь-яке речення в пасивному стані є складнішим, ніж в активному).

  1. Пунктограми

Для деяких європейських мов (наприклад англійської, російської) вже створені й функціонують програми перевірки пунктуації. В Україні є лише експериментальні системи перевірки пунктуації. Опишемо методи контролю, які використовують у цих системах.

У першій зі СР для перевірки правильності пунктуації використовують автоматичний морфологічний та синтаксичний аналіз тексту1. При цьому контролюють лише дієприкмет­никові звороти. Незважаючи на високу ефективність контролю окремих зворотів, загальна ефективність контролю всіх розділових знаків у тексті в цій системі, звичайно, низька.

У другій СР (експериментальній), що названа “Редактор”2 (рис. 18-3), контролю, як і в традиційному редагуванні, підлягають лише обов’язкові розділові знаки (див. розділ 13.5.2). Для контролю використовують індикаторний метод3. Він базується на тому, що існує ціла низка розділових знаків, для контролю яких достатньо виявити в тексті лише певні елементи (індикатори), котрі однозначно вказують на необхідність розділового знака (наприклад, сполучники а чи але всередині речення однозначно вимагають коми). Ці індикатори названі формальними. Крім них, існують і такі, що вимагають попереднього автоматичного морфологічного, синтаксичного та семантичного аналізу. Оскільки не всі з цих видів аналізу під силу сучасним СР, то контролюють у системі “Редактор” лише формальні індикатори. За межами контролю залишаються однорідні члени речення, дієприкметникові та прикметникові звороти тощо.

Виходячи з імовірнісного характеру індикаторного принципу, СР “Редактор” не роз­ставляє розділових знаків сама, а лише вказує на місця, де можливі помилки. Правильність розділових знаків, поставлених людиною, для СР є остаточною і контролю не підлягає.

СР працює за таким основним алгоритмом: якщо в реченні є пунктуаційний індикатор, біля якого не стоїть потрібний розділовий знак, то система повідомляє користувачеві, що тут помилконебезпечне місце і надає інформацію, потрібну для виправлення.

НОВОРІЧНА ЯЛИНКА

Зима. Знялася хурделиця.

Вона лютувала все дужче й дужче, і, нарешті, нічого не стало видно. Не стало видно й хатинки, що одиноко стояла на узліссі.

Там жила Зайчиха з маленьким Зайченятком. Зайченятко вибігг з хатини й подалося у поле за морквиною. Воно довго шукало її піді снігом і незчулося, як... заблукало. щ

Рис. 18-3. Загальний вигляд експериментальної СР “Редактор”

В СР “Редактор” для утворення масиву індикаторів розроблена спеціальна СКБД (рис. 18-4). Кожен запис у ній має такі поля:

  • пунктуаційний індикатор (ланцюжок літер);

  • парний індикатор (ланцюжок літер, коли він є);

  • позиція розділового знака стосовно індикатора;

  • позиція розділового знака стосовно парного індикатора;

  • потрібний розділовий знак (один або два);

  • повторюваність індикатора;

  • пунктуаційна ситуація (одно-, дво- чи п-стороння);

  • наявність прийменників перед індикатором;

  • винятки (перелік слів, які накладають обмеження на застосування індикатора);

  • пояснення пропонованого пунктуаційного виправлення.

Сумарна кількість записів у такій СКБД становить кілька сотень. За прогнозом при вичерпній кількості індикаторів вона не повинна перевищувати 1 тис. записів. Ефективність роботи СР “Редактор” становить: коефіцієнт розставлення знаків 40,3%; коефіцієнт хибної тривоги 48,9%.

ш

Редактор бази даних пунктуаційного контролю

Індикатори - цілі слова Ііцднкаторн * *

РІшвра !чГ сгфава

■■ І Г Найвність п^ ■

Паркий індикатор

Пояснення

j Г г ї улї\л

нори» 7

^ 7 ^ * ВСЬОГО 2»

Всього

Норма передбачає, що в середин) речення перед АЛЕ повинна стояти кома. Проте в даному

Рис. 18-4. СКБД СР “Редактор” для введення пунктуаційних норм редагування

Приклад виявлення пунктуаційної помилки в СР “Редактор” показано на рис. 18-5.

Пунктуаційний контроль

111

Гукало-гукало{>} але хто крізь таку завірюху почує слабенький голосок Зайченяти?

Щ

Рис. 18-5. Діалогове вікно виявлення пунктуаційних помилок СР “Редактор”