Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Характеристика лингвистических средств информац...docx
Скачиваний:
0
Добавлен:
17.11.2019
Размер:
896.84 Кб
Скачать
  1. Лингвистическое и информационное обеспечение автоматизированных систем

В автоматизированных информационных системах выделение лингвистического обеспечения (ЛО) из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности было фактически завершено к 1976 г. И получило юридическое закрепление Постановлением от 30.09.81 «Об утверждении единого порядка разработки и развития автоматизированных систем НТИ». В настоящее время этот документ считается утратившим силу. Лингвистическое обеспечение достаточно развитой автоматизированной информационной системы (АИС) должно включать в себя следующие компоненты:

Языковые средства :

  • Алфавит и микросинтаксис [alphabet and microsyntax] - графические средства представления данных – см. ниже ;

  • Язык библиографических данных [bibliographical data language ] - для представления библиографической информации ;

  • Класссификационные языки [classification languages] - для тематического уровня представления информации ;

  • Дескрипторные [descriptor languages] и другие посткоординатные языки [postcoordinate languages] - для предметного уровня представления информации ;

  • Объектно-признаковые языки [object-sign languages] - для фактографического уровня представления информации) ;

  • Языки запросов и манипулирования данными [inquiry and data manipulations languages] - средства операционного уровня) .

Средства поддержки ЛО :

  • Лингвистические процессоры [linguistic processors] — алгоритмы и программы автоматической обработки текстовой информации, а также создания и ведения языковых средств;

  • Лингвистический банк данных [linguistic data bank] - содержит базы данных машинных словарей и авторитетных записей а также программно-аппаратные средства управления ими;

  • Нормативная, конструкторская и технологическая документация, регламентирующая процессы создания, ведения и использования языковых средств, а также средств поддержки;

  • Служба ведения языковых средств как организационно оформленный компонент системы.

Каждый тип языковых средств, кроме алфавита, единого для всего лингвистического обеспечения системы, включает в себя:

  • Словари [dictionaries] , т. е. лексику [lexicon] и парадигматику [paradigmatic, context-free relations];

  • Синтаксис [syntax] , в частности, представленный в виде набора форматов .

Особенность лингвистического обеспечения сети по сравнению с автономно работающими системами заключается в том, что ЛО сети делится еще по одному основанию - по сфере применения.

По этому аспекту выделяются :

  • Общесистемные языковые средства [general language resources] , применяемые всеми звеньями системы (типовые ЛО) либо используемые для взаимодействия между звеньями в качестве языка-посредника (обменные средства ЛО, см., например, - “Общесистемный формат ”);

  • Локальные языковые средства [local language resources] , применяемые только в рамках отдельно взятого звена (см., например, - “Внутренний формат ”);

  • Внешние языковые средства [external language resources] , не применяемые для решения задачи внутри системы и используемые только при взаимодействии с внешними по отношению к АИС системами. Графические средства представления данных - Средства естественного языка (план выражения письменного текста) включают в себя алфавиты и микросинтаксис:

  • Алфавит [alphabet] - Упорядоченный набор букв, цифр (арабских, римских и др.), специальные знаки (препинания, математические символы и др.) и средства представления текстовых особенностей . Алфавиты, используемые в АИС, включают в себя ограниченные наборы символов, представленные в таблицах двоичных кодов (например, - ASCII, KOI8-R, UNICODE, Win1251, ISO 8859-5 и др.);

  • Микросинтаксис [microsyntax] – Средства представления расширенного кириллического, латинского, греческого или других алфавитов, представляющие собой дополнительные таблицы, содержащие соответствующие символы.

В текстах на естественном языке используются следующие алфавиты :

  • Кириллический (сокращенный или полный, включающий в себя символы - диакриты) ;

  • Латинский (сокращенный или полный, т. е. включающий в себя символы – диакриты)) ;

  • Греческий;

  • Готический и др.

Под текстовыми особенностями в текстах на естественном языке понимают:

  • Размер символа;

  • Начертание символа (например, курсив) ; жирность шрифта;

  • Положение символа в строке (на основной линии, выше или ниже ее).

Представление графической информации в АИС сопряжено с рядом трудностей, вызванных, с одной стороны, ограниченностью набора символов, а с другой — необходимостью строгой линейности записи без полиграфических особенностей. Поэтому графические средства АИС обычно беднее, чем соответствующие средства естественных языков. Однако АИС, в которых формируются информационные издания, вынуждены разрабатывать и использовать специальные средства для представления разнообразной текстовой информации .