- •Введение
- •Структура и классификация информационных систем
- •Свойства информационных систем
- •Классификации ис
- •Обеспечение информационных систем
- •Информационные технологии
- •Лингвистическое и информационное обеспечение автоматизированных систем
- •Создание базы данных в окне проекта
- •Информационное обеспечение Автоматизированной информационной Системы
- •Информационная база
- •Лингвистические средства Базы данных
- •Приложения
- •Использованные источники
Лингвистическое и информационное обеспечение автоматизированных систем
В автоматизированных информационных системах выделение лингвистического обеспечения (ЛО) из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности было фактически завершено к 1976 г. И получило юридическое закрепление Постановлением от 30.09.81 «Об утверждении единого порядка разработки и развития автоматизированных систем НТИ». В настоящее время этот документ считается утратившим силу. Лингвистическое обеспечение достаточно развитой автоматизированной информационной системы (АИС) должно включать в себя следующие компоненты:
Языковые средства :
Алфавит и микросинтаксис [alphabet and microsyntax] - графические средства представления данных – см. ниже ;
Язык библиографических данных [bibliographical data language ] - для представления библиографической информации ;
Класссификационные языки [classification languages] - для тематического уровня представления информации ;
Дескрипторные [descriptor languages] и другие посткоординатные языки [postcoordinate languages] - для предметного уровня представления информации ;
Объектно-признаковые языки [object-sign languages] - для фактографического уровня представления информации) ;
Языки запросов и манипулирования данными [inquiry and data manipulations languages] - средства операционного уровня) .
Средства поддержки ЛО :
Лингвистические процессоры [linguistic processors] — алгоритмы и программы автоматической обработки текстовой информации, а также создания и ведения языковых средств;
Лингвистический банк данных [linguistic data bank] - содержит базы данных машинных словарей и авторитетных записей а также программно-аппаратные средства управления ими;
Нормативная, конструкторская и технологическая документация, регламентирующая процессы создания, ведения и использования языковых средств, а также средств поддержки;
Служба ведения языковых средств как организационно оформленный компонент системы.
Каждый тип языковых средств, кроме алфавита, единого для всего лингвистического обеспечения системы, включает в себя:
Словари [dictionaries] , т. е. лексику [lexicon] и парадигматику [paradigmatic, context-free relations];
Синтаксис [syntax] , в частности, представленный в виде набора форматов .
Особенность лингвистического обеспечения сети по сравнению с автономно работающими системами заключается в том, что ЛО сети делится еще по одному основанию - по сфере применения.
По этому аспекту выделяются :
Общесистемные языковые средства [general language resources] , применяемые всеми звеньями системы (типовые ЛО) либо используемые для взаимодействия между звеньями в качестве языка-посредника (обменные средства ЛО, см., например, - “Общесистемный формат ”);
Локальные языковые средства [local language resources] , применяемые только в рамках отдельно взятого звена (см., например, - “Внутренний формат ”);
Внешние языковые средства [external language resources] , не применяемые для решения задачи внутри системы и используемые только при взаимодействии с внешними по отношению к АИС системами. Графические средства представления данных - Средства естественного языка (план выражения письменного текста) включают в себя алфавиты и микросинтаксис:
Алфавит [alphabet] - Упорядоченный набор букв, цифр (арабских, римских и др.), специальные знаки (препинания, математические символы и др.) и средства представления текстовых особенностей . Алфавиты, используемые в АИС, включают в себя ограниченные наборы символов, представленные в таблицах двоичных кодов (например, - ASCII, KOI8-R, UNICODE, Win1251, ISO 8859-5 и др.);
Микросинтаксис [microsyntax] – Средства представления расширенного кириллического, латинского, греческого или других алфавитов, представляющие собой дополнительные таблицы, содержащие соответствующие символы.
В текстах на естественном языке используются следующие алфавиты :
Кириллический (сокращенный или полный, включающий в себя символы - диакриты) ;
Латинский (сокращенный или полный, т. е. включающий в себя символы – диакриты)) ;
Греческий;
Готический и др.
Под текстовыми особенностями в текстах на естественном языке понимают:
Размер символа;
Начертание символа (например, курсив) ; жирность шрифта;
Положение символа в строке (на основной линии, выше или ниже ее).
Представление графической информации в АИС сопряжено с рядом трудностей, вызванных, с одной стороны, ограниченностью набора символов, а с другой — необходимостью строгой линейности записи без полиграфических особенностей. Поэтому графические средства АИС обычно беднее, чем соответствующие средства естественных языков. Однако АИС, в которых формируются информационные издания, вынуждены разрабатывать и использовать специальные средства для представления разнообразной текстовой информации .