Информационные технологии в управлении. Технологии базы знаний, экспертных систем и искусственного интеллекта.
Информационные технологии в управлении это технологии будующего. Они в перспективе и сейчас уже основываются на исскуственном интелекте.
Искусственный интеллект (ИИ) - это научное направление, представляющее собой условное обозначение кинематических систем, моделирующих некоторые стороны деятельности человека (логическое, аналитическое мышление). ИИ бывает:
Бионический - попытка смоделировать с помощью ИИ человеческий разум.
Прагматический - создание аппаратно-программных средств, позволяющих получить результаты мыслительной деятельности, а не моделировать ее саму.
Если обычная программа действий представлена в виде парадигмы выглядит так:
Программа = Алгоритм + Данные + СУБД ,
то программа системы ИИ выглядит так
СИИ = Знания + Стратегия обработки знаний
В условиях резкого увеличения объемов информации информационные технологии позволяют перейти к работе со знаниями на основе искусственного интеллекта, по всей вероятности это единственная альтернатива информационного общества. Воспользуемся определением «интеллектуальной системы» проф. Д.А. Поспелова [38]: «Система называется интеллектуальной, если в ней реализованы следующие основные функции:
накапливать знания об окружающем системе мира, классифицировать и оценивать их с точки зрения прагматической полезности и непротиворечивости, инициировать процессы получения новых знаний, осуществлять соотнесение новых знаний с ранее хранимыми;
пополнять поступившие знания с помощью логического вывода, отражающего закономерности в окружающую систему мира или в накопленных ею ранее знаниях, получать обобщенные знания на основе более частных знаний и логически планировать свою деятельность;
общаться с человеком на языке, максимально приближенном к естественному человеческому языку, и получать информацию от каналов, аналогичных тем, которые использует человек при восприятии окружающего мира, уметь формировать для себя или по просьбе человека (пользователя) объяснение собственной деятельности, оказывать пользователю помощь за счет тех знаний, которые хранятся в памяти, и тех логических средств рассуждений, которые присущи системе».
Перечисленные функции можно назвать функциями представления и обработки знаний, рассуждения и общения. Наряду с обязательными компонентами, в зависимости от решаемых задач и области применения в конкретной системе эти функции могут быть реализованы в различной степени, что определяет индивидуальность архитектуры. На рис. 2.47 в наиболее общем виде представлена структура интеллектуальной системы в виде совокупности блоков и связей между ними.
База знаний представляет собой совокупность сред, хранящих знания различных типов. Рассмотрим кратко их назначение.
База фактов (данных) хранит конкретные данные, а база правил — элементарные выражения, называемые в теории искусственного интеллекта продукциями. База процедур содержит прикладные программы, с помощью которых выполняются все необходимые преобразования и вычисления. База закономерностей включает различные сведения, относящиеся к особенностям той среды, в которой действует система. База метазнаний (база знаний о себе) содержит описание самой системы и способов ее функционирования: сведения о том, как внутри системы представляются единицы информации различного типа, как взаимодействуют различные компоненты системы, как было получено решение задачи.
База целей содержит целевые структуры, называемые сценариями, позволяющие организовать процессы движения от исходных фактов, правил, процедур к достижению той цели, которая поступила в систему от пользователя, либо была сформулирована самой системой в процессе ее деятельности в проблемной среде.
Управление всеми базами, входящими в базу знаний, и организацию их взаимодействия осуществляет система управления базами знаний. С ее же помощью реализуются связи баз знаний с внешней средой. Таким образом, базы знаний осуществляет первую функцию интеллектуальной системы.
Выполнение второй функции обеспечивает часть интеллектуальной системы, называемая анализатор и состоящая из ряда блоков, управляемых системой управления. Часть из блоков реализует логический вывод. Блок дедуктивного вывода осуществляет в анализаторе дедуктивные рассуждения, с помощью которых из закономерностей из базы знаний, фактов из базы фактов и правил из базы правил выводятся новые факты. Кроме этого данный блок реализует эвристические процедуры поиска решений задач, как поиск путей решения задачи по сценариям при заданной конечной цели. Для реализации рассуждений, которые не носят дедуктивного характера, т.е. для поиска по аналогии, по прецеденту и пр., используются блоки индуктивного и правдоподобного выводов. Блок планирования используется в задачах планирования решений совместно с блоком дедуктивного вывода. Назначение блока функциональных преобразований состоит в решении задач расчетно-логического и алгоритмического типов.

Рис. 2.47. Общая структура интеллектуальной системы
Третья функция — функция общения — реализуется как с помощью компоненты естественно-языкового интерфейса, так и с помощью рецепторов и эффекторов, которые осуществляют так называемое невербальное общение и используются в интеллектуальных роботах.
В зависимости от набора компонентов, реализующих рассмотренные функции, можно выделить следующие основные разновидности интеллектуальных систем:
- интеллектуальные информационно-поисковые системы;
- экспертные системы (ЭС);
- расчетно-логические системы;
- гибридные экспертные системы.
Интеллектуальные информационно-поисковые системы являются системами взаимодействия с проблемно-ориентированными (фактографическими) базами данных на естественном, точнее ограниченном как грамматически, так и лексически (профессиональной лексикой) естественном языке (языке деловой прозы). Для них характерно использование, помимо базы знаний, реализующей семантическую модель представления знаний о проблемной области, лингвистического процессора.
Экспертные системы являются одним из бурно развивающихся классов интеллектуальных систем. Данные системы в первую очередь стали развиваться в математически слабоформализованных областях науки и техники, таких как медицина, геология, биология и др. Для них характерна аккумуляция в системе знаний и правил рассуждений опытных специалистов в данной предметной области, а также наличие специальной системы объяснений.
Расчетно-логические системы позволяют решать управленческие и проектные задачи по их постановкам (описаниям) и исходным данным вне зависимости от сложности математических моделей этих задач. При этом конечному пользователю предоставляется возможность контролировать в режиме диалога все стадии вычислительного процесса. В общем случае, по описанию проблемы на языке предметной области обеспечивается автоматическое построение математической модели и автоматический синтез рабочих программ при формулировке функциональных задач из данной предметной области. Эти свойства реализуются благодаря наличию базы знаний в виде функциональной семантической сети и компонентов дедуктивного вывода и планирования.
В современных условиях появляются системы информационной поддержки и принятия решения (СИППР). Эти СИППР - человеко-вычислительная системы, сочетающие субъективные предпочтение пица принимающего решение (ЛПР) с электронно-вычислительными методами анализом ситуации. СИППР состоят из функций, облегчающих принятие решение командиром, администратором или ЛПР (рис.2.48).
СИППР
включает:
ЛПР
Рис.2.48. Функции системы информационной поддержки принятия решения
СИППР решает следующие задачи:
1. Обеспечивает постоянный обмен информации о сложившейся обстановке.
2. Производит оценку обстановки (ситуаций), осуществляет выбор критериев и оценивает их относительную важность
3. Генерирует возможные варианты решения (сценарий действий).
4. Моделирует принимаемые решения (когда возможно).
5. Осуществляет динамический анализ возможных последствий и выбирает лучший из вариантов решения.
6. Производит сбор и оценку результатов реализации принятого решения.
На рис 2.49. представлена возможная архитектура СИППР.



Рис. 2.49. Архитектура современной СИППР
Указанная СИППР в составе АИУС РСЧС РФ могут применяться на ЦУКС и др. КП. В США КП оснащены подобными системами (рис.2.50).

Рис.2.50. СИППР на КП военного формирования США

Рис.2.51. Схема модели проблемной ситуации
Основные направления и методы исследования
Таблица 2
-
Направления исследования
Методы исследования
Экономико-математические методы
Оптимизационные задачи управления:
- задачи распределения;
- задачи массового обслуживания;
- задачи упорядочения;
- задачи замены оборудования .
Методы моделирование
Виды моделей:
-наглядные(визуализация); - физические;
- технологические;
-информационные (математические, искусственных нейронных сетей, логические, графические и др.).
Методы выработки решения в диалоговом режиме «человек-ЭВМ»
Многократное чередование эвристических (человек) и формализованных (ЭВМ) этапов - в этом суть диалога.
Экспертные методы
Методы: - экспертных оценок «Дельфи»;
- статистики ;
- программное прогнозирование; --- эвристическое программирование; - - коллективная генерация идей - «мозговой штурм».
Методы построения прогнозного графа
Сценарий, прогнозный граф, «Дерево целей».
Метод матричного прогнозирования
Метод сравнения разных направления НИР
Имитационные и ситуационные методы
Методы нечетких множеств.
Игровые и неигровые и др.
Любую проблемную ситуацию можно смоделировать (рис.2.51). Направления и методы моделирования представлены в таблице 2. Особенностью моделирования является возможность исследователя в рамках возможностей различных аппаратов и методов описать проблеммную ситуацию, с помощью ВТ проиграть все варианты по критерию «эффективность/стоимость» и правильно слелать вывод по результатам исследования. Порядок моделирования рассмотено ранее в параграфе 2.4. Основные направления и методы исследования приведены в таблице 2.
В ходе исследований обязательным образом должна учитываться неопределенность данных, обстановки и пр. Под неопределенностью будем понимать случайность появления события, данных и т. д. Неопределенность может быть снижена за счет специальных математических методов:
применение теории игр;
проведение статистической обработки данных;
применения критериев Вальда, Сэвиджа и Гурвица
При работе с неопределенностью информации ЛПР неосвобождается от принятия решения при высокой ее степени. В этом случае ЛПР идет на риск. Степень риска зависит от неопределенности информации. Следовательно необходимо:
1. Увеличивать уровень информативности.
2. Управление риском (прогноз наступления рискового события и снижение степени риска, оценка через энтропию – характеристику хаоса, (I + H = 1) больше количества информации меньше энтропии и наоборот)
3. Расчет степени риска через дисперсию или коэффициент вариаций
(d2 =S (xi - x)2./ n; V = d / x*100%),
где d2 -дисперсия события;
х – событие;
n – число событий.
V – коэффицент вариаций.
Результат дает возможность ориентироваться ЛПР (если V< 10%, то неустойчивость слабая, если 10%<V<25%, то неустойчивость умеренная, если V> 25%, то неустойчивость высокая).
Таким образом, применение научных методов в виде информационных технологий позволяет ЛПР основываться на полученных данных и тем самым найти рациональное решение.
СППР в своей основе применяются на командных пунктах, ЦУКСах и др. органов управления. Особенно заслуживает вниимания применения подобных систем в составе органа управлениия по типу ситуационный центр (СЦ). Под ситуационным центром (комнатой) будем понимать орган управления оснащенный локальной ТКС, пакетом специальных программ по типу СИППР с возможностью оптимизации решения по какому – либо критерию и необходимом составом экспертов и режисера (администратор сети). Такой СЦ представлен на рис. 2.52.
Особенностью работы такого СЦ заключается в выработке решении по заданной проблеме коллективом экспертов под руководством ЛПР и при обеспечении администратором локальной сети (режессером). На рис. 2.52 представлены АРМ экспертов за одним круглым столом и различной аппаратуры индивидуального и коллективного пользования на базе локальной ТКС.
Алгоритм работы определяет ЛПР. По его команде предлагается определиться одному из экспертов по заданной проблеме. При этом на его АРМ отражается следующий интерфейсе рис. 2.53.
Из меню интерфейса видно, что в настоящий момент исходные данные вводит эксперт Петров В.В. При этом в правой нижней части интерфейса он определил два критерия по решаемой проблеме это уровень безработицы и уровень преступности. Количественно указанные критерии эксперт определяет движком справа от критериев.

Рис.2.52. Структура ситуационного центра.
Данный интерфейс отражает поиск решения политической предвыборной задачи. Результаты сразу отражаются на интерфейсе эксперта. Справа вверху видна диаграмма выбора решений по методу Саати в процентах. Это оптимизационная задача показывает, что третий вариат (возможно Петрова В.В.) имеет самый большой процент успеха. При этом СИППР в настоящее время проводить вычисления на основе картографов (рис. 2.54).
В последнее время в специальный класс выделяются гибридные экспертные системы. Указанные системы должны вобрать в себя лучшие черты как экспертных, так и расчетно-логических и информационно-поисковых систем. Разработки в области гибридных экспертных систем находятся на начальном этапе (рис. 2.55).
Наиболее значительные успехи в настоящее время достигнуты в таком классе интеллектуальных систем, как экспертные системы.
ЭС называют вычислительную систему использования знаний эксперта и процедур логического вывода для решения проблем, которые требуют проведения экспертизы и позволяют дать объяснение полученным результатам.
ЭС обладает способностями к накоплению знаний, выдаче рекомендаций и объяснению полученных результатов, возможностями модификации правил, подсказки пропущенных экспертом
условий, управления целью или данными. ЭС отличают следующие характеристики: интеллектуальность, простота общения с компьютером, возможность наращивания модулей, интеграция неоднородных данных, способность разрешения многокритериальных задач при учете предпочтений лиц, принимающих решения (ЛПР), работа в реальном времени, документальность, конфиденциальность, унифицированная форма знаний, независимость механизма логического вывода, способность объяснения результатов.
В настоящее время можно выделить следующие основные сферы применения ЭС: диагностика, планирование, имитационное моделирование, предпроектное обследование предприятий, офисная деятельность, а также некоторые другие.
Практика показывает, что по сравнению со статическими системами гораздо больший эффект дают ЭС, используемые в динамических процессах (экспертные системы реального времени — ЭСРВ), которые занимают около 70% рынка таких систем и находят все более широкое применение в управлении непрерывными процессами (химические производства, цементная промышленность, атомная энергетика и т.д.).

Рис.2.53. Интерфейс эксперта Петрова В.В.
По сравнению с общей схемой в ЭС часто отсутствует возможность общения с системой на близком к естественному языке или с использованием визуальных средств, поскольку взаимодействие с такой системой осуществляется с использованием языка типа ПРОЛОГ или с применением ПРОЛОГ- идей, а также язык программирования - ЛИСП.
Важное место в теории искусственного интеллекта (ИИ) занимает проблема представления знаний. В настоящее время выделяют следующие основные типы моделей представления знаний:
семантические сети, в том числе функциональные;
фреймы и сети фреймов;
продукционные модели.
Семантические сети определяют как граф общего вида, в котором можно выделить множество вершин и ребер. Каждая вершина графа представляет некоторое понятие, а дуга — отношение между парой понятий. Метка и направление дуги конкретизируют семантику. Метки вершин семантической нагрузки не несут, а используются как справочная информация
Различные разновидности семантических сетей обладают различной семантической мощностью, следовательно, можно описать одну и ту же предметную область более компактно или громоздко. Основным элементом их является фрейм.
Фреймом называют структуру данных для представления и описания стереотипных объектов, событий или ситуаций. Фреймовая модель представления знаний состоит из двух частей:
набора фреймов, составляющих библиотеку внутри представляемых знаний;
механизмов их преобразования, связывания и т.д. Существует два типа фреймов:
образец (прототип) — интенсиональное описание некоторого множества экземпляров;
экземпляр (пример) — экстенсиональное представление фрейм-образца.
В общем виде фрейм может быть представлен следующим кортежем:
<ИФ, (ИС, ЗС, ПрисПроц), ..., (ИС, ЗС, ПрисПроц)>,
где ИФ — имя фрейма;
ИС — имя слота;
ЗС — значение слота;
ПрисПроц — имя присоединенной процедуры (необязательный параметр).
Слоты — это некоторые незаполненные подструктуры фрейма, заполнение которых приводит к тому, что данный фрейм ставится в соответствие некоторой ситуации, явлению или объекту.

Рис.2.54. Принцип работы картографа при суммированиии, усреднении или максимизации (минимизации) данных выраженных гаммой различных цветов
В качестве данных фрейм может содержать обращения к процедурам (так называемые присоединенные процедуры). Выделяют два вида процедур: процедуры-демоны и процедуры-слуги. Процедуры-демоны активизируются при каждой попытке добавления или удаления данных из слота. Процедуры-слуги активизируются только при выполнении условий, определенных пользователем при создании фрейма.
Продукционные модели — это набор правил вида «условия — действие», где условиями являются утверждения о содержимом базы данных, а действия представляют собой процедуры, которые могут изменять содержимое базы данных.
Формально продукция определяется следующим образом:
(i);
Q; F,C; A
В;
N,
где (i) — имя продукции (правила);
Q — сфера применения правила;
Р — предусловие (например, приоритетность);
С — предикат (отношение);
А
В
— ядро;
N — постусловия (изменения, вносимые в систему правил).
Практически продукции строятся по схеме «ЕСЛИ» (причина или иначе посылка), «ТО» (следствие или иначе цель правила).

Рис. 2.55. Упрощенная структура гибридноэкспертной системы
Полученные в результате срабатывания продукций новые знания могут использоваться в следующих целях:
• понимание и интерпретация фактов и правил с использованием продукций, фреймов, семантических цепей;
• решение задач с помощью моделирования;
• идентификация источника данных, причин несовпадений новых знаний со старыми, получение метазнаний;
• составление вопросов к системе;
• усвоение новых знаний, устранение противоречий, систематизация избыточных данных.
Процесс рассмотрения компьютером набора правил (выполнение программы) называют консультацией. Ее наиболее удобная для пользователя форма — дружественный диалог с компьютером. Интерфейс может быть в форме меню, на языке команд и на естественном языке.
Диалог может быть построен на системе вопросов, задаваемых пользователем, компьютером, или фактов — данных, хранящихся в базе данных. Возможен смешанный вариант, когда в базе данных недостаточно фактов.
При прямом поиске пользователь может задавать две группы вопросов, на которые, компьютер дает объяснения:
1) КАК получено решение? При этом компьютер должен выдать на экран трассу в виде ссылок на использованные правила;
2) ПОЧЕМУ компьютер задал какой-то вопрос? При этом на экран выдается своеобразная трасса, которую компьютер хотел бы использовать для вывода после получения ответа на задаваемый вопрос. Вопрос ПОЧЕМУ может быть задан как в процессе консультации, так и после выполнения программы.
Специфичен алгоритм поиска, реализуемый логическими языками: он является фактически последовательным перебором по дереву сверху-вниз-слева-направо.
Выделим следующие характеристики ЭС: назначение, проблемная область, глубина анализа проблемной области, тип используемых методов и знаний, класс системы, стадия существования, инструментальные средства.
Назначение определяется следующей совокупностью параметров: цель создания экспертной системы — для обучения специалистов, для решения задач, для автоматизации рутинных работ, для тиражирования знаний экспертов и т.п.; основной пользователь — не специалист в области экспертизы, специалист, учащийся.
Проблемная область может быть определена совокупностью параметров предметной области и задач, решаемых в ней. Каждый из параметров можно рассматривать как с точки зрения конечного пользователя, так и разработчика экспертной системы.
С точки зрения пользователя предметную область можно характеризовать ее описанием в терминах пользователя, включающим наименование области, перечень и взаимоотношения подобластей и т.п., а задачи, решаемые существующими экспертными системами, — их типом. Обычно выделяют следующие типы задач:
интерпретация символов или сигналов — составление смыслового описания по входным данным;
диагностика — определение неисправностей (заболеваний) по симптомам;
предсказание — определение последствий наблюдаемых ситуаций;
конструирование — разработка объекта с заданными свойствами при соблюдении установленных ограничений;
планирование — определение последовательности действий, приводящих к желаемому состоянию объекта;
слежение — наблюдение за изменяющимся состоянием объекта и сравнение его показателей с установленными или желаемыми;
управление — воздействие на объект для достижения желаемого поведения.
С точки зрения разработчика целесообразно выделять статические и динамические предметные области. Предметная область называется статической, если описывающие ее исходные данные не изменяются во времени (точнее, рассматриваются как не изменяющиеся за время решения задачи). Статичность области означает неизменность описывающих ее исходных данных. При этом производные данные (выводимые из исходных) могут и появляться заново, и изменяться (не изменяя, однако, исходных данных). Если исходные данные, описывающие предметную область, изменяются за время решения задачи, то предметную область называют динамической. Кроме того, предметные области можно характеризовать следующими аспектами: числом и сложностью сущностей, их атрибутов и значений атрибутов; связностью сущностей и их атрибутов; полнотой знаний; точностью знаний (знания точны или правдоподобны: правдоподобность знаний представляется некоторым числом или высказыванием).
Решаемые задачи, с точки зрения разработчика экспертной системы, также можно разделить на статические и динамические. Будем говорить, что ЭС решает динамическую или статическую задачу, если процесс ее решения изменяет или не изменяет исходные данные о текущем состоянии предметной области.
В подавляющем большинстве существующие ЭС исходят из предположения о статичности предметной области и решают статические задачи. Будем называть такие ЭС - статическими. ЭС, которые имеют дело с динамическими предметными областями и решают статические или динамические задачи, будем называть динамическими.
Решаемые задачи, кроме того, могут характеризоваться следующими аспектами: числом и сложностью правил, используемых в задаче, их связностью, пространством поиска, числом активных агентов, изменяющих предметную область, классом решаемых задач.
По степени сложности выделяют простые и сложные правила. К сложным относятся правила, текст записи которых на естественном языке занимает 1/3 страницы и больше. Правила, текст записи которых занимает менее 1/3 страницы, относят к простым. Можно сказать, что степень сложности задачи определяется не просто общим числом правил данной задачи, а числом правил в ее наиболее связной независимой подзадаче.
Пространство поиска может быть определено по крайней мере тремя факторами: размером, глубиной и шириной. Размер пространства поиска дает обобщенную характеристику сложности задачи. Выделяют малые (до 3,6 • 106 состояний) и большие (свыше 3,6 • 106 состояний) пространства поиска. Глубина пространства поиска характеризуется средним числом последовательно применяемых правил, преобразующих исходные данные в конечный результат, ширина пространства — средним числом правил, пригодных к выполнению в текущем состоянии.
Класс задач определяет методы, используемые ЭС для их решения. Данный аспект в ЭС принимает следующие значения: задачи расширения, доопределения, преобразования. Задачи доопределения и расширения являются статическими, а задачи преобразования — динамическими.
К задачам расширения относятся такие, в процессе решения которых осуществляется только увеличение информации о предметной области, не приводящее ни к изменению ранее выведенных данных, ни к другой области задач.
К задачам доопределения относятся задачи с неполной или неточной информацией о реальной предметной области, цель решения которых — выбор из множества альтернативных текущих состояний предметной области того, которое адекватно исходным данным. В случае неточных данных альтернативные текущие состояния возникают как результат ненадежности данных и правил, что приводит к многообразию различных доступных выводов из одних и тех же исходных данных. В случае неполных данных альтернативные состояния являются результатом доопределения.
Большинство существующих ЭС решают задачи расширения, в которых нет ни изменений предметной области, ни активных агентов, преобразующих ее. Подобное ограничение неприемлемо при работе в динамических областях.
По степени сложности структуры ЭС делят на поверхностные и глубинные. Поверхностные ЭС представляют знания об области экспертизы в виде правил (условие—действие). Условие каждого правила определяет образец некоторой ситуации, при соблюдении которой правило может быть выполнено. Поиск решения состоит в выполнении тех правил, образцы которых сопоставляются с текущими данными (текущей ситуацией в РП). При этом предполагается, что в процессе поиска решения последовательность формируемых таким образом ситуаций не оборвется до получения решения, т.е. не возникнет неизвестной ситуации, которая не сопоставится ни с одним правилом. Глубинные ЭС, кроме возможностей поверхностных систем, обладают способностью при возникновении неизвестной ситуации определять с помощью некоторых общих принципов, справедливых для области экспертизы, какие действия следует выполнить.
По типу используемых методов и знаний ЭС делят на традиционные и гибридные. Традиционные ЭС используют в основном неформализованные методы инженерии знаний и неформализованные знания, полученные от экспертов. Гибридные ЭС используют методы инженерии знаний, формализованные методы, а также данные традиционного программирования и математики (рис.2.53).
Совокупность рассматриваемых выше характеристик позволяет определить особенности конкретной ЭС. Однако пользователи зачастую стремятся охарактеризовать ЭС каким-либо одним обобщенным параметром. В этой связи говорят о поколениях ЭС. В настоящее время выделяют ЭС первого и второго поколений. Однако, по-видимому, следует говорить о трех поколениях ЭС. К первому поколению следует отнести статические поверхностные ЭС, ко второму — статические глубинные ЭС (иногда ко второму поколению относят гибридные ЭС), а к третьему — динамические ЭС (вероятно, они, как правило, будут глубинными и гибридными).
В последнее время выделяют два больших класса ЭС (существенно отличающихся по технологии их проектирования), которые условно назовем простыми и сложными ЭС. К простым можно отнести поверхностную и традиционную (реже гибридную) ЭС, выполненные на персональной ЭВМ и содержащие от 200 до 1000 правил. К сложным ЭС относятся глубинная и гибридная ЭС, выполненные либо на символьной, либо на мощной универсальной ЭВМ, либо на интеллектуальной рабочей станции, содержащие от 1500 до 10 000 правил.
Стадия существования характеризует степень проработанности и отлаженности ЭС. Обычно выделяют следующие стадии: демонстрационный прототип, исследовательский прототип, действующий прототип, промышленная система, коммерческая система.
Демонстрационным прототипом называют ЭС, которая решает часть требуемых задач, демонстрируя жизнеспособность метода инженерии знаний. При наличии развитых интеллектуальных систем для разработки демонстрационного прототипа требуется примерно 1—2 мес. Демонстрационный прототип работает, имея 50—100 правил. Развитие демонстрационного прототипа приводит к исследовательскому прототипу.
Исследовательским прототипом называют систему, которая решает все требуемые задачи, но неустойчива в работе и не полностью проверена. Исследовательский прототип обычно имеет в базе знаний 200 — 500 правил, описывающих проблемную область.
Действующий прототип надежно решает все задачи, но для решения сложных задач может потребоваться чрезмерно много времени и (или) огромная память. Число правил в такой системе равно 500-1000.
Экспертная система, достигшая промышленной стадии, обеспечивает высокое качество решения всех задач при минимуме времени и памяти. Обычно процесс преобразования действующего прототипа в промышленную систему состоит в расширении числа правил до 1000—1500 и переписывании программ с использованием более эффективных интеллектуальных систем.
Обобщение задач, решаемых на стадии промышленной системы, позволяет перейти к стадии коммерческой системы, пригодной не только для собственного использования, но и для продажи различным потребителям. В базе знаний такой системы 1500—3000 правил.
Диапазон возможных средств построения ЭС простирается от языков высокого уровня до средств поддержки низкого уровня. Разделим инструментальные средства построения ЭС на четыре основных категории:
языки программирования;
языки инженерии знаний;
вспомогательные средства;
средства поддержки.
Языки программирования, применяемые для работы в области ЭС, — это, как правило, или проблемно-ориентированные языки (Фортран, Паскаль и т.д.), или языки обработки текстов (Лисп, Пролог). Проблемно-ориентированные языки разработаны для специального класса задач. Например, Фортран удобен для выполнения алгебраических вычислений и чаще всего применяется в научных, математических и статистических вычислениях. Языки обработки текстов разработаны для прикладных областей искусственного интеллекта. Например, Лисп имеет механизмы для манипулирования символами в форме списковых структур. Список является просто набором элементов, заключенных в скобки, где каждый элемент может быть или символом, или другим списком. Списковые структуры являются удобным строительным материалом для представления сложных понятий. В языке Лисп все отношения между объектами описываются через списки, содержащие отношения объекта с другими объектами.
Добавим, что Лисп существует в разных версиях. Например, Интерлисп и Маклисп имеют различные средства поддержки (редакторы и средства отладки), но одинаковый синтаксис.
Языки программирования, подобные Лиспу, представляют максимальную гибкость разработчику ЭС, но никак не подсказывают ему, как представлять знания или как построить механизм доступа к базе знаний. С другой стороны, языки инженерии знаний, такие как KAS, обладают меньшей гибкостью, поскольку разработчик системы должен пользоваться схемой управления, определяемой встроенным в язык механизмом вывода. Эти языки, однако, обеспечивают некоторое руководство и готовые механизмы вывода для управления и использования базы знаний.
Язык инженерии знаний является искусным инструментальным средством разработки ЭС, погруженным в обширное поддерживающее окружение. Языки инженерии знаний можно разделить на скелетные и универсальные. Скелетный язык инженерии знаний является просто «раздетой» экспертной системой, т.е. ЭС без специальных предметных знаний, включающей в себя только механизм вывода и средства поддержки.
Универсальный язык инженерии знаний может быть применим к проблемам разного типа в различных прикладных областях. Он обеспечивает более широкие возможности управления поиском данных и доступом к ним, чем скелетные системы, но может оказаться, что его труднее использовать. Разные универсальные языки значительно варьируют в смысле общности и гибкости.
Вспомогательные средства построения ЭС состоят из программ, оказывающих помощь в приобретении знаний у эксперта, и представлении их, и программ, которые помогают разрабатывать проекты экспертных систем.
Средства поддержки — это просто пакеты программ, которые прилагаются к средству построения ЭС, чтобы упростить его использование, облегчить диалог и сделать его более эффективным. Это — средства отладки, ввода-вывода, объяснения, редакторы баз знаний.
Интеллектуальные системы расчетно-логического типа предполагают организацию базы знаний в виде функциональной семантической сети. Рассмотрим кратко алгоритмы поиска решений на функциональной семантической сети (ФСС). Первой задачей, которая должна быть решена, является выбор представления, в котором реализуются процедуры поиска решений и организации вычислительного процесса. При этом целесообразно выбрать представление в пространстве состояний. В данном представлении задачу поиска решений можно формально записать следующим образом:
![]()
где S0 - начальное состояние;
Sk — конечное состояние;
S — множество промежуточных состояний;
F= {Fi} — множество операторов, которые переводят процесс поиска из одного состояния в другое. Каждому математическому отношению Fi поставим в соответствие список (кортеж) параметров, которые в него входят.
Таким образом, рассматриваемый алгоритм предусматривает работу со списочными структурами данных.
При поиске решений на ФСС в качестве множества операторов выступают разрешения математических отношений Fi реализуемые в виде отдельных программных модулей, совокупность которых для данной проблемной области составляет локальную (может быть, одну из многих) базу процедур. Здесь верхний индекс η указывает на параметр, который в данном разрешении выступает как функция, а нижний индекс i — на номер соответствующего математического отношения в совокупности математических отношений. Задание исходных данных определяет начальное состояние S0, а искомое решение — конечное (целевое) состояние. Выбор на каждом очередном шаге некоторого конкретного оператора осуществляется в соответствии с некоторыми правилами, которые для данной проблемной области составляют локальную базу правил.
Первый алгоритм реализует стратегию обратной волны, начиная поиск решения задачи с целевого состояния, т.е. от искомого параметра. Суть алгоритма состоит в следующем. В соответствии с алгоритмом поиска решений Нильсона образуем следующие списки: S1 — список параметров, которые должны быть рассчитаны; S2 — список параметров, для которых выбраны разрешения для расчета. Дополнительно образуем еще два списка: S3 — список разрешений, включаемых в план решения задачи, и S4 — список оценок сложности реализации разрешения, выбранного в план решения задачи. Данные оценки позволяют при наличии нескольких планов выбрать наилучший, т.е. реализовать классическую постановку задачи принятия решений.
Во втором алгоритме реализуется стратегия прямой волны, т.е. планирование идет от исходных данных к целевому параметру.
Многофункциональность разрабатываемых систем обработки интеллектуальной информации может быть обеспечена за счет современного подхода к хранению и использованию знаний проектировщиков.
Основной принцип данного подхода заключается в том, что задачи решаются на основе не просто данных, а знаний. Последние являются существенно более мощными и позволяют решать на их основе сложные задачи.
Традиционные ЭС имеют лишь один механизм поддержки принятия решений — логический вывод и лишь одно средство представления знаний — правила. В последнее время активно развивается новое поколение ЭС — гибридные экспертные системы (ГЭС).
Для использования ГЭС в качестве средства поддержки принятия управленческих решений необходимо предусмотреть возможность учета характеристик лица, принимающего решение (ЛПР). В этом случае в экспертной системе должна присутствовать гибкая схема логического вывода, а поддержка принятия решений должна осуществляться в соответствии с конкретной аналитической моделью пользователя. На рис. 2.55 приведена упрощенная архитектура ГЭС. Данная архитектура не претендует на полноту и характеризует отличие ГЭС от традиционных ЭС.
Эксперт соответствующей предметной области должен иметь возможность задавать оценки объектов, выявленные в результате его взаимодействия с подсистемой обработки экспертных знаний. Полученные таким образом экспертные знания будут храниться в базе экспертных знаний.
Одним из основных этапов решения задачи многокритериального выбора является настройка модели на систему предпочтений ЛПР. Она выявляется в результате взаимодействия ЛПР и подсистемы выявления предпочтений ЛПР. Найденные таким образом характеристики ЛПР сохраняются в базе характеристик ЛПР.
Банк моделей должен содержать широкий набор решающих правил, выражающих различные стратегии поведения пользователя. В АИУС РСЧС системы ИИ только начинают развиваться. Пока это простые системы информационной поддержки принятия решения для ЛПР, имеющими особенности характера.
Таким образом системы ИИ все больше входят в информатизацию общества в виде экспертных систем. За ними будущее в основании, которых информационные технологии.
Мультимедийная технология представления информации в АИУС РСЧС
Развитие гипертекстовой технологии в глобальных сетях стало основой к появлению гипермедийных документов, которые наряду с текстовой информацией содержат информацию, представленную в мультимедийной форме.Несмотря на то, что основные понятия гипертекста сформировались уже достаточно давно, настоящее развитие он получил лишь с появлением компьютерных способов его реализации. Аналогичная ситуация сложилась и с мультимедиа: комплексное применение всех видов информационного воздействия на человека использовалось еще древними шаманами (одежда, бубен, заклинания, пляски, наркотические средства), однако само слово «мультимедиа» и комплексность информации именно как технология появились сравнительно недавно и тоже связаны с появлением и распространением компьютеров. Впрочем, цели применения мультимедиа недалеко ушли от шаманских: как можно полнее охватить все чувства человека передаваемой ему информацией.
Что же такое мультимедиа? Само слово мультимедиа образовано из латинских: «мульти» — много и «медиа» — среда, носитель, средства сообщения и его можно перевести как «многообразная среда». В мультимедиа-продукте объединяются двухмерные и трехмерные изображения, звуковое сопровождение, музыка, анимация, видео-, текстовая и числовая информация и т.д. Подчеркнем, что все эти виды информации должны образовывать единое целое. Хорошим примером является мультимедийный компакт-диск с альбомом записей какой-либо музыкальной группы. Такой диск содержит, конечно, в первую очередь записи песен, однако они могут сопровождаться видеозаписями с концертов, текстами песен, информацией об исполнителях и т.д. Кроме того, такой диск обязательно содержит управляющую оболочку, позволяющую осуществлять поиск нужной информации, переключение режимов ее представления (видео, текстовый, цветомузыка, стоп-кадр и т.д.) и настройку всей системы. Другим примером являются мультимедийные интернет-сайты, получившие распространение с появлением скоростных каналов доступа в Интернет.
Сферы применения мультимедиа достаточно многообразны, хотя и распространены не слишком широко. Связано это с тем, что как средства воспроизведения мультимедиа, так и технология изготовления мультимедиа-продуктов, являются весьма сложными и дорогостоящими. Специалист в области мультимедиа помимо общей компьютерной грамотности должен владеть основами видео- и аудиозаписи и монтажа, основами композиции, а также свободно обращаться с совершенно разнородными программными продуктами. Можно, конечно, создать команду из профессионалов в каждой узкой области, но это еще более увеличит стоимость продукта. Поэтому мультимедиа-технологии применяются либо в тех областях, где высокая стоимость продукта не является препятствием, либо там, где ожидается его массовое производство. К таким областям можно отнести:
информационную и рекламную деятельности;
шоу-бизнес;
создание персональных фоно- и видеотек;
компьютерные тренажеры;
компьютерные игры;
обучающие программы;
энциклопедии.
Все эти области требуют комплексной формы представления выдаваемой информации, а, следовательно, мультимедиа — их естественная технология.
Мультимедиа – комбинированное представление информации в разных формах (текст, звук, видео и т.д.). Под мультимедийной технологией будем понимать, технологии основными характерными особенностями которых являются:
объединение многокомпонентной информационной среды (текста, звука, графики, фото, видео) в однородном цифровом представлении;
обеспечение надежного (отсутствие искажений при копировании) и долговечного хранения (гарантийный срок хранения — десятки лет) больших объемов информации;
простота переработки информации (от рутинных до творческих операций).
Пределом развития мультимедиа является виртуальная реальность — создание с помощью компьютера и специальных устройств (шлемов, очков, перчаток и даже костюмов) виртуального (кажущегося) мира, в который «помещается» человек и живет в этом мире по его законам. Яркой иллюстрацией этой идеи является нашумевший в свое время фильм «Матрица». Надо, однако, заметить, что до реализма «Матрицы» современным системам виртуальной реальности еще очень и очень далеко. К тому же, как с функциональной, так и с экономической точки зрения, их применение оправдано крайне редко.
В настоящее время технологии мультимедиа является бурно развивающейся областью информационных технологий. В этом направлении активно работает значительное число крупных и мелких фирм, технических университетов и студий (в частности IBM, Apple, Motorola, Philips, Sony, Intel и др.). Области использования чрезвычайно многообразны: интерактивные обучающие и информационные системы, САПР, развлечения и др.[ Советов]Гохберг.
Технологию мультимедиа обеспечивают следующие средства: аппаратные и программные. Рассмотрим их (рис. 2.56).
Аппаратные средства включают в свой состав: звуковые карты, видеокарта, TV –тюнеры, графические акселераторы (ускорители), в том числе для поддержки трехмерной графики, акустические системы.
К программным средствам относятся: мультимедийные приложения (энциклопедии, интерактивные курсы обучения, игры и развлечения, работа в Интернет, тренажеры, торговая реклама, электронные презентации, информационные киоски и др.) и средства создания мультимедийных приложений (редакторы видеоизображений, профессиональные графические редакторы, средства записи, создания иредактирования звуковой информации, программы для манипуляции с сегментами изображения, изменяя цвета и палитру, программы для реализации гипертекстов и др.)
Развитием гипертекстовых технологий в глбальных сетях стали появляться гипертекстовые документы, которые наряду с текстовой информацией содержат инфорацию в мультимедийной форме. Эта информация представляется не только в статической, но и динамической форме.
Человек воспринимает до 95% поступающей к нему информации визуально, т.е. «графически». Такое представление информации по своей природе более наглядно и легче воспринимается, чем текстовое. Поэтому принято различать векторную и растовую графику, а за единицу оценки принят пиксел.
Пиксель – это минимальный участок изображения, независимый от цвета, яркости и др. параметров. Векторная графика – метод создания изображения ввиде совокупности линий. Растовая графика – метод создания изображения в виде раста – набора разноцветных точек (пикселей), упрядоченных в строки и столбцы. В памяти компьютера такие изображения храняться ввиде битовых последовательностей, которые описывают цвет отдельных пикселей. При этом на каждый пиксель приходиться конкретное число бит, определяющих ту или иную характеристику цвета [ Хохлова ].

Рис. 2.56. Схема типов данных мультимедиа информации
Однако в силу относительно невысокой пропускной способности существующих каналов связи, прохождения графических файлов по ним требует значительного времени. Это заставляет примениять технологию сжатия данных, представляющий собой методы хранения одного и того же объема информации путем использования меньшего количества бит. Графика преимущественно представлена двумя форматами файлов – GIF, JPEG. Формат GIF рассчитан на табличное кодирование изображения с применением 256 – цветной палитры, при которой однм байтом записываются одно значене некоторого произвольного цвета. Этот формат используется для представления малоцветовых изображений (одинаковый цвет). Формат JPEG международный стандарт. Он предназначен для записи полноценного изображения.
Достигнутый технологический уровень основан на использовании нового стандарта оптического носителя DVD (Digital Versalite/Video Disk), имеющего емкость порядка единиц и десятков гигабайт и заменяющего все предыдущие CD-ROM, Video-CD, CD-audio. Использование DVD позволило реализовать концепцию однородности цифровой информации. Одно устройство заменяет аудиоплейер, видеомагнитофон, CD-ROM, дисковод, слайдер и др. В плане представления информации оптический носитель DVD приближает ее к уровню виртуальной реальности.
Многокомпонентную мультимедиа-среду целесообразно разделить на три группы: аудиоряд, видеоряд, текстовая информация.
Аудиоряд может включать речь, музыку, эффекты (звуки типа шума, грома, скрипа и т.д., объединяемые обозначением WAVE (волна). Главной проблемой при использовании этой группы мультисреды является информационная емкость. Для записи одной минуты WAVE-звука высшего качества необходима память порядка 10 Мбайт, поэтому стандартный объем CD (до 640 Мбайт) позволяет записать не более часа WAVE. Для решения этой проблемы используются методы компрессии звуковой информации.
Другим направлением является использование в мультисреде звуков (одноголосая и многоголосая музыка, вплоть до оркестра, звуковые эффекты) MIDI (Musical Instrument Digitale Interface). В данном случае звуки музыкальных инструментов, звуковые эффекты синтезируются программно-управляемыми электронными синтезаторами. Коррекция и цифровая запись MIDI-звуков осуществляется с помощью музыкальных редакторов (программ-секвенсоров). Главным преимуществом MIDI является малый объем требуемой памяти — 1 минута MIDI-звука занимает в среднем 10 кбайт.
Видеоряд по сравнению с аудиорядом характеризуется большим числом элементов. Выделяют статический и динамический видеоряды.
Статический видеоряд включает графику (рисунки, интерьеры, поверхности, символы в графическом режиме) и фото (фотографии и сканированные изображения).
Динамический видеоряд представляет собой последовательность статических элементов (кадров). Можно выделить три типовых группы:
обычное видео (life video) — последовательность фотографий (около 24 кадров в секунду);
квазивидео — разреженная последовательность фотографий (6—12 кадров в секунду);
анимация — последовательность рисованных изображений.
Первая проблема при реализации видеорядов — разрешающая способность экрана и число цветов. Выделяют три направления:
стандарт VGA дает разрешение 640 х 480 пикселей (точек) на экране при 16 цветах или 320 х 200 пикселей при 256 цветах;
стандарт SVGA (видеопамять 512 кбайт, 8 бит/пиксель) дает разрешение 640 х 480 пикселей при 256 цветах;
24-битные видеоадаптеры (видеопамять 2 Мбайт, 24 бит/пиксель) позволяют использовать 16 млн цветов.
Вторая проблема — объем памяти. Для статических изображений один полный экран требует следующие объемы памяти:
в режиме 640 х 480, 16 цветов — 150 кбайт;
в режиме 320 х 200, 256 цветов — 62,5 кбайт;
в режиме 640 х 480, 256 цветов — 300 кбайт.
Такие значительные объемы при реализации аудио- и видеорядов определяют высокие требования к носителю информации, видеопамяти и скорости передачи информации.
При размещении текстовой информации на CD-ROM нет никаких сложностей и ограничений ввиду большого информационного объема оптического диска.
Основные направления использования мультимедиа-технологий:
электронные издания для целей образования, развлечения и др.;
в телекоммуникациях со спектром возможных применений от просмотра заказной телепередачи и выбора нужной книги до участия в мультимедиа-конференциях. Такие разработки получили название Information Highway;
мультимедийные информационные системы («мультимедиа-киоски»), выдающие по запросу пользователя наглядную информацию.
Таким образом, технология мультимедиа – интерактивная технология, обеспечивающая работу с различным изображением как статичным, так и динамичным, анимацией , текстом и звукорядом.
2.7. Информационная технология электронного документоведения
Электронное документоведения
Основной объект делопроизводства — документ. Этот объект содержит в себе другие объекты: тексты, рисунки, таблицы и т. п. Документ многофункционален, но его основная функция — зафиксировать информацию так, чтобы в дальнейшем ее можно было обрабатывать, хранить, передавать и использовать.
Оформление служебных документов строго регламентировано стандартами. Стандарт — образец, который удовлетворяет по своим признакам, свойствам, качествам определенным правилам. Для того чтобы правильно оформить документ, необходимо ознакомиться со стандартами, описанными в специальных ГОСТах и приказах.
ГОСТ 16487—83. Делопроизводство и архивное дело. Термины и определения.
ГОСТ 6.38—90. Унифицированные системы документации. Система организационно-распорядительной документации. Требования к оформлению документов.
ГОСТ Р 51141-98. Дело производство и архивное дело. Термины и определения.
ГОСТ Р 6.30—2003. Устанавливает правила оформление документов.
Приказ по МЧС № 123 от «…» О правила оформления документов.
Бланк — это «стандартный лист бумаги с воспроизведенной на нем постоянной информацией документа и местом, отведенным для переменной». Информация, отраженная на бланке, четко подразделяется на составляющие, которые называются реквизитами. Реквизит — это элемент официального документа. Реквизиты бывают: обязательные и дополнительные Обязательными реквизитами документа являются название организации, составившей документ, название документа (исключение составляют письма), заголовок текста, дата, индекс, текст, визы, подпись, отметка об исполнении документа и направлении его в дело. Остальные реквизиты являются дополнительными
Документы могут быть классифицированы:
по типу носителей – бумажные, электронные и магнитные
по содержанию — первичные и сводные
Задачи делопроизводства следующие :
создание документов и их оформление;
хранение документов;
обеспечение санкционированного доступа к документам;
поиск нужных документов.
В современных условиях делопроизводство и документооборот в России и в МЧС осуществляется на бумажной основе в своем большенстве. Однако уже существуют организации выполняющие электронный документооборот. В целом по стране электронный докуметооборот занимает ~ 30%, а остальное на базе бумажных технологий. В США наооборот 30% посвещены бумажным технологиям, а остальное – электронным. Рассмотрим автоматизацию обработки документов, как одну из основных технологий.
Для работы с документами, представленными в электронной форме, необходимо иметь локакльную ТКС и аппаратно-программные средства преобразования бумажных документов в электронную форму. Можно выделить следующие основные этапы такого преобразования [Федотова ]:
сканирование с помощью устройств оцифровки изображения, в процессе которого производится создание электронного образа документа;
процесс распознавания, позволяющий преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала);
применение дополнительных средств автоматизированного перевода на другой язык для документов, исполненных на иностранном языке;
создание рефератов и аннотаций для научно-исследовательской работы по направлению научной деятельности.
Сканеры формируют электронное изображение бумажного документа стандартного формата заданного качества изображения, которое гарантировало бы его надежное распознавание. Этап распознавания документа состоит в преобразовании электронного изображения в текстовый документ, при котором происходит «сравнение» элемента изображения с эталонными вариантами начертания символов, после чего выбирается наиболее подходящий символ. В ходе распознавания в изображении сначала выделяются крупные элементы текста: колонки, абзацы, отдельные текстовые блоки, ячейки таблиц — этот этап называется сегментацией, он может выполняться автоматически или вручную. Затем выполняется автоматический этап распознавания: блоки разбиваются на строки, строки — на отдельные символы, каждый из которых распознается независимо и помещается в итоговый документ.
Технология автоматического распознавания образов заключается в следующем. Методы автоматического распознавания образов и их реализация в системах оптического распознавания текстов (Optical Character Recognition — OCR-системы) — одна из самых прогрессивных технологий искусственного интеллекта. В развитии этой технологии российские ученые занимают ведущие позиции в мире. OCR-система понимается как система автоматического распознавания образов с помощью специальных программ изображений символов печатного или рукописного текста (например, введенного в компьютер посредством сканера) и преобразование его в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т. д. Перечислим особенности предметной области, существенные с точки зрения OCR-систем:
шрифтовое и размерное разнообразие символов;
искажения в изображениях символов (разрывы образов символов);
перекосы при сканировании;
посторонние включения в изображениях;
сочетание фрагментов текста на разных языках;
большое разнообразие классов символов, которые могут быть распознаны только при наличии дополнительной контекстной информации.
Аббревиатура OCR иногда расшифровывается как Optical Character Reader — устройство оптического распознавания символов или автоматического чтения текста. В настоящее время такие устройства в промышленном использовании обрабатывают до 100 тыс. документов в сутки. Промышленное использование предполагает ввод документов хорошего и среднего качества — это обработка бланков переписи населения, налоговых деклараций и т. д.
Используя возможности современных программ верстки, дизайнеры часто создают объекты сложной формы, такие как обтекание непрямоугольной картинки многоколоночным текстом. В системе Fine Reader 8.0 реализована поддержка распознавания таких объектов и их сохранение в файлах формата MS Word. Теперь документы сложной верстки будут точно воспроизведены в данном текстовом редакторе. Даже таблицы распознаются с максимальной точностью, сохраняя при этом все возможности для редактирования.
Ведущие производители программного обеспечения лицензировали российскую информационную технологию для применения со своими продуктами. В популярные программные пакеты Corel Draw (Corel Corporation), Fax Line/OCR & Business Card Wizard (Inzer Corporation) и многие другие встроена OCR-библиотека Cunei Form. Эта программа стала первой в России OCR-системой, получившей MS Windows Compatible Logo.
К средствам автоматизации перевода можно отнести два вида программ: электронные словари и программы перевода. Электронные словари представляют собой средства для перевода слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова без поиска его в отдельном большом словаре. Программы перевода получают на входе текст, выполненный на одном языке, и выдают текст на другом языке, т. е. автоматизируют процесс перевода.
Машинный перевод текстов с одних естественных языков на другие — одна из наиболее ранних задач не вычислительных приложений ЭВМ и систем искусственного интеллекта. Отмечаются два аспекта, определяющих актуальность задач машинного перевода:
все возрастающая потребность в переводах в науке, литературе, дипломатии, экономике и других областях деятельности;
для машинного перевода гораздо яснее критерии оценивания результатов, чем в задачах понимания текстов, организации диалогов и др.
Системы машинного перевода отличают по трем аспектам:
рабочим языкам (различают двуязычные и многоязычные системы машинного перевода);
типам текстов (для перевода письменного текста и устного диалога);
ограничениям по предметной области (обусловлены поддержкой в них лексики, соответствующей той или иной области знаний: медицины, информатики, математики и пр.).
Автоматическое реферирование и аннотирование заключаетя в следующем. Рефератом называют доклад на определенную тему, включающий обзор литературных и других источников; изложение содержания научной работы, книги и т. д. Под аннотацией понимается краткая характеристика произведения печати или рукописи. Аннотацию от реферата отличают: существенно меньший объем, обязательная констатация назначения аннотируемого произведения (для каких категорий читателей предназначено). Автоматическое реферирование и аннотирование — одно из направлений информационой обработки естественно-языковых текстов, и в этом качестве оно относится к фундаментальным технологиям искусственного интеллекта.
Основные направления в этой области:
аннотированные каталоги перерастают в гипертекстовые;
оглавления (карта сайта) и функции поиска по сайту;
использование онтологических словарей — тезаурусов общего и специального назначения, а также методов искусственного интеллекта.
Потребности в средствах автоматического реферирования и аннотирования испытывают информационные системы документооборота; поисковые машины и каталоги ресурсов Интернета; автоматизированные информационные библиотечные системы; каналы вещания; службы рассылки новостей и др.
В целом, автоматическая классификация электронных документов выражается, как эффективность поиска в большом информационном массиве существенно повысится, если его разбить на части по некоторому критерию, связанному с целями поиска. Классификация документов позволяет сузить область поиска, увеличить скорость нахождения документов, значительно повысить точность результатов поиска. Технологии автоматической классификации документов отводится важное место в системах управления документооборота.
Перечислим системы, испытывающие потребность в средствах автоматической классификации электронных документов:
информационные системы документооборота;
каталоги Интернета;
каналы вещания;
службы электронной почты;
электронные библиотеки;
информационные агентства;
интернет - порталы и др.
Суть задачи классификации состоит в автоматическом распределении поступающих в систему документов в зависимости от их типа и содержания по рубрикам (классам). Предусматривается распределение документов как элементов некоего формального множества по классам аксиоматически определенных критериев (для библиотечных ИС, книг, электронных изданий и другие информационных ресурсов распределяются по достаточно устойчивой системе рубрик).
Документы, классифицируются на основе их эмпирического анализа для достижения заранее заданной цели (в ИС большинство документов первоначально классифицируется приблизительно). Коммерческие интеллектуальные программные продукты для обработки текстов входят в пору зрелости, становятся привычным инструментом для широкого круга пользователей. Их применение приносит значительный экономический эффект. Опыт практического использования таких продуктов показывает, что они должны базироваться как на традиционных, так и на новых интеллектуальных технологиях анализа текстовой информации.
Для обеспечения указанных этапов делопроизводства рассмотрим основные функции современной офисной системы. Современная офисная система выполняет следующие фунции:
интеграция технологий делопроизводства в единый процесс;
переход на безбумажную технологию;
автоматизация рутинных операции по обработке информации;
архивация информации;
создание и поддержка приложений;
обеспечение сохранности, целостности и достоверности информации;
установление уровней доступа и защита от несанкционированного доступа к информации;
обеспечение эффективного поиска информации по различным критериям;
создание гибкой системы разделения и распределения информации;
организация коллективной работы пользователей в локальных и глобальных информационных сетях;
быстрая и надежная связь и передача информации по каналам связи удаленным пользователям;
обеспечение дружественного единого интерфейса пользователя со всеми компонентами системы [Федотова].

Рис.2.57. Схема ведения электронного документоведения
Основные функциональные подсистемы современной системы автоматизации делопроизводства и документооборота (САДД) должны решать все основные функции работы с документами. Потребность в повышении качества управления, в ускорении делопроизводства и документооборота, в подготовке принятия управленческих решений является ключевой для развития современных информационных систем. Конечной целью информатизации предприятия является создание единого информационного пространства путем объединения совместимых между собой функционально специализированных программных продуктов.
Рассмотрим основные функциональные подсистемы современной системы автоматизации делопроизводства и документооборота:
1.Ввод документов обеспечивается достаточными по мощности текстовыми процессорами. В некоторых офисных системахнаряду с вводом информации вручную предусмотрен ввод посредством оптического сканирования печатных или рукописныхтекстов с использованием программных средств распознаваниясимволов. Развиваются технологии акустического ввода и распознавания текстов

Рис.2.58. Электронные реквизиты документов

Рис.2.59.Схема электронной обработки входящей документации
Регистрация и учет документов могут быть реализованысредствами СУБД. Для этого необходимо определить перечень иформат представления информации, характеризующий документ(вид документа, дата поступления, входящий — исходящий ноера, наименование, имя отправителя — получателя, краткоесодержание и т. п.). Для дальнейшего поиска требуется определить поисковые критерии и ключевые слова для контекстногопоиска.
3.. Распределение документов по исполнителям и разграничение доступа осуществляются либо с помощью систем элекронной почты, либо средствами информационной системы, в том числе сетевой или СУБД с коллективным доступом. Администратор системы ведет списки исполнителей, объединенных в рабочие группы, с указанием их адресов в локальной сети номеров телефонов для модемной связи, номеров почтовых ящиков на почтовом сервере. Администратор назначает уровни доступа к информации каждому исполнителю или рабочей группе. Документы ограниченного доступа могут подвергаться шиф ровке. В некоторых офисных системах применяется программа «публикации в сети», позволяющая санкционированным пользо вателям просматривать и аннотировать документ.
Класификация программных продуктов документоведения
|
Класс ППО |
Программные продукты |
|
Текстовые редакторы |
Microsoft Word 6.0/7.0/97,2007, Лексикон 2.0 for Windows, WordPerfect for Windows 6.0 |
|
Табличные редакторы (электронные таблицы) |
Excel for Windows 5.0/7.0/97,2007 Quattro Pro 6.0 for Windows, Lotus 1-2-3 for Windows |
|
СУБД (системы управления базами данных) |
Access 2.0/7.0/97, 2007 for Windows, dBase for Windows 5.0 |
|
Коммуникационные программы |
DML Demos Mail, MiniHost, Microsoft Outlook |
|
Программы оптического распознавания текста для перевода информации с бумажного носителя на магнитный с помощью сканера |
OCR CuneiForm 2.0/2.95/4.0, CuneiForm 96, Gold FineReader 8.0 PRO |
|
Электронные словари и переводчики |
STILUS Lingvo |
|
Интегрированные пакеты |
Microsoft Office 2007 for Windows, Works for Windows |
4. Контроль за исполнением и поиск документов осуществляются на основе информации, внесенной в процессе регистрации и учета документов в БД. Возможно применение генераторов запросов, позволяющего проектировать структуру запроса. '
5. Архивирование информации, ведение фондов, а также поиск документов осуществляются либо средствами локальныхСУБД, либо с использованием мощных распределенных баз данных (на архивных магнитных или оптических дисках).
6. Формирование и выдача статистических данных осуществляются на основе информации с использованием текстовых процессоров, электронных таблиц, графических пакетов и настольных издательских систем.
7. Подготовка и оформление документов реализуются с использованием текстовых процессоров, электронных таблиц, графических пакетов и настольных издательских систем.
8. Обмен документами осуществляется модулями с внешними (удаленными) пользователями электронной почты. Почтовыесистемы, кроме рассылки документов в своей среде, предоставляют возможность пересылать информацию пользователям других систем электронной почты.
Любая организация имеет определенную структуру, внутренний связи, обеспечивающие взаимодействие между руково^твом щ структурными подразделениями, и внешние связи с деловыми партнерами, предприятиями, органами власти. Внешние и внутренние связи можно рассматривать как информационные.

Рис.2.60. Схема электронной обработки документации

Рис.2.61.Схема электронной обработки исходящей документации
Управление предприятием можно представить как процесс получения информации, ее обработки, принятия решения и доведения его до исполнителя. Для выработки правильного решения требуется полная, оперативная и достоверная информация.
Полноту информации характеризует ее объем, который должен быть достаточен для принятия решения. Информация должна быть оперативной, т. е. такой, чтобы во время ее передачи и обработки состояние дел не изменилось. Достоверность информации определяется степенью соответствия ее содержания объективному состоянию дел.
Часть информации, используемой в управлении предприятием, фиксируется в документах. Документ является носителем информации; это текст или изображение, имеющее информационное значение.
Применение государственных стандартов вводит единый порядок документов. Документы, функционирующие в сфере управления, называют организационно-распорядительными документами (ОРД). К ним относятся:
организационные (уставы, учредительные договоры);
распорядительные (приказы, распоряжения, решения);
справочно-информационные (письма, факсы, докладные записки, справки, телефонограммы).
Составной частью управления является делопроизводство. Работники сферы управления (руководители и специалисты) до 75 % рабочего времени тратят на работу с документами.
В основу современного делопроизводства положены следующие принципы:
оперативность (быстрая и четкая работа с документами);
современное техническое оснащение (компьютеры, факсы,ксероксы, сканеры);
целесообразность всех операций с документами (любая работа с документом должна быть необходима для деятельности предприятия, оправдана конкретной конечной целью);
умелое сочетание документационного обеспечения управления с бездокументационным (составление документов только в том случае, когда это действительно необходимо или установлено государственными нормативными актами).
В делопроизводстве существуют единые требования и правила оформления документов управления, установленные государственными нормативными актами. Выполнение единых правил оформления документов дает следующее:
юридическую силу документов;
оперативное, качественное составление и исполнение;
организацию быстрого поиска документов;
активное использование компьютера при составлении документов.
Любой документ состоит из ряда элементов (дата, текст, подпись), которые называются реквизитами.
Максимальный набор реквизитов для документов управления — 31. В конкретном документе их гораздо меньше. Каждый вид документа (акт, приказ, письмо и т. д.) имеет определенный набор реквизитов.
Организационные документы предприятия (устав, учредительный договор, структура и штатная численность, штатное расписание, должностные инструкции, правила внутреннего трудового распорядка).
Распорядительные (приказы по основной деятельности, распоряжения, решения).
Документы по личному составу (приказы по личному составу, трудовые контракты, личные карточки, лицевые счета по заработной плате, трудовые книжки).
Финансово-бухгалтерские документы предприятия (главная книга, годовые отчеты, бухгалтерские балансы, сметы, кассовые книги).
Информационно-справочные документы (акты, письма, факсы, справки, телефонограммы).
Нормативные документы вышестоящих организаций — от государственных и муниципальных органов (налоги, охрана окружающей среды).
Коммерческие контракты.
Все перечисленные документы относятся к ОРД. Исключение составляют финансово-бухгалтерские документы, имеющие специфические особенности составления и обработки.
Первоначально для автоматизированной поддержки делопроизводства использовались текстовые редакторы, электронные таблицы, СУБД, различные языки запросов пользователя, средства графической обработки информации, средства для организации работы пользователей. С появлением интегрированных пакетов офисных систем все эти средства были объединены под стандартным интерфейсом.
Рациональным решением для организации электронной обработки и хранения больших массивов документов различных типов на разных носителях является применение интегрированных систем. Они обеспечивают следующее:
соответствие типов документов в предлагаемой технологииих обработки требованиям и стандартам, устанавливаемым в организации;
масштабируемость и модифицируемость системы при изменении требований пользователя в перспективе;
базирование системы на наиболее прогрессивных и проверенных временем решениях в области ПО.
К самым распространенным программным средствам реализации офисных автоматизированных информационных систем относятся:
Lotus Notes (фирма-производитель Lotus Development);
AV Object Office (фирма-производитель Data General);
Prefect Office (фирма-производитель Novell Application Group);
Borland Office (фирма-производитель Borland Word Perfect);
Microsoft Office (фирма-производитель Microsoft);
OCIS (фирма-производитель Office Communication — Information Systems Nixdorf (SNI)).
Электронные таблицы:
Lotus 1-2-3;
Excel;
Quattro Pro 5.0, 6.0 for Windows.
Текстовые редакторы:
MS Word Perfect for Windows;
MS Word for Windows;
Comfo text.
СУБД:
Lotus Approach;
ORACLE, INFORMIX, SYBASE;
Paradox 5.0 for Windows;
Access;
Server SQL;
ComfoBase на основе стандарта SQL.
Электронная почта:
Lotus cc-Mail /Notes Mail;
AV on GO Office;
Grup Wise;
Object Echange;
MS Mail for Windows;
Mail X.UnixMail.
Графические системы:
Lotus Free-lance;
AV Image;
AppWare;
Power Point for Windows;
MS Paint-brush, MS Power Point.
Системы документооборота:
Work Flow;
Agent — система рассылки;
публикация документов в сети Envoy;
Work Group Enable Kit;
OnTime.
Системы-планировщики:
Lotus Organiser;
InfoCentral for Windows;
Doculive'.
С появлением интегрированных пакетов офисных систем все эти средства были объединены стандартным интерфейсом и стали также использоваться для поддержки делопроизводства. Их преимущества в следующем: общность интерфейса входящих в комплект приложений, высокая степень интеграции программ, низкая цена, менее жесткие за счет использования общих модулей требования к ресурсам. Стандартный базовый набор приложений: текстовый процессор, электронная таблица, СУБД часто расширяется программами презентации, системами электронной почты и т. д.
Российская технология процессов делопроизводства имеет следующие особенности:
четко выраженный вертикальный характер движения документов (руководитель — исполнитель — уководитель) внутри организации;
отслеживание всего комплекса работы с документами в регистрационных журналах или в машинописных картотеках, куда заносятся все сведения о документах, их перемещениях, резолюции начальства, контроль за сроками исполнения, отчеты и т. д.;
ведение регистрационно-контрольных и отчетных форм и журналов. Для обеспечения единого порядка обработки документов предусматривается создание специализированных служб: управлений делами, секретариатов, канцелярий.
Технологии делопроизводства закреплены в государственных стандартах, инструкциях и наставлениях по делопроизводству.
Основная проблема традиционной технологии — централизованное отслеживание движения документов в режиме реального времени, поскольку данная технология требует как получения оперативной информации, так и ведения большого количества различных журналов и картотек. При этом делопроизводство фактически отделено от самих документов: руководители и исполнители работают непосредственно с документами (или их копиями), а делопроизводственный персонал отслеживает их действия с помощью регистрационных и контрольных карточек. Другая особенность — относительно небольшое разнообразие процессов делопроизводства и документооборота, высокая степень их стандартизации.
Программные системы, реализующие российскую технологию, ориентированы в первую очередь на использование в государственных учреждениях и сохраняют все традиции и нормы делопроизводства, принятые в конкретной организации. Задача таких систем — обеспечение сопровождения безбумажного документооборота, снижение трудоемкости рутинных операций по обработке документов. К системам автоматизации данной технологии относятся:
Дело-96 (компания «Электронные офисные системы»);
система Золушка — WIN. Служебная корреспонденция. НТЦ ИРМ, г. Москва.
система Office Media компании InterTrust, Москва (LotusNotes);
система Ирида компании IBS, Москва (Lotus Notes);
комплекс программ Делопроизводство фирмы ИнТорКон,Челябинск (Lotus Notes);
система Золушка—Кабинет НТЦ ИРМ, Москва (LotusNotes);
решения компании АО «Весть», Москва (DocsOpen).
решения компании «Метатехнология», Москва (StafTware иExcalibur);
система Optima-WorkFlow компании АОЗТ «Оптима» (MSExchange, MS SQL).
система LandDocs компании «Ланит»;
система Effect Office компании «Гарант International»;
система Документ2000 компании Telecom Service;
система Крон компании «Анкей»;
система Евфрат компании Cognitive Technologies.
Электронно-цифровая подпись
В современном мире стремительно развивающиеся информационные технологии позволяют менять привычные представления о работе с документами. Возможности сети Интернет разрешают оперативно находить информацию на нужную тему и проводить с ней необходимые операции. В связи с этим возникают уникальные возможности работы с документацией, например, такие, как электронно-цифровая подпись.
В Федеральном законе РФ №1 от 10.01.2002г. «Об электронной цифровой подписи» подпись указывается как обязательное средство документированной информации. Это обусловливает возникновение специальных, не имеющих аналогов в мире технических и юридических проблем.
Применение рукописной подписи имеет исторический и традиционный характер. На финансовых документах необходимо наличие двух рукописных подписей (первой и второй), а также печати юридического лица. Характерной особенностью рукописной подписи является ее неразрывная связь с носителем информации, т. е. рукописная подпись возможна только на документах, имеющих материальную природу. Электронные документы имеют логическую природу. Электронно-цифровая подпись (ЭЦП) — это цифровое представление информации об отправителе электронного сообщения, созданное с применением закрытого ключа подписи и позволяющее при использовании открытого ключа подписи подтвердить неизменность и целостность данного сообщения.
К одним из основных понятий относится понятие «электронное сообщение» — информация, пересылаемая в цифровом виде посредством компьютерной техники, в том числе по телекоммуникационным сетям. Закрытый ключ (ЗК) — это информация (последовательность символов), известная только ее пользователю, позволяющая создавать электронно-цифровую подпись. Открытый ключ (ОК) — это информация (последовательность символов), предназначенная для проверки электронно-цифровой подписи и сообщаемая пользователем закрытого ключа получателю электронного сообщения, либо Центру удостоверения открытых ключей (Удостоверяющему центру) с целью обеспечения открытого доступа к ней. Удостоверяющий центр (УЦ) — это лицо, осуществляющее деятельность по хранению открытых ключей электронно-цифровой подписи и по удостоверению их соответствия атрибутам Свидетельств электронно-цифровой подписи пользователей закрытых ключей. Свидетельство электронно-цифровой подписи — это документ, содержащий сведения о пользователе закрытого ключа, выдаваемый пользователю Удостоверяющим центром.
В электронных документах подпись представлена в виде цифрового кода. Проверка электронно-цифровой подписи — это действия получателя электронного сообщения, позволяющие подтвердить неизменность и целостность электронного сообщения после его подписания электронно-цифровой подписью с применением средств электронно-цифровой подписи.
Экспертиза рукописных подписей является одной из самых сложных идентификационных задач. Исследование подлинности электронно-цифровой подписи еще более сложная задача, требующая высокопрофессионального подхода для ее решения1.
В Федеральном законе «Об электронно-цифровой подписи» устанавливается порядок использования электронно-цифровой подписи при совершении гражданско-правовых сделок и в других случаях, предусмотренных законодательством Российской Федерации.
Электронно-цифровая подпись представляет собой уникальную последовательность битов, жестко связанную с конкретным документом. Ее структура зависит от двух аргументов: текста документа и так называемого секретного ключа, известного только его владельцу. Любое несанкционированное изменение текста документа ведет к искажению цифровой подписи. Считается, что из-за сложной привязки к указанным аргументам электронную подпись теоретически невозможно подделать.
Наиболее распространенные принципы реализации электронно-цифровой подписи основаны на применении хэш-функций, в частности MD5, которая выполняет специальное преобразование битов в файле и генерирует в его конце псевдослучайное 128-битное число, соответствующее количеству бит в записи. MD5 может использоваться для файлов любой длины. Если два файла отличаются хотя бы на 1 бит, значение числа MD5 будет иным. И наоборот, если два файла имеют одно и то же характеризующее их число, вероятность того, что это разные файлы, бесконечно мала. После вычисления этого числа оно шифруется с использованием открытого ключа собственника записи в файле, что и представляет собой цифровую подпись. Перед тем как проверить подпись, пользователь дешифрует ее с применением своего открытого ключа. Если полученное значение числа совпадает с исходным, это означает, что запись в файле не изменялась, и цифровая подпись считается аутентичной. Получателю документа для его дешифрации передается значение открытого ключа. Достоинством использования MD5 в качестве цифровой подписи является высокая скорость вычислений для больших файлов, однако 100%-ной гарантии того, что код может быть вскрыт, дать невозможно.
Надежность электронно-цифровой подписи находится в прямой зависимости от длины кода в ключе. Существуют различные алгоритмы электронно-цифровой подписи. К ним следует отнести отечественные ГОСТ Р34.10-94 и ГОСТ 28147-89 (обязательные для применения в государственных организациях России), новый ГОСТ Р34.10—2001.
Электронно-цифровая подпись должна являться аналогом собственноручной подписи. Электронное сообщение с электронно-цифровой подписью должно признаваться документом при наличии всех остальных реквизитов, позволяющих его идентифицировать. Обмен электронными сообщениями с электронно-цифровыми подписями, выражающими содержание гражданско-правовой сделки, должен признаваться заключением договора в письменной форме. Отправитель электронного сообщения самостоятельно принимает решение о его подписании электронно-цифровой подписью. Использование электронно-цифровой подписи не является способом шифрования информации, а средства электронно-цифровой подписи — средствами шифрования информации. Любое лицо, отправляющее электронные сообщения, вправе создать свою электронно-цифровую подпись и подписывать ею свои сообщения.
Лицо, получившее электронное сообщение, подписанное электронной подписью, может обратиться в Удостоверяющий центр для проверки подписи. Удостоверяющим центром выдается Свидетельство электронно-цифровой подписи по получении от него открытого ключа и сведений, подлежащих включению в Свидетельство, которое имеет обязательные атрибуты:
наименование пользователя закрытого ключа (фамилия, имя, отчество гражданина);
регистрационный номер;
наименование и местонахождение Удостоверяющего центра;
дата выдачи Свидетельства электронно-цифровой подписи и дата окончания срока его действия;
наименование средств электронно-цифровой подписи;
открытый ключ;
сведения о порядке предоставления открытого доступа коткрытому ключу (в частности, указание адреса электронной почты сети Интернет). Порядок получения Свидетельства показан на рис. 2.62.
Использование электронно-цифровой подписи государственными органами и органами местного самоуправления должно производиться в порядке, установленном законом. Формирование и распределение закрытых ключей для федеральных и иных органов власти, органов местного самоуправления должно производиться организациями, уполномоченными на совершение указанных действий Правительством Российской Федерации.
При направлении органами государственной власти и органами местного самоуправления документов в электронной форме, указанные документы должны быть подписаны электронно-цифровой подписью должностного лица соответствующего органа государственной власти, уполномоченного на подписание официальных документов от имени такого органа.
Особенности применения электронно-цифровой подписи при выполнении процессуальных действий органами судебной власти и органами охраны правопорядка должны устанавливаться гражданско-процессуальным, арбитражно-процессуальным и уголовно-процессуальным законодательством Российской Федерации (рис.2.63).
Порядок работы с ЭЦП следующий при сохранения документа необходимо открывать опцию в меню Офис – 2007 «Подготовить» и после включения спецустройства ЭЦП на системном блоке, нажать «Добавить ЭЦП».
Документы в электронной форме, подписанные электронно-цифровой подписью, должны приниматься судами в качестве письменных доказательств. При наличии спора о достоверности электронно-цифровой подписи к соответствующему электронно-цифровому сообщению должна быть представлена надлежаще заверенная копия Свидетельства электронно-цифровой подписи. Лица, неправомерно использующие электронно-цифровую подпись другого лица, должны нести гражданскую, административную и уголовную ответственность в порядке, установленном законодательством Российской Федерации. Пользователи закрытых ключей электронно-цифровой подписи должны нести ответственность за необеспечение соответствующей охраны закрытого ключа, обязаны направить Удостоверяющему центру, выдавшему Свидетельство электронно-цифровой подписи, заявление с требованием прекращения действия данного Свидетельства.
При проверке подписи проверяющий должен располагать открытым ключом абонента, поставившего подпись, причем ключ должен быть аутентифицирован, т. е. данный открытый ключ должен соответствовать тому абоненту, который выдает себя за «хозяина». В случае, когда

Рис.2.62. Схема получания электронной подписи

Рис.2.63. Порядок работы электронной подписи
абоненты самостоятельно обмениваются ключами, эта уверенность может подкрепляться связью по телефону, личным контактом или любым другим способом. Если абоненты действуют в сети с выделенным Удостоверяющим центром, открытые ключи абонентов подписываются (сертифицируются) центром, и непосредственный контакт абонентов между собой (при передаче или подтверждении подлинности ключей) заменяется на контакт каждого из них в отдельности с Удостоверяющим центром.
Процедура проверки электронно-цифровой подписи состоит из двух этапов: вычисления хэш-функции документа и собственно математических вычислений, предусмотренных в данном алгоритме подписи. Математические вычисления заключаются в проверке того или иного сообщения, связывающего хэш-функцию документа, подпись под этим документом и открытый ключ подписавшего абонента. Если рассматриваемое соотношение оказывается выполненным, то подпись признается правильной, сам документ считается измененным, а подпись под ним — не-действительной.
Программные средства автоматизации переводов
Глобализация и интеграция мировых процессов сделали проблему взаимопонимание различных народов особенно актуальной. К тому же Интернет открыла доступ к мировым многоязычным информационным ресурсам, и все это в комплексе является мощным стимулом развития переводческих услуг. Традиционный перевод текстов, т. е. без применения средств автоматизации, многих перестает устраивать, поскольку требует больших затрат времени. Какие средства автоматизации перевода текстов появились благодаря возможностям компьютера?
Прежде всего это текстовый редактор, сокративший время на последующее редактирование перевода, а также многочисленные электронные словари, позволяющие быстро и без труда находить требуемое значение любого слова и вставлять его в переведенный текст. Применение только этих средств обеспечило рост производительности перевода на 20—30% по сравнению с ручной работой.
Следующим шагом автоматизации перевода стало применение систем Translation Memory (TM) и технологий машинного перевода (МП). Принцип работы систем ТМ построен на сравнении текста, подлежащего переводу, с внутренней базой, хранящей разбитый на предложения параллельный текст на исходном язьке и его перевод, полученный традиционным способом. При загрузке нового документа в ТМ-систему происходит его разделение на сегменты и сопоставление с текстами из базы. Часть этих фрагментов оказывается уже переведенной ранее, и система визуализирует их как уже известные, другие — как частично совпадающие с БД, а некоторые — как требующие перевода.
Таким
образом, переводчику не нужно тратить
усилия на то, что он уже делал прежде.
Подобные системы оказываются весьма
эффективными при переводе аналогичных
документов, например, повторяющейся
технической документации: ее можно
перевести один раз, а для последующих
выпусков достаточно переводить лишь
изменения в первоисточнике.
Наиболее известными системами ТМ в настоящее время являются Trados TWB и Transit. Они используются в большинстве переводческих бюро мира. В России они пока не получили широкого распространения в силу относительно высокой стоимости.
Технологии МП тоже нашли определенное место при автоматизации процесса переводов, но наибольшую эффективность обеспечивает комплексное решение, опирающееся на все имеющиеся в настоящий момент лингвистические технологии машинного перевода.
Работы по машинному переводу начались с середины 1950-х гг. Это интересно. В 2004 г. отмечался неофициальный юбилей — 50-летие машинного перевода. В далеком 1954 г. в Джорджтаунском университете (США) были проведены первые эксперименты, доказавшие саму возможность с помощью ЭВМ переводить тексты с одного языка на другой. 50 лет назад машины были «слабыми», поэтому пользоваться можно было только ограниченным набором лингвистических средств. Именно поэтому тогда использовались пословный перевод и словосочетания, но преимущественно в идиоматических выражениях. По мере развития вычислительной техники подходы к машинному переводу менялись.
Активные исследования в области машинного перевода велись и за рубежом силами таких известных компьютерных лингвистов, как А. Эттингер (США), И. Бар-Хиллер (США), Н. Хомски (Израиль). Наибольшую известность приобрели труды японского ученого М. Нагао, который предложил использовать при машинном переводе уже готовые, занесенные в память ЭВМ варианты прочтения исходных текстов, ранее сделанных опытными лингвистами. Эти труды и легли в основу методики Translation Memory («Память переводчика»), широко используемой до сих пор при переводе документации в крупнейших корпорациях мира.
У нас в стране пионерами теории машинного перевода были Д. Ю. Панов, А. А. Ляпунов и И. С. Мухин. В их трудах заложен фундамент, на основе которого в наши дни развиваются такие известные системымашинного перевода, как PROMT, «Сократ» и более менее новая Retrans Vista.
В России программа-переводчик четвертого поколения PROMT-98 (1998 г.) состоит из трех компонентов, объ единенных оболочкой: PROMT — среда переводчика; File Translator — приложение для пакетной обработки большого количества документов; Web View — браузер с синхронным переводом HTML-страниц.
В основе программ-переводчиков четвертого поколения лежит технология HTML-to-HTML, позволяющая переводить Web - страницы с полным сохранением форматирования и впоследствии двигаться по переведенным ссылкам. В 1998 г. появляется также новая версия переводчика для Интернета — WebTranSite-98 и версия 1.0 переводчика для карманных компьютеров — Pocket PROMT.
WebTranSite-98 отличается от предыдущей версии возможно, стью подключения дополнительных словарей, улучшающих ка-чество перевода, и новой системой поиска, которая служит для формирования запросов разной сложности на родном языке, их перевода и отправки на один из популярных поисковых серверов.
Pocket PROMT открывает новую линию программных продуктов компании, ориентированную на платформу Windows СЕ для карманных компьютеров. Текст для перевода можно набирать на клавиатуре либо открыть готовый небольшой файл размером до 32 Кбайт в текстовом формате или формате Pocket Word.
В 2000 г. компания PROMT выпустила «двухтысячные» версии своих трех главных переводческих пакетов: профессионального — PROMT Translation Office 2000, для Интернета—PROMT Internet-2000 и домашнего — Magic Gooddy-2000.
В состав пакета PROMT Translation Office 2000 входят восемь компонентов: SmarTool (Microsoft Office 97/2000 Support) Mail Translator, PROMT, Dictionary Editor, Electronic Dictionary (входит в комплект «Гигант» и ERRE), WebWiew, QTrans, Clipboard Translator и Integrator.
Многоязычные переводчики PROMT Translation Office 2000 и PROMT Internet поддерживают семь направлений перевода с участием русского языка, в том числе с итальянского на русский-Интерфейс PROMT Translation Office и PROMT Internet оформлены в стиле Office 2000.
