Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ Марюха / УчПосИТ СБ / УчПосIIа раз.doc
Скачиваний:
118
Добавлен:
09.05.2015
Размер:
3.07 Mб
Скачать
    1. Информационные технологии в управлении. Технологии базы знаний, экспертных систем и искусственного интеллекта.

Информационные технологии в управлении это технологии будующего. Они в перспективе и сейчас уже основываются на исскуственном интелекте.

Искусственный интеллект (ИИ) - это научное направление, представляющее собой условное обозначение кинематических систем, моделирующих некоторые стороны деятельности человека (логическое, аналитическое мышление). ИИ бывает:

Бионический - попытка смоделировать с помощью ИИ человеческий разум.

Прагматический - создание аппаратно-программных средств, позволяющих получить результаты мыслительной деятельности, а не моделировать ее саму.

Если обычная программа действий представлена в виде парадигмы выглядит так:

Программа = Алгоритм + Данные + СУБД ,

то программа системы ИИ выглядит так

СИИ = Знания + Стратегия обработки знаний

В условиях резкого увеличения объемов информации информационные технологии позволяют перейти к работе со знаниями на основе искусственного интеллекта, по всей вероятности это единственная альтернатива информацион­ного общества. Воспользуемся определением «интеллектуальной системы» проф. Д.А. Поспелова [38]: «Система называется интеллектуаль­ной, если в ней реализованы следующие основные функции:

накапливать знания об окружающем системе мира, класси­фицировать и оценивать их с точки зрения прагматической полез­ности и непротиворечивости, инициировать процессы получения новых знаний, осуществлять соотнесение новых знаний с ранее хранимыми;

пополнять поступившие знания с помощью логического вы­вода, отражающего закономерности в окружающую систему мира или в накопленных ею ранее знаниях, получать обобщенные зна­ния на основе более частных знаний и логически планировать свою деятельность;

общаться с человеком на языке, максимально приближенном к естественному человеческому языку, и получать информацию от каналов, аналогичных тем, которые использует человек при вос­приятии окружающего мира, уметь формировать для себя или по просьбе человека (пользователя) объяснение собственной деятель­ности, оказывать пользователю помощь за счет тех знаний, кото­рые хранятся в памяти, и тех логических средств рассуждений, ко­торые присущи системе».

Перечисленные функции можно назвать функциями представ­ления и обработки знаний, рассуждения и общения. Наряду с обязательными компонентами, в зависимости от решаемых задач и об­ласти применения в конкретной системе эти функции могут быть реализованы в различной степени, что определяет индивидуаль­ность архитектуры. На рис. 2.47 в наиболее общем виде представ­лена структура интеллектуальной системы в виде совокупности блоков и связей между ними.

База знаний представляет собой совокупность сред, хранящих знания различных типов. Рассмотрим кратко их назначение.

База фактов (данных) хранит конкретные данные, а база пра­вил — элементарные выражения, называемые в теории искусствен­ного интеллекта продукциями. База процедур содержит прикладные программы, с помощью которых выполняются все необходимые преобразования и вычисления. База закономерностей включает раз­личные сведения, относящиеся к особенностям той среды, в кото­рой действует система. База метазнаний (база знаний о себе) содер­жит описание самой системы и способов ее функционирования: сведения о том, как внутри системы представляются единицы ин­формации различного типа, как взаимодействуют различные ком­поненты системы, как было получено решение задачи.

База целей содержит целевые структуры, называемые сценария­ми, позволяющие организовать процессы движения от исходных фактов, правил, процедур к достижению той цели, которая посту­пила в систему от пользователя, либо была сформулирована самой системой в процессе ее деятельности в проблемной среде.

Управление всеми базами, входящими в базу знаний, и органи­зацию их взаимодействия осуществляет система управления базами знаний. С ее же помощью реализуются связи баз знаний с внешней средой. Таким образом, базы знаний осуществляет первую функцию интеллектуальной системы.

Выполнение второй функции обеспечивает часть интеллекту­альной системы, называемая анализатор и состоящая из ряда бло­ков, управляемых системой управления. Часть из блоков реализует логический вывод. Блок дедуктивного вывода осуществ­ляет в анализаторе дедуктивные рассуждения, с помощью которых из закономерностей из базы знаний, фактов из базы фактов и правил из базы правил выводятся новые факты. Кроме этого данный блок реализует эвристические процедуры поиска решений задач, как по­иск путей решения задачи по сценариям при заданной конечной цели. Для реализации рассуждений, которые не носят дедуктивно­го характера, т.е. для поиска по аналогии, по прецеденту и пр., ис­пользуются блоки индуктивного и правдоподобного выводов. Блок пла­нирования используется в задачах планирования решений совмест­но с блоком дедуктивного вывода. Назначение блока функциональных преобразований состоит в решении задач расчетно-логического и алгоритмического типов.

Рис. 2.47. Общая структура интеллектуальной системы

Третья функция — функция общения — реализуется как с по­мощью компоненты естественно-языкового интерфейса, так и с помощью рецепторов и эффекторов, которые осуществляют так называемое невербальное общение и используются в интеллекту­альных роботах.

В зависимости от набора компонентов, реализующих рассмот­ренные функции, можно выделить следующие основные разновид­ности интеллектуальных систем:

- интеллектуальные информационно-поисковые системы;

- экспертные системы (ЭС);

- расчетно-логические системы;

- гибридные экспертные системы.

Интеллектуальные информационно-поисковые системы являются системами взаимодействия с проблемно-ориентированными (фак­тографическими) базами данных на естественном, точнее ограни­ченном как грамматически, так и лексически (профессиональной лексикой) естественном языке (языке деловой прозы). Для них ха­рактерно использование, помимо базы знаний, реализующей се­мантическую модель представления знаний о проблемной области, лингвистического процессора.

Экспертные системы являются одним из бурно развивающихся классов интеллектуальных систем. Данные системы в первую оче­редь стали развиваться в математически слабоформализованных областях науки и техники, таких как медицина, геология, биология и др. Для них характерна аккумуляция в системе знаний и правил рассуждений опытных специалистов в данной предметной области, а также наличие специальной системы объяснений.

Расчетно-логические системы позволяют решать управленческие и проектные задачи по их постановкам (описаниям) и исходным данным вне зависимости от сложности математических моделей этих задач. При этом конечному пользователю предоставляется возможность контролировать в режиме диалога все стадии вычис­лительного процесса. В общем случае, по описанию проблемы на языке предметной области обеспечивается автоматическое по­строение математической модели и автоматический синтез рабочих программ при формулировке функциональных задач из данной предметной области. Эти свойства реализуются благодаря наличию базы знаний в виде функциональной семантической сети и компо­нентов дедуктивного вывода и планирования.

В современных условиях появляются системы информационной поддержки и принятия решения (СИППР). Эти СИППР - человеко-вычислительная системы, сочетающие субъективные предпочтение пица принимающего решение (ЛПР) с электронно-вычислительными методами анализом ситуации. СИППР состоят из функций, облегчающих принятие решение командиром, администратором или ЛПР (рис.2.48).

СИППР включает:

ЛПР

Рис.2.48. Функции системы информационной поддержки принятия решения

СИППР решает следующие задачи:

1. Обеспечивает постоянный обмен информации о сложившейся обстановке.

2. Производит оценку обстановки (ситуаций), осуществляет выбор критериев и оценивает их относительную важность

3. Генерирует возможные варианты решения (сценарий действий).

4. Моделирует принимаемые решения (когда возможно).

5. Осуществляет динамический анализ возможных последствий и выбирает лучший из вариантов решения.

6. Производит сбор и оценку результатов реализации принятого решения.

На рис 2.49. представлена возможная архитектура СИППР.

Рис. 2.49. Архитектура современной СИППР

Указанная СИППР в составе АИУС РСЧС РФ могут применяться на ЦУКС и др. КП. В США КП оснащены подобными системами (рис.2.50).

Рис.2.50. СИППР на КП военного формирования США

Рис.2.51. Схема модели проблемной ситуации

Основные направления и методы исследования

Таблица 2

Направления исследования

Методы исследования

Экономико-математические методы

Оптимизационные задачи управления:

- задачи распределения;

- задачи массового обслуживания;

- задачи упорядочения;

- задачи замены оборудования .

Методы моделирование

Виды моделей:

-наглядные(визуализация); - физические;

- технологические;

-информационные (математические, искусственных нейронных сетей, логические, графические и др.).

Методы выработки решения в диалоговом режиме «человек-ЭВМ»

Многократное чередование эвристических (человек) и формализованных (ЭВМ) этапов - в этом суть диалога.

Экспертные методы

Методы: - экспертных оценок «Дельфи»;

- статистики ;

- программное прогнозирование; --- эвристическое программирование; - - коллективная генерация идей - «мозговой штурм».

Методы построения прогнозного графа

Сценарий, прогнозный граф, «Дерево целей».

Метод матричного прогнозирования

Метод сравнения разных направления НИР

Имитационные и ситуационные методы

Методы нечетких множеств.

Игровые и неигровые и др.

Любую проблемную ситуацию можно смоделировать (рис.2.51). Направления и методы моделирования представлены в таблице 2. Особенностью моделирования является возможность исследователя в рамках возможностей различных аппаратов и методов описать проблеммную ситуацию, с помощью ВТ проиграть все варианты по критерию «эффективность/стоимость» и правильно слелать вывод по результатам исследования. Порядок моделирования рассмотено ранее в параграфе 2.4. Основные направления и методы исследования приведены в таблице 2.

В ходе исследований обязательным образом должна учитываться неопределенность данных, обстановки и пр. Под неопределенностью будем понимать случайность появления события, данных и т. д. Неопределенность может быть снижена за счет специальных математических методов:

применение теории игр;

проведение статистической обработки данных;

применения критериев Вальда, Сэвиджа и Гурвица

При работе с неопределенностью информации ЛПР неосвобождается от принятия решения при высокой ее степени. В этом случае ЛПР идет на риск. Степень риска зависит от неопределенности информации. Следовательно необходимо:

1. Увеличивать уровень информативности.

2. Управление риском (прогноз наступления рискового события и снижение степени риска, оценка через энтропию – характеристику хаоса, (I + H = 1) больше количества информации меньше энтропии и наоборот)

3. Расчет степени риска через дисперсию или коэффициент вариаций

(d2 =S (xi - x)2./ n; V = d / x*100%),

где d2 -дисперсия события;

х – событие;

n – число событий.

V – коэффицент вариаций.

Результат дает возможность ориентироваться ЛПР (если V< 10%, то неустойчивость слабая, если 10%<V<25%, то неустойчивость умеренная, если V> 25%, то неустойчивость высокая).

Таким образом, применение научных методов в виде информационных технологий позволяет ЛПР основываться на полученных данных и тем самым найти рациональное решение.

СППР в своей основе применяются на командных пунктах, ЦУКСах и др. органов управления. Особенно заслуживает вниимания применения подобных систем в составе органа управлениия по типу ситуационный центр (СЦ). Под ситуационным центром (комнатой) будем понимать орган управления оснащенный локальной ТКС, пакетом специальных программ по типу СИППР с возможностью оптимизации решения по какому – либо критерию и необходимом составом экспертов и режисера (администратор сети). Такой СЦ представлен на рис. 2.52.

Особенностью работы такого СЦ заключается в выработке решении по заданной проблеме коллективом экспертов под руководством ЛПР и при обеспечении администратором локальной сети (режессером). На рис. 2.52 представлены АРМ экспертов за одним круглым столом и различной аппаратуры индивидуального и коллективного пользования на базе локальной ТКС.

Алгоритм работы определяет ЛПР. По его команде предлагается определиться одному из экспертов по заданной проблеме. При этом на его АРМ отражается следующий интерфейсе рис. 2.53.

Из меню интерфейса видно, что в настоящий момент исходные данные вводит эксперт Петров В.В. При этом в правой нижней части интерфейса он определил два критерия по решаемой проблеме это уровень безработицы и уровень преступности. Количественно указанные критерии эксперт определяет движком справа от критериев.

Рис.2.52. Структура ситуационного центра.

Данный интерфейс отражает поиск решения политической предвыборной задачи. Результаты сразу отражаются на интерфейсе эксперта. Справа вверху видна диаграмма выбора решений по методу Саати в процентах. Это оптимизационная задача показывает, что третий вариат (возможно Петрова В.В.) имеет самый большой процент успеха. При этом СИППР в настоящее время проводить вычисления на основе картографов (рис. 2.54).

В последнее время в специальный класс выделяются гибридные экспертные системы. Указанные системы должны вобрать в себя лучшие черты как экспертных, так и расчетно-логических и ин­формационно-поисковых систем. Разработки в области гибридных экспертных систем находятся на начальном этапе (рис. 2.55).

Наиболее значительные успехи в настоящее время достигнуты в таком классе интеллектуальных систем, как экспертные системы.

ЭС называют вычислительную систему использования знаний эксперта и процедур логического вывода для решения проблем, ко­торые требуют проведения экспертизы и позволяют дать объясне­ние полученным результатам.

ЭС обладает способностями к накоплению знаний, выдаче ре­комендаций и объяснению полученных результатов, возможностя­ми модификации правил, подсказки пропущенных экспертом

ус­ловий, управления целью или данными. ЭС отличают следующие характеристики: интеллектуальность, простота общения с компью­тером, возможность наращивания модулей, интеграция неоднород­ных данных, способность разрешения многокритериальных задач при учете предпочтений лиц, принимающих решения (ЛПР), рабо­та в реальном времени, документальность, конфиденциальность, унифицированная форма знаний, независимость механизма логи­ческого вывода, способность объяснения результатов.

В настоящее время можно выделить следующие основные сфе­ры применения ЭС: диагностика, планирование, имитационное моделирование, предпроектное обследование предприятий, офис­ная деятельность, а также некоторые другие.

Практика показывает, что по сравнению со статическими системами гораздо больший эффект дают ЭС, используемые в динамических процессах (экспертные системы реального времени — ЭСРВ), ко­торые занимают около 70% рынка таких систем и находят все более широкое применение в управлении непрерывными процессами (химические производства, цементная промышленность, атомная энергетика и т.д.).

Рис.2.53. Интерфейс эксперта Петрова В.В.

По сравнению с общей схемой в ЭС часто отсут­ствует возможность общения с системой на близком к естественно­му языке или с использованием визуальных средств, поскольку взаимодействие с такой системой осуществляется с использовани­ем языка типа ПРОЛОГ или с применением ПРОЛОГ- идей, а также язык программирования - ЛИСП.

Важное место в теории искусственного интеллекта (ИИ) зани­мает проблема представления знаний. В настоящее время выделя­ют следующие основные типы моделей представления знаний:

семантические сети, в том числе функциональные;

фреймы и сети фреймов;

продукционные модели.

Семантические сети определяют как граф общего вида, в кото­ром можно выделить множество вершин и ребер. Каждая вершина графа представляет некоторое понятие, а дуга — отношение между парой понятий. Метка и направление дуги конкретизируют семан­тику. Метки вершин семантической нагрузки не несут, а использу­ются как справочная информация

Различные разновидности семантических сетей обладают раз­личной семантической мощностью, следовательно, можно описать одну и ту же предметную область более компактно или громоздко. Основным элементом их является фрейм.

Фреймом называют структуру данных для представления и опи­сания стереотипных объектов, событий или ситуаций. Фреймовая модель представления знаний состоит из двух частей:

  • набора фреймов, составляющих библиотеку внутри представ­ляемых знаний;

  • механизмов их преобразования, связывания и т.д. Существует два типа фреймов:

образец (прототип) — интенсиональное описание некоторого множества экземпляров;

экземпляр (пример) — экстенсиональное представление фрейм-образца.

В общем виде фрейм может быть представлен следующим кор­тежем:

<ИФ, (ИС, ЗС, ПрисПроц), ..., (ИС, ЗС, ПрисПроц)>,

где ИФ — имя фрейма;

ИС — имя слота;

ЗС — значение слота;

ПрисПроц — имя присоединенной процедуры (необязательный пара­метр).

Слоты — это некоторые незаполненные подструктуры фрейма, заполнение которых приводит к тому, что данный фрейм ставится в соответствие некоторой ситуации, явлению или объекту.

Рис.2.54. Принцип работы картографа при суммированиии, усреднении или максимизации (минимизации) данных выраженных гаммой различных цветов

В качестве данных фрейм может содержать обращения к про­цедурам (так называемые присоединенные процедуры). Выделяют два вида процедур: процедуры-демоны и процедуры-слуги. Проце­дуры-демоны активизируются при каждой попытке добавления или удаления данных из слота. Процедуры-слуги активизируются толь­ко при выполнении условий, определенных пользователем при создании фрейма.

Продукционные модели — это набор правил вида «усло­вия — действие», где условиями являются утверждения о содержи­мом базы данных, а действия представляют собой процедуры, ко­торые могут изменять содержимое базы данных.

Формально продукция определяется следующим образом:

(i); Q; F,C; A В; N,

где (i) — имя продукции (правила);

Q — сфера применения прави­ла;

Р — предусловие (например, приоритетность);

С — предикат (отношение);

АВ — ядро;

N — постусловия (изменения, вноси­мые в систему правил).

Практически продукции строятся по схеме «ЕСЛИ» (причина или иначе посылка), «ТО» (следствие или иначе цель правила).

Рис. 2.55. Упрощенная структура гибридноэкспертной системы

Полученные в результате срабатывания продукций новые зна­ния могут использоваться в следующих целях:

• понимание и интерпретация фактов и правил с использова­нием продукций, фреймов, семантических цепей;

• решение задач с помощью моделирования;

• идентификация источника данных, причин несовпадений но­вых знаний со старыми, получение метазнаний;

• составление вопросов к системе;

• усвоение новых знаний, устранение противоречий, система­тизация избыточных данных.

Процесс рассмотрения компьютером набора правил (выполне­ние программы) называют консультацией. Ее наиболее удобная для пользователя форма — дружественный диалог с компьютером. Ин­терфейс может быть в форме меню, на языке команд и на естест­венном языке.

Диалог может быть построен на системе вопросов, задаваемых пользователем, компьютером, или фактов — данных, хранящихся в базе данных. Возможен смешанный вариант, когда в базе данных недостаточно фактов.

При прямом поиске пользователь может задавать две группы вопросов, на которые, компьютер дает объяснения:

1) КАК получено решение? При этом компьютер должен выдать на экран трассу в виде ссылок на использованные правила;

2) ПОЧЕМУ компьютер задал какой-то вопрос? При этом на экран выдается своеобразная трасса, которую компьютер хотел бы использовать для вывода после получения ответа на задаваемый вопрос. Вопрос ПОЧЕМУ может быть задан как в процессе кон­сультации, так и после выполнения программы.

Специфичен алгоритм поиска, реализуемый логическими язы­ками: он является фактически последовательным перебором по де­реву сверху-вниз-слева-направо.

Выделим следующие характеристики ЭС: назначение, проблем­ная область, глубина анализа проблемной области, тип используе­мых методов и знаний, класс системы, стадия существования, ин­струментальные средства.

Назначение определяется следующей совокупностью парамет­ров: цель создания экспертной системы — для обучения специали­стов, для решения задач, для автоматизации рутинных работ, для тиражирования знаний экспертов и т.п.; основной пользователь — не специалист в области экспертизы, специалист, учащийся.

Проблемная область может быть определена совокупностью па­раметров предметной области и задач, решаемых в ней. Каждый из параметров можно рассматривать как с точки зрения конечного пользователя, так и разработчика экспертной системы.

С точки зрения пользователя предметную область можно харак­теризовать ее описанием в терминах пользователя, включающим наименование области, перечень и взаимоотношения подобластей и т.п., а задачи, решаемые существующими экспертными система­ми, — их типом. Обычно выделяют следующие типы задач:

интерпретация символов или сигналов — составление смы­слового описания по входным данным;

диагностика — определение неисправностей (заболеваний) по симптомам;

предсказание — определение последствий наблюдаемых си­туаций;

конструирование — разработка объекта с заданными свойст­вами при соблюдении установленных ограничений;

планирование — определение последовательности действий, приводящих к желаемому состоянию объекта;

слежение — наблюдение за изменяющимся состоянием объ­екта и сравнение его показателей с установленными или желаемы­ми;

управление — воздействие на объект для достижения желае­мого поведения.

С точки зрения разработчика целесообразно выделять статиче­ские и динамические предметные области. Предметная область на­зывается статической, если описывающие ее исходные данные не изменяются во времени (точнее, рассматриваются как не изменяю­щиеся за время решения задачи). Статичность области означает не­изменность описывающих ее исходных данных. При этом произ­водные данные (выводимые из исходных) могут и появляться зано­во, и изменяться (не изменяя, однако, исходных данных). Если исходные данные, описывающие предметную область, изменяются за время решения задачи, то предметную область называют динами­ческой. Кроме того, предметные области можно характеризовать следующими аспектами: числом и сложностью сущностей, их атри­бутов и значений атрибутов; связностью сущностей и их атрибутов; полнотой знаний; точностью знаний (знания точны или правдопо­добны: правдоподобность знаний представляется некоторым чис­лом или высказыванием).

Решаемые задачи, с точки зрения разработчика экспертной сис­темы, также можно разделить на статические и динамические. Бу­дем говорить, что ЭС решает динамическую или статическую зада­чу, если процесс ее решения изменяет или не изменяет исходные данные о текущем состоянии предметной области.

В подавляющем большинстве существующие ЭС исходят из предположения о статичности предметной области и решают ста­тические задачи. Будем называть такие ЭС - статическими. ЭС, ко­торые имеют дело с динамическими предметными областями и ре­шают статические или динамические задачи, будем называть дина­мическими.

Решаемые задачи, кроме того, могут характеризоваться сле­дующими аспектами: числом и сложностью правил, используе­мых в задаче, их связностью, пространством поиска, числом ак­тивных агентов, изменяющих предметную область, классом ре­шаемых задач.

По степени сложности выделяют простые и сложные правила. К сложным относятся правила, текст записи которых на естественном языке занимает 1/3 страницы и больше. Правила, текст записи которых занимает менее 1/3 страницы, относят к простым. Можно сказать, что степень сложности задачи определяется не просто общим числом правил данной задачи, а числом правил в ее наиболее связной независимой подзадаче.

Пространство поиска может быть определено по крайней мере тремя факторами: размером, глубиной и шириной. Размер про­странства поиска дает обобщенную характеристику сложности за­дачи. Выделяют малые (до 3,6 • 106 состояний) и большие (свыше 3,6 • 106 состояний) пространства поиска. Глубина пространства поиска характеризуется средним числом последовательно приме­няемых правил, преобразующих исходные данные в конечный результат, ширина пространства — средним числом правил, при­годных к выполнению в текущем состоянии.

Класс задач определяет методы, используемые ЭС для их реше­ния. Данный аспект в ЭС принимает следующие значения: задачи расширения, доопределения, преобразования. Задачи доопределе­ния и расширения являются статическими, а задачи преобразова­ния — динамическими.

К задачам расширения относятся такие, в процессе решения которых осуществляется только увеличение информации о пред­метной области, не приводящее ни к изменению ранее выведенных данных, ни к другой области задач.

К задачам доопределения относятся задачи с неполной или не­точной информацией о реальной предметной области, цель реше­ния которых — выбор из множества альтернативных текущих со­стояний предметной области того, которое адекватно исходным данным. В случае неточных данных альтернативные текущие со­стояния возникают как результат ненадежности данных и правил, что приводит к многообразию различных доступных выводов из одних и тех же исходных данных. В случае неполных данных аль­тернативные состояния являются результатом доопределения.

Большинство существующих ЭС решают задачи расширения, в которых нет ни изменений предметной области, ни активных аген­тов, преобразующих ее. Подобное ограничение неприемлемо при работе в динамических областях.

По степени сложности структуры ЭС делят на поверхностные и глубинные. Поверхностные ЭС представляют знания об области экспертизы в виде правил (условие—действие). Условие каждого правила определяет образец некоторой ситуации, при соблюдении которой правило может быть выполнено. Поиск решения состоит в выполнении тех правил, образцы которых сопоставляются с теку­щими данными (текущей ситуацией в РП). При этом предполагает­ся, что в процессе поиска решения последовательность формируе­мых таким образом ситуаций не оборвется до получения решения, т.е. не возникнет неизвестной ситуации, которая не сопоставится ни с одним правилом. Глубинные ЭС, кроме возможностей по­верхностных систем, обладают способностью при возникновении неизвестной ситуации определять с помощью некоторых общих принципов, справедливых для области экспертизы, какие действия следует выполнить.

По типу используемых методов и знаний ЭС делят на традици­онные и гибридные. Традиционные ЭС используют в основном неформализованные методы инженерии знаний и неформализован­ные знания, полученные от экспертов. Гибридные ЭС используют методы инженерии знаний, формализованные методы, а также данные традиционного программирования и математики (рис.2.53).

Совокупность рассматриваемых выше характеристик позволяет определить особенности конкретной ЭС. Однако пользователи за­частую стремятся охарактеризовать ЭС каким-либо одним обоб­щенным параметром. В этой связи говорят о поколениях ЭС. В на­стоящее время выделяют ЭС первого и второго поколений. Одна­ко, по-видимому, следует говорить о трех поколениях ЭС. К перво­му поколению следует отнести статические поверхностные ЭС, ко второму — статические глубинные ЭС (иногда ко второму поколе­нию относят гибридные ЭС), а к третьему — динамические ЭС (ве­роятно, они, как правило, будут глубинными и гибридными).

В последнее время выделяют два больших класса ЭС (сущест­венно отличающихся по технологии их проектирования), которые условно назовем простыми и сложными ЭС. К простым мож­но отнести поверхностную и традиционную (реже гибридную) ЭС, выполненные на персональной ЭВМ и содержащие от 200 до 1000 правил. К сложным ЭС относятся глубинная и гибридная ЭС, вы­полненные либо на символьной, либо на мощной универсальной ЭВМ, либо на интеллектуальной рабочей станции, содержащие от 1500 до 10 000 правил.

Стадия существования характеризует степень проработанности и отлаженности ЭС. Обычно выделяют следующие стадии: демон­страционный прототип, исследовательский прототип, действую­щий прототип, промышленная система, коммерческая система.

Демонстрационным прототипом называют ЭС, которая решает часть требуемых задач, демонстрируя жизнеспособность метода ин­женерии знаний. При наличии развитых интеллектуальных систем для разработки демонстрационного прототипа требуется примерно 1—2 мес. Демонстрационный прототип работает, имея 50—100 правил. Развитие демонстрационного прототипа приводит к исследо­вательскому прототипу.

Исследовательским прототипом называют систему, которая ре­шает все требуемые задачи, но неустойчива в работе и не полно­стью проверена. Исследовательский прототип обычно имеет в базе знаний 200 — 500 правил, описывающих проблемную область.

Действующий прототип надежно решает все задачи, но для ре­шения сложных задач может потребоваться чрезмерно много вре­мени и (или) огромная память. Число правил в такой системе рав­но 500-1000.

Экспертная система, достигшая промышленной стадии, обеспе­чивает высокое качество решения всех задач при минимуме време­ни и памяти. Обычно процесс преобразования действующего про­тотипа в промышленную систему состоит в расширении числа пра­вил до 1000—1500 и переписывании программ с использованием более эффективных интеллектуальных систем.

Обобщение задач, решаемых на стадии промышленной систе­мы, позволяет перейти к стадии коммерческой системы, пригодной не только для собственного использования, но и для продажи раз­личным потребителям. В базе знаний такой системы 1500—3000 правил.

Диапазон возможных средств построения ЭС простирается от языков высокого уровня до средств поддержки низкого уровня. Разделим инструментальные средства построения ЭС на четыре ос­новных категории:

языки программирования;

языки инженерии знаний;

вспомогательные средства;

средства поддержки.

Языки программирования, применяемые для работы в области ЭС, — это, как правило, или проблемно-ориентированные языки (Фортран, Паскаль и т.д.), или языки обработки текстов (Лисп, Пролог). Проблемно-ориентированные языки разработаны для специального класса задач. Например, Фортран удобен для выпол­нения алгебраических вычислений и чаще всего применяется в на­учных, математических и статистических вычислениях. Языки об­работки текстов разработаны для прикладных областей искусствен­ного интеллекта. Например, Лисп имеет механизмы для манипули­рования символами в форме списковых структур. Список является просто набором элементов, заключенных в скобки, где каждый элемент может быть или символом, или другим списком. Списко­вые структуры являются удобным строительным материалом для представления сложных понятий. В языке Лисп все отношения ме­жду объектами описываются через списки, содержащие отношения объекта с другими объектами.

Добавим, что Лисп существует в разных версиях. Например, Интерлисп и Маклисп имеют различные средства поддержки (ре­дакторы и средства отладки), но одинаковый синтаксис.

Языки программирования, подобные Лиспу, представляют мак­симальную гибкость разработчику ЭС, но никак не подсказывают ему, как представлять знания или как построить механизм доступа к базе знаний. С другой стороны, языки инженерии знаний, такие как KAS, обладают меньшей гибкостью, поскольку разработчик системы должен пользоваться схемой управления, определяемой встроенным в язык механизмом вывода. Эти языки, однако, обес­печивают некоторое руководство и готовые механизмы вывода для управления и использования базы знаний.

Язык инженерии знаний является искусным инструментальным средством разработки ЭС, погруженным в обширное поддержи­вающее окружение. Языки инженерии знаний можно разделить на скелетные и универсальные. Скелетный язык инженерии знаний является просто «раздетой» экспертной системой, т.е. ЭС без спе­циальных предметных знаний, включающей в себя только меха­низм вывода и средства поддержки.

Универсальный язык инженерии знаний может быть применим к проблемам разного типа в различных прикладных областях. Он обеспечивает более широкие возможности управления поиском данных и доступом к ним, чем скелетные системы, но может ока­заться, что его труднее использовать. Разные универсальные языки значительно варьируют в смысле общности и гибкости.

Вспомогательные средства построения ЭС состоят из программ, оказывающих помощь в приобретении знаний у эксперта, и пред­ставлении их, и программ, которые помогают разрабатывать проек­ты экспертных систем.

Средства поддержки — это просто пакеты программ, которые прилагаются к средству построения ЭС, чтобы упростить его использование, облегчить диалог и сделать его более эффективным. Это — средства отладки, ввода-вывода, объяснения, редакторы баз знаний.

Интеллектуальные системы расчетно-логического типа пред­полагают организацию базы знаний в виде функциональной се­мантической сети. Рассмотрим кратко алгоритмы поиска реше­ний на функциональной семантической сети (ФСС). Первой за­дачей, которая должна быть решена, является выбор представле­ния, в котором реализуются процедуры поиска решений и орга­низации вычислительного процесса. При этом целесообразно вы­брать представление в пространстве состояний. В данном пред­ставлении задачу поиска решений можно формально записать следующим образом:

где S0 - начальное состояние;

Sk — конечное состояние;

S — мно­жество промежуточных состояний;

F= {Fi} — множество операто­ров, которые переводят процесс поиска из одного состояния в другое. Каждому математическому отношению Fi поставим в соответ­ствие список (кортеж) параметров, которые в него входят.

Таким образом, рассматриваемый алгоритм предусматривает работу со списочными структурами данных.

При поиске решений на ФСС в качестве множества операторов выступают разрешения математических отношений Fi реализуе­мые в виде отдельных программных модулей, совокупность кото­рых для данной проблемной области составляет локальную (может быть, одну из многих) базу процедур. Здесь верхний индекс η ука­зывает на параметр, который в данном разрешении выступает как функция, а нижний индекс i — на номер соответствующего мате­матического отношения в совокупности математических отноше­ний. Задание исходных данных определяет начальное состояние S0, а искомое решение — конечное (целевое) состояние. Выбор на каждом очередном шаге некоторого конкретного оператора осуще­ствляется в соответствии с некоторыми правилами, которые для данной проблемной области составляют локальную базу правил.

Первый алгоритм реализует стратегию обратной волны, начи­ная поиск решения задачи с целевого состояния, т.е. от искомого параметра. Суть алгоритма состоит в следующем. В соответствии с алгоритмом поиска решений Нильсона образуем следующие спи­ски: S1 — список параметров, которые должны быть рассчитаны; S2 — список параметров, для которых выбраны разрешения для расчета. Дополнительно образуем еще два списка: S3 — список раз­решений, включаемых в план решения задачи, и S4 — список оце­нок сложности реализации разрешения, выбранного в план реше­ния задачи. Данные оценки позволяют при наличии нескольких планов выбрать наилучший, т.е. реализовать классическую поста­новку задачи принятия решений.

Во втором алгоритме реализуется стратегия прямой волны, т.е. планирование идет от исходных данных к целевому параметру.

Многофункциональность разрабатываемых систем обработки интеллектуальной информации может быть обеспечена за счет со­временного подхода к хранению и использованию знаний проекти­ровщиков.

Основной принцип данного подхода заключается в том, что за­дачи решаются на основе не просто данных, а знаний. Последние являются существенно более мощными и позволяют решать на их основе сложные задачи.

Традиционные ЭС имеют лишь один механизм поддержки при­нятия решений — логический вывод и лишь одно средство представления знаний — правила. В последнее время активно развивает­ся новое поколение ЭС — гибридные экспертные системы (ГЭС).

Для использования ГЭС в качестве средства поддержки принятия управленческих решений необходимо предусмотреть возможность учета характеристик лица, принимающего решение (ЛПР). В этом случае в экспертной системе должна присутствовать гибкая схема ло­гического вывода, а поддержка принятия решений должна осуществ­ляться в соответствии с конкретной аналитической моделью пользо­вателя. На рис. 2.55 приведена упрощенная архитектура ГЭС. Данная архитектура не претендует на полноту и характеризует отличие ГЭС от традиционных ЭС.

Эксперт соответствующей предметной области должен иметь возможность задавать оценки объектов, выявленные в результате его взаимодействия с подсистемой обработки экспертных знаний. Полученные таким образом экспертные знания будут храниться в базе экспертных знаний.

Одним из основных этапов решения задачи многокритериаль­ного выбора является настройка модели на систему предпочтений ЛПР. Она выявляется в результате взаимодействия ЛПР и подсис­темы выявления предпочтений ЛПР. Найденные таким образом ха­рактеристики ЛПР сохраняются в базе характеристик ЛПР.

Банк моделей должен содержать широкий набор решающих правил, выражающих различные стратегии поведения пользователя. В АИУС РСЧС системы ИИ только начинают развиваться. Пока это простые системы информационной поддержки принятия решения для ЛПР, имеющими особенности характера.

Таким образом системы ИИ все больше входят в информатизацию общества в виде экспертных систем. За ними будущее в основании, которых информационные технологии.

    1. Мультимедийная технология представления информации в АИУС РСЧС

Развитие гипертекстовой технологии в глобальных сетях стало основой к появлению гипермедийных документов, которые наряду с текстовой информацией содержат информацию, представленную в мультимедийной форме.Несмотря на то, что основные понятия гипертекста сформи­ровались уже достаточно давно, настоящее развитие он получил лишь с появлением компьютерных способов его реализации. Ана­логичная ситуация сложилась и с мультимедиа: комплексное при­менение всех видов информационного воздействия на человека использовалось еще древними шаманами (одежда, бубен, закли­нания, пляски, наркотические средства), однако само слово «муль­тимедиа» и комплексность информации именно как технология появились сравнительно недавно и тоже связаны с появлением и распространением компьютеров. Впрочем, цели применения муль­тимедиа недалеко ушли от шаманских: как можно полнее охва­тить все чувства человека передаваемой ему информацией.

Что же такое мультимедиа? Само слово мультимедиа образова­но из латинских: «мульти» — много и «медиа» — среда, носитель, средства сообщения и его можно перевести как «многообраз­ная среда». В мультимедиа-продукте объединяются двухмерные и трехмерные изображения, звуковое сопровождение, музыка, ани­мация, видео-, текстовая и числовая информация и т.д. Подчерк­нем, что все эти виды информации должны образовывать единое целое. Хорошим примером является мультимедийный компакт-диск с альбомом записей какой-либо музыкальной группы. Такой диск содержит, конечно, в первую очередь записи песен, однако они могут сопровождаться видеозаписями с концертов, текстами песен, информацией об исполнителях и т.д. Кроме того, такой диск обязательно содержит управляющую оболочку, позволяю­щую осуществлять поиск нужной информации, переключение режимов ее представления (видео, текстовый, цветомузыка, стоп-кадр и т.д.) и настройку всей системы. Другим примером являют­ся мультимедийные интернет-сайты, получившие распростране­ние с появлением скоростных каналов доступа в Интернет.

Сферы применения мультимедиа достаточно многообразны, хотя и распространены не слишком широко. Связано это с тем, что как средства воспроизведения мультимедиа, так и технология изготовления мультимедиа-продуктов, являются весьма сложными и дорогостоящими. Специалист в области мультимедиа поми­мо общей компьютерной грамотности должен владеть основами видео- и аудиозаписи и монтажа, основами композиции, а также свободно обращаться с совершенно разнородными программны­ми продуктами. Можно, конечно, создать команду из профессио­налов в каждой узкой области, но это еще более увеличит сто­имость продукта. Поэтому мультимедиа-технологии применяются либо в тех областях, где высокая стоимость продукта не является препятствием, либо там, где ожидается его массовое производ­ство. К таким областям можно отнести:

  • информационную и рекламную деятельности;

  • шоу-бизнес;

  • создание персональных фоно- и видеотек;

  • компьютерные тренажеры;

  • компьютерные игры;

  • обучающие программы;

  • энциклопедии.

Все эти области требуют комплексной формы представления выдаваемой информации, а, следовательно, мультимедиа — их естественная технология.

Мультимедиа – комбинированное представление информации в разных формах (текст, звук, видео и т.д.). Под мультимедийной технологией будем понимать, технологии основными характерными особенностями которых яв­ляются:

объединение многокомпонентной информационной среды (текста, звука, графики, фото, видео) в однородном цифровом представлении;

обеспечение надежного (отсутствие искажений при копировании) и долговечного хранения (гарантийный срок хранения — десятки лет) больших объемов информации;

простота переработки информации (от рутинных до творче­ских операций).

Пределом развития мультимедиа является виртуальная реаль­ность — создание с помощью компьютера и специальных уст­ройств (шлемов, очков, перчаток и даже костюмов) виртуально­го (кажущегося) мира, в который «помещается» человек и живет в этом мире по его законам. Яркой иллюстрацией этой идеи явля­ется нашумевший в свое время фильм «Матрица». Надо, однако, заметить, что до реализма «Матрицы» современным системам вир­туальной реальности еще очень и очень далеко. К тому же, как с функциональной, так и с экономической точки зрения, их при­менение оправдано крайне редко.

В настоящее время технологии мультимедиа является бурно развивающейся областью информационных технологий. В этом на­правлении активно работает значительное число крупных и мелких фирм, технических университетов и студий (в частности IBM, Apple, Motorola, Philips, Sony, Intel и др.). Области использования чрезвычайно многообразны: интерактивные обучающие и инфор­мационные системы, САПР, развлечения и др.[ Советов]Гохберг.

Технологию мультимедиа обеспечивают следующие средства: аппаратные и программные. Рассмотрим их (рис. 2.56).

Аппаратные средства включают в свой состав: звуковые карты, видеокарта, TV –тюнеры, графические акселераторы (ускорители), в том числе для поддержки трехмерной графики, акустические системы.

К программным средствам относятся: мультимедийные приложения (энциклопедии, интерактивные курсы обучения, игры и развлечения, работа в Интернет, тренажеры, торговая реклама, электронные презентации, информационные киоски и др.) и средства создания мультимедийных приложений (редакторы видеоизображений, профессиональные графические редакторы, средства записи, создания иредактирования звуковой информации, программы для манипуляции с сегментами изображения, изменяя цвета и палитру, программы для реализации гипертекстов и др.)

Развитием гипертекстовых технологий в глбальных сетях стали появляться гипертекстовые документы, которые наряду с текстовой информацией содержат инфорацию в мультимедийной форме. Эта информация представляется не только в статической, но и динамической форме.

Человек воспринимает до 95% поступающей к нему информации визуально, т.е. «графически». Такое представление информации по своей природе более наглядно и легче воспринимается, чем текстовое. Поэтому принято различать векторную и растовую графику, а за единицу оценки принят пиксел.

Пиксель – это минимальный участок изображения, независимый от цвета, яркости и др. параметров. Векторная графика – метод создания изображения ввиде совокупности линий. Растовая графика – метод создания изображения в виде раста – набора разноцветных точек (пикселей), упрядоченных в строки и столбцы. В памяти компьютера такие изображения храняться ввиде битовых последовательностей, которые описывают цвет отдельных пикселей. При этом на каждый пиксель приходиться конкретное число бит, определяющих ту или иную характеристику цвета [ Хохлова ].

Рис. 2.56. Схема типов данных мультимедиа информации

Однако в силу относительно невысокой пропускной способности существующих каналов связи, прохождения графических файлов по ним требует значительного времени. Это заставляет примениять технологию сжатия данных, представляющий собой методы хранения одного и того же объема информации путем использования меньшего количества бит. Графика преимущественно представлена двумя форматами файлов – GIF, JPEG. Формат GIF рассчитан на табличное кодирование изображения с применением 256 – цветной палитры, при которой однм байтом записываются одно значене некоторого произвольного цвета. Этот формат используется для представления малоцветовых изображений (одинаковый цвет). Формат JPEG международный стандарт. Он предназначен для записи полноценного изображения.

Достигнутый технологический уровень основан на использовании нового стандарта оптического носителя DVD (Digital Versalite/Video Disk), имеющего емкость порядка единиц и десятков гигабайт и заменяющего все предыдущие CD-ROM, Video-CD, CD-audio. Использование DVD позволило реализовать концепцию однородности цифровой информации. Одно устройст­во заменяет аудиоплейер, видеомагнитофон, CD-ROM, дисковод, слайдер и др. В плане представления информации оптический но­ситель DVD приближает ее к уровню виртуальной реальности.

Многокомпонентную мультимедиа-среду целесообразно разде­лить на три группы: аудиоряд, видеоряд, текстовая информация.

Аудиоряд может включать речь, музыку, эффекты (звуки типа шума, грома, скрипа и т.д., объединяемые обозначением WAVE (волна). Главной проблемой при использовании этой группы мультисреды является информационная емкость. Для записи одной минуты WAVE-звука высшего качества необходима память порядка 10 Мбайт, поэтому стандартный объем CD (до 640 Мбайт) позво­ляет записать не более часа WAVE. Для решения этой проблемы используются методы компрессии звуковой информации.

Другим направлением является использование в мультисреде звуков (одноголосая и многоголосая музыка, вплоть до оркестра, звуковые эффекты) MIDI (Musical Instrument Digitale Interface). В данном случае звуки музыкальных инструментов, звуковые эф­фекты синтезируются программно-управляемыми электронными синтезаторами. Коррекция и цифровая запись MIDI-звуков осу­ществляется с помощью музыкальных редакторов (программ-се­квенсоров). Главным преимуществом MIDI является малый объ­ем требуемой памяти — 1 минута MIDI-звука занимает в среднем 10 кбайт.

Видеоряд по сравнению с аудиорядом характеризуется большим числом элементов. Выделяют статический и динамический видео­ряды.

Статический видеоряд включает графику (рисунки, интерьеры, поверхности, символы в графическом режиме) и фото (фотографии и сканированные изображения).

Динамический видеоряд представляет собой последователь­ность статических элементов (кадров). Можно выделить три типо­вых группы:

обычное видео (life video) — последовательность фотографий (около 24 кадров в секунду);

квазивидео — разреженная последовательность фотографий (6—12 кадров в секунду);

анимация — последовательность рисованных изображений.

Первая проблема при реализации видеорядов — разрешающая способность экрана и число цветов. Выделяют три направления:

стандарт VGA дает разрешение 640 х 480 пикселей (точек) на экране при 16 цветах или 320 х 200 пикселей при 256 цветах;

стандарт SVGA (видеопамять 512 кбайт, 8 бит/пиксель) дает разрешение 640 х 480 пикселей при 256 цветах;

24-битные видеоадаптеры (видеопамять 2 Мбайт, 24 бит/пик­сель) позволяют использовать 16 млн цветов.

Вторая проблема — объем памяти. Для статических изображе­ний один полный экран требует следующие объемы памяти:

в режиме 640 х 480, 16 цветов — 150 кбайт;

в режиме 320 х 200, 256 цветов — 62,5 кбайт;

в режиме 640 х 480, 256 цветов — 300 кбайт.

Такие значительные объемы при реализации аудио- и видеоря­дов определяют высокие требования к носителю информации, ви­деопамяти и скорости передачи информации.

При размещении текстовой информации на CD-ROM нет ни­каких сложностей и ограничений ввиду большого информационно­го объема оптического диска.

Основные направления использования мультимедиа-техно­логий:

электронные издания для целей образования, развлечения и др.;

в телекоммуникациях со спектром возможных применений от просмотра заказной телепередачи и выбора нужной книги до уча­стия в мультимедиа-конференциях. Такие разработки получили на­звание Information Highway;

мультимедийные информационные системы («мультиме­диа-киоски»), выдающие по запросу пользователя наглядную ин­формацию.

Таким образом, технология мультимедиа – интерактивная технология, обеспечивающая работу с различным изображением как статичным, так и динамичным, анимацией , текстом и звукорядом.

2.7. Информационная технология электронного документоведения

Электронное документоведения

Основной объект делопроизводства — документ. Этот объект содержит в себе другие объекты: тексты, рисунки, таблицы и т. п. Документ многофункционален, но его основная функция — зафиксировать информацию так, чтобы в дальнейшем ее можно было обрабатывать, хранить, передавать и использовать.

Оформление служебных документов строго регламентировано стандартами. Стандарт — образец, который удовлетворяет по своим признакам, свойствам, качествам определенным правилам. Для того чтобы правильно оформить документ, необходимо ознакомиться со стандартами, описанными в специальных ГОСТах и приказах.

ГОСТ 16487—83. Делопроизводство и архивное дело. Терми­ны и определения.

ГОСТ 6.38—90. Унифицированные системы документации. Система организационно-распорядительной документации. Требования к оформлению документов.

ГОСТ Р 51141-98. Дело производство и архивное дело. Термины и определения.

ГОСТ Р 6.30—2003. Устанавливает правила оформление документов.

Приказ по МЧС № 123 от «…» О правила оформления документов.

Бланк — это «стандартный лист бумаги с воспроизведенной на нем постоянной информацией документа и местом, отведенным для переменной». Информация, отраженная на бланке, четко подразделяется на составляющие, которые называются реквизитами. Реквизит — это элемент официального документа. Реквизиты бывают: обязательные и дополнительные Обязательными реквизитами документа являются название организации, составившей документ, название документа (исключение составляют письма), заголовок текста, дата, индекс, текст, визы, подпись, отметка об исполнении документа и направлении его в дело. Остальные реквизиты являются дополнительными

Документы могут быть классифицированы:

по типу носителей – бумажные, электронные и магнитные

по содержанию — первичные и сводные

Задачи делопроизводства следующие :

создание документов и их оформление;

хранение документов;

обеспечение санкционированного доступа к документам;

поиск нужных документов.

В современных условиях делопроизводство и документооборот в России и в МЧС осуществляется на бумажной основе в своем большенстве. Однако уже существуют организации выполняющие электронный документооборот. В целом по стране электронный докуметооборот занимает ~ 30%, а остальное на базе бумажных технологий. В США наооборот 30% посвещены бумажным технологиям, а остальное – электронным. Рассмотрим автоматизацию обработки документов, как одну из основных технологий.

Для работы с документами, представленными в электронной форме, необходимо иметь локакльную ТКС и аппарат­но-программные средства преобразования бумажных документов в электронную форму. Можно выделить следующие основные этапы такого преобразования [Федотова ]:

сканирование с помощью устройств оцифровки изображения, в процессе которого производится создание электронного образа документа;

процесс распознавания, позволяющий преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала);

применение дополнительных средств автоматизированного перевода на другой язык для документов, исполненных на иностранном языке;

создание рефератов и аннотаций для научно-исследовательской работы по направлению научной деятельности.

Сканеры формируют электронное изображение бумажного документа стандартного формата заданного качества изображения, которое гарантировало бы его надежное распознавание. Этап распознавания документа состоит в преобразовании электронного изображения в текстовый документ, при котором про­исходит «сравнение» элемента изображения с эталонными вари­антами начертания символов, после чего выбирается наиболее подходящий символ. В ходе распознавания в изображении сначала выделяются крупные элементы текста: колонки, абзацы, отдельные текстовые блоки, ячейки таблиц — этот этап называется сегментацией, он может выполняться автоматически или вручную. Затем выполняется автоматический этап распознавания: блоки разбиваются на строки, строки — на отдельные символы, каждый из которых распознается независимо и помещается в итоговый документ.

Технология автоматического распознавания образов заключается в следующем. Методы автоматического распознавания образов и их реализация в системах оптического распознавания текстов (Optical Character Recognition — OCR-системы) — одна из самых прогрессивных технологий искусственного интеллекта. В развитии этой технологии российские ученые занимают ведущие позиции в мире. OCR-система понимается как система автоматического распознавания образов с помощью специальных программ изображений символов печатного или рукописного текста (например, введенного в компьютер посредством сканера) и преобразование его в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т. д. Перечислим особенности предметной области, существенные с точки зрения OCR-систем:

шрифтовое и размерное разнообразие символов;

искажения в изображениях символов (разрывы образов символов);

перекосы при сканировании;

посторонние включения в изображениях;

сочетание фрагментов текста на разных языках;

большое разнообразие классов символов, которые могут быть распознаны только при наличии дополнительной контекстной информации.

Аббревиатура OCR иногда расшифровывается как Optical Character Reader — устройство оптического распознавания символов или автоматического чтения текста. В настоящее время такие устройства в промышленном использовании обрабатывают до 100 тыс. документов в сутки. Промышленное использование предполагает ввод документов хорошего и среднего качества — это обработка бланков переписи населения, налоговых деклараций и т. д.

Используя возможности современных программ верстки, дизайнеры часто создают объекты сложной формы, такие как обтекание непрямоугольной картинки многоколоночным текстом. В системе Fine Reader 8.0 реализована поддержка распознавания таких объектов и их сохранение в файлах формата MS Word. Теперь документы сложной верстки будут точно воспроизведены в данном текстовом редакторе. Даже таблицы распознаются с максимальной точностью, сохраняя при этом все возможности для редактирования.

Ведущие производители программного обеспечения лицензировали российскую информационную технологию для применения со своими продуктами. В популярные программные пакеты Corel Draw (Corel Corporation), Fax Line/OCR & Business Card Wizard (Inzer Corporation) и многие другие встроена OCR-библиотека Cunei Form. Эта программа стала первой в России OCR-системой, получившей MS Windows Compatible Logo.

К средствам автоматизации перевода можно отнести два вида программ: электронные словари и программы перевода. Электронные словари представляют собой средства для перевода слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова без поиска его в отдельном большом словаре. Программы перевода получают на входе текст, выполненный на одном языке, и выдают текст на другом языке, т. е. автоматизируют процесс перевода.

Машинный перевод текстов с одних естественных языков на другие — одна из наиболее ранних задач не вычислительных приложений ЭВМ и систем искусственного интеллекта. Отмечаются два аспекта, определяющих актуальность задач машинного перевода:

все возрастающая потребность в переводах в науке, литературе, дипломатии, экономике и других областях деятельности;

для машинного перевода гораздо яснее критерии оценивания результатов, чем в задачах понимания текстов, организации диалогов и др.

Системы машинного перевода отличают по трем аспектам:

рабочим языкам (различают двуязычные и многоязычные системы машинного перевода);

типам текстов (для перевода письменного текста и устного диалога);

ограничениям по предметной области (обусловлены поддержкой в них лексики, соответствующей той или иной области знаний: медицины, информатики, математики и пр.).

Автоматическое реферирование и аннотирование заключаетя в следующем. Рефератом называют доклад на определенную тему, включающий обзор литературных и других источников; изложение содержания научной работы, книги и т. д. Под аннотацией понимается краткая характеристика произведения печати или рукописи. Аннотацию от реферата отличают: существенно меньший объем, обязательная констатация назначения аннотируемого произведения (для каких категорий чита­телей предназначено). Автоматическое реферирование и аннотирование — одно из направлений информационой обработки естественно-языковых текстов, и в этом качестве оно относится к фундаментальным технологиям искусственного интеллекта.

Основные направления в этой области:

аннотированные каталоги перерастают в гипертекстовые;

оглавления (карта сайта) и функции поиска по сайту;

использование онтологических словарей — тезаурусов общего и специального назначения, а также методов искусственного интеллекта.

Потребности в средствах автоматического реферирования и аннотирования испытывают информационные системы документо­оборота; поисковые машины и каталоги ресурсов Интернета; ав­томатизированные информационные библиотечные системы; каналы вещания; службы рассылки новостей и др.

В целом, автоматическая классификация электронных документов выражается, как эффективность поиска в большом информационном массиве существенно повысится, если его разбить на части по некоторому критерию, связанному с целями поиска. Классификация документов позволяет сузить область поиска, увеличить скорость нахождения документов, значительно повысить точность результатов поиска. Технологии автоматической классификации документов отводится важное место в системах управления документооборота.

Перечислим системы, испытывающие потребность в средст­вах автоматической классификации электронных документов:

информационные системы документооборота;

каталоги Интернета;

каналы вещания;

службы электронной почты;

электронные библиотеки;

информационные агентства;

интернет - порталы и др.

Суть задачи классификации состоит в автоматическом распределении поступающих в систему документов в зависимости от их типа и содержания по рубрикам (классам). Предусматривается распределение документов как элементов некоего формального множества по классам аксиоматически определенных критериев (для библиотечных ИС, книг, электронных изданий и другие информационных ресурсов распределяются по достаточно устойчивой системе рубрик).

Документы, классифицируются на основе их эмпирического анализа для достижения заранее заданной цели (в ИС большинство документов первоначально классифицируется приблизительно). Коммерческие интеллектуальные программные продукты для обработки текстов входят в пору зрелости, становятся привычным инструментом для широкого круга пользователей. Их применение приносит значительный экономический эффект. Опыт практического использования таких продуктов показывает, что они должны базироваться как на традиционных, так и на новых интеллектуальных технологиях анализа текстовой информации.

Для обеспечения указанных этапов делопроизводства рассмотрим основные функции современной офисной системы. Современная офисная система выполняет следующие фунции:

интеграция технологий делопроизводства в единый процесс;

переход на безбумажную технологию;

автоматизация рутинных операции по обработке информации;

архивация информации;

создание и поддержка приложений;

обеспечение сохранности, целостности и достоверности информации;

установление уровней доступа и защита от несанкционированного доступа к информации;

обеспечение эффективного поиска информации по различным критериям;

создание гибкой системы разделения и распределения информации;

организация коллективной работы пользователей в локальных и глобальных информационных сетях;

быстрая и надежная связь и передача информации по каналам связи удаленным пользователям;

обеспечение дружественного единого интерфейса пользователя со всеми компонентами системы [Федотова].

Рис.2.57. Схема ведения электронного документоведения

Основные функциональные подсистемы современной системы автоматизации делопроизводства и документооборота (САДД) должны решать все основные функции работы с документами. Потребность в повышении качества управления, в ускорении делопроизводства и документооборота, в подготовке принятия управленческих решений является ключевой для развития совре­менных информационных систем. Конечной целью информати­зации предприятия является создание единого информационно­го пространства путем объединения совместимых между собой функционально специализированных программных продуктов.

Рассмотрим основные функциональные подсистемы современной системы автоматизации делопроизводства и документооборота:

  1. 1.Ввод документов обеспечивается достаточными по мощности текстовыми процессорами. В некоторых офисных системахнаряду с вводом информации вручную предусмотрен ввод посредством оптического сканирования печатных или рукописныхтекстов с использованием программных средств распознаваниясимволов. Развиваются технологии акустического ввода и распознавания текстов

Рис.2.58. Электронные реквизиты документов

Рис.2.59.Схема электронной обработки входящей документации

  1. Регистрация и учет документов могут быть реализованысредствами СУБД. Для этого необходимо определить перечень иформат представления информации, характеризующий документ(вид документа, дата поступления, входящий — исходящий ноера, наименование, имя отправителя — получателя, краткоесодержание и т. п.). Для дальнейшего поиска требуется определить поисковые критерии и ключевые слова для контекстногопоиска.

3.. Распределение документов по исполнителям и разграничение доступа осуществляются либо с помощью систем элекронной почты, либо средствами информационной системы, в том числе сетевой или СУБД с коллективным доступом. Администратор системы ведет списки исполнителей, объединенных в рабочие группы, с указанием их адресов в локальной сети номеров телефонов для модемной связи, номеров почтовых ящиков на почтовом сервере. Администратор назначает уровни доступа к информации каждому исполнителю или рабочей группе. Документы ограниченного доступа могут подвергаться шиф ровке. В некоторых офисных системах применяется программа «публикации в сети», позволяющая санкционированным пользо вателям просматривать и аннотировать документ.

Класификация программных продуктов документоведения

Класс ППО

Программные продукты

Текстовые редакторы

Microsoft Word 6.0/7.0/97,2007, Лексикон 2.0 for Windows, WordPerfect for Windows 6.0

Табличные редакторы (электронные таблицы)

Excel for Windows 5.0/7.0/97,2007 Quattro Pro 6.0 for Windows, Lotus 1-2-3 for Windows

СУБД (системы управления базами данных)

Access 2.0/7.0/97, 2007 for Windows, dBase for Windows 5.0

Коммуникационные программы

DML Demos Mail, MiniHost, Microsoft Outlook

Программы оптического распознавания текста для перевода информации с бумажного носителя на магнитный с помощью сканера

OCR CuneiForm 2.0/2.95/4.0, CuneiForm 96,

Gold FineReader 8.0 PRO

Электронные словари и переводчики

STILUS Lingvo

Интегрированные пакеты

Microsoft Office 2007 for Windows, Works for Windows

Таблица 3.

4. Контроль за исполнением и поиск документов осуществляются на основе информации, внесенной в процессе регистрации и учета документов в БД. Возможно применение генераторов запросов, позволяющего проектировать структуру запроса. '

5. Архивирование информации, ведение фондов, а также поиск документов осуществляются либо средствами локальныхСУБД, либо с использованием мощных распределенных баз данных (на архивных магнитных или оптических дисках).

6. Формирование и выдача статистических данных осуществляются на основе информации с использованием текстовых процессоров, электронных таблиц, графических пакетов и настольных издательских систем.

7. Подготовка и оформление документов реализуются с использованием текстовых процессоров, электронных таблиц, графических пакетов и настольных издательских систем.

8. Обмен документами осуществляется модулями с внешними (удаленными) пользователями электронной почты. Почтовыесистемы, кроме рассылки документов в своей среде, предоставляют возможность пересылать информацию пользователям других систем электронной почты.

Любая организация имеет определенную структуру, внутренний связи, обеспечивающие взаимодействие между руково^твом щ структурными подразделениями, и внешние связи с деловыми партнерами, предприятиями, органами власти. Внешние и внутренние связи можно рассматривать как информационные.

Рис.2.60. Схема электронной обработки документации

Рис.2.61.Схема электронной обработки исходящей документации

Управление предприятием можно представить как процесс получения информации, ее обработки, принятия решения и до­ведения его до исполнителя. Для выработки правильного реше­ния требуется полная, оперативная и достоверная информация.

Полноту информации характеризует ее объем, который должен быть достаточен для принятия решения. Информация должна быть оперативной, т. е. такой, чтобы во время ее передачи и обработки состояние дел не изменилось. Достоверность информации определяется степенью соответствия ее содержания объективному состоянию дел.

Часть информации, используемой в управлении предприятием, фиксируется в документах. Документ является носителем информации; это текст или изображение, имеющее информационное значение.

Применение государственных стандартов вводит единый порядок документов. Документы, функционирующие в сфере управления, называют организационно-распорядительными до­кументами (ОРД). К ним относятся:

организационные (уставы, учредительные договоры);

распорядительные (приказы, распоряжения, решения);

справочно-информационные (письма, факсы, докладные записки, справки, телефонограммы).

Составной частью управления является делопроизводство. Работники сферы управления (руководители и специалисты) до 75 % рабочего времени тратят на работу с документами.

В основу современного делопроизводства положены следующие принципы:

оперативность (быстрая и четкая работа с документами);

современное техническое оснащение (компьютеры, факсы,ксероксы, сканеры);

целесообразность всех операций с документами (любая работа с документом должна быть необходима для деятельности предприятия, оправдана конкретной конечной целью);

умелое сочетание документационного обеспечения управле­ния с бездокументационным (составление документов только в том случае, когда это действительно необходимо или установлено государственными нормативными актами).

В делопроизводстве существуют единые требования и правила оформления документов управления, установленные государственными нормативными актами. Выполнение единых правил оформления документов дает следующее:

юридическую силу документов;

оперативное, качественное составление и исполнение;

организацию быстрого поиска документов;

активное использование компьютера при составлении документов.

Любой документ состоит из ряда элементов (дата, текст, подпись), которые называются реквизитами.

Максимальный набор реквизитов для документов управления — 31. В конкретном документе их гораздо меньше. Каждый вид документа (акт, приказ, письмо и т. д.) имеет определенный набор реквизитов.

Организационные документы предприятия (устав, учредительный договор, структура и штатная численность, штатное расписание, должностные инструкции, правила внутреннего трудового распорядка).

Распорядительные (приказы по основной деятельности, распоряжения, решения).

Документы по личному составу (приказы по личному составу, трудовые контракты, личные карточки, лицевые счета по заработной плате, трудовые книжки).

Финансово-бухгалтерские документы предприятия (главная книга, годовые отчеты, бухгалтерские балансы, сметы, кассовые книги).

Информационно-справочные документы (акты, письма, факсы, справки, телефонограммы).

Нормативные документы вышестоящих организаций — от государственных и муниципальных органов (налоги, охрана окружающей среды).

Коммерческие контракты.

Все перечисленные документы относятся к ОРД. Исключение составляют финансово-бухгалтерские документы, имеющие специфические особенности составления и обработки.

Первоначально для автоматизированной поддержки делопроизводства использовались текстовые редакторы, электронные таблицы, СУБД, различные языки запросов пользователя, сред­ства графической обработки информации, средства для организации работы пользователей. С появлением интегрированных пакетов офисных систем все эти средства были объединены под стандартным интерфейсом.

Рациональным решением для организации электронной обработки и хранения больших массивов документов различных типов на разных носителях является применение интегрированных систем. Они обеспечивают следующее:

соответствие типов документов в предлагаемой технологииих обработки требованиям и стандартам, устанавливаемым в организации;

масштабируемость и модифицируемость системы при изменении требований пользователя в перспективе;

базирование системы на наиболее прогрессивных и проверенных временем решениях в области ПО.

К самым распространенным программным средствам реализации офисных автоматизированных информационных систем относятся:

Lotus Notes (фирма-производитель Lotus Development);

AV Object Office (фирма-производитель Data General);

Prefect Office (фирма-производитель Novell Application Group);

Borland Office (фирма-производитель Borland Word Perfect);

Microsoft Office (фирма-производитель Microsoft);

OCIS (фирма-производитель Office Communication — Information Systems Nixdorf (SNI)).

Электронные таблицы:

Lotus 1-2-3;

Excel;

Quattro Pro 5.0, 6.0 for Windows.

Текстовые редакторы:

MS Word Perfect for Windows;

MS Word for Windows;

Comfo text.

СУБД:

Lotus Approach;

ORACLE, INFORMIX, SYBASE;

Paradox 5.0 for Windows;

Access;

Server SQL;

ComfoBase на основе стандарта SQL.

Электронная почта:

Lotus cc-Mail /Notes Mail;

AV on GO Office;

Grup Wise;

Object Echange;

MS Mail for Windows;

Mail X.UnixMail.

Графические системы:

Lotus Free-lance;

AV Image;

AppWare;

Power Point for Windows;

MS Paint-brush, MS Power Point.

Системы документооборота:

Work Flow;

Agent — система рассылки;

публикация документов в сети Envoy;

Work Group Enable Kit;

OnTime.

Системы-планировщики:

Lotus Organiser;

InfoCentral for Windows;

Doculive'.

С появлением интегрированных пакетов офисных систем все эти средства были объединены стандартным интерфейсом и стали также использоваться для поддержки делопроизводства. Их преимущества в следующем: общность интерфейса входящих в комплект приложений, высокая степень интеграции программ, низкая цена, менее жесткие за счет использования общих модулей требования к ресурсам. Стандартный базовый набор приложений: текстовый процессор, электронная таблица, СУБД часто расширяется программами презентации, системами электронной почты и т. д.

Российская технология процессов делопроизводства имеет следующие особенности:

четко выраженный вертикальный характер движения документов (руководитель — исполнитель — уководитель) внутри организации;

отслеживание всего комплекса работы с документами в регистрационных журналах или в машинописных картотеках, куда заносятся все сведения о документах, их перемещениях, резолюции начальства, контроль за сроками исполнения, отчеты и т. д.;

ведение регистрационно-контрольных и отчетных форм и журналов. Для обеспечения единого порядка обработки документов предусматривается создание специализированных служб: управлений делами, секретариатов, канцелярий.

Технологии делопроизводства закреплены в государственных стандартах, инструкциях и наставлениях по делопроизводству.

Основная проблема традиционной технологии — централизованное отслеживание движения документов в режиме реального времени, поскольку данная технология требует как получения оперативной информации, так и ведения большого количества различных журналов и картотек. При этом делопроизводство фактически отделено от самих документов: руководители и исполнители работают непосредственно с документами (или их копиями), а делопроизводственный персонал отслеживает их действия с помощью регистрационных и контрольных карточек. Другая особенность — относительно небольшое разнообразие процессов делопроизводства и документооборота, высокая степень их стандартизации.

Программные системы, реализующие российскую технологию, ориентированы в первую очередь на использование в государственных учреждениях и сохраняют все традиции и нормы делопроизводства, принятые в конкретной организации. Задача таких систем — обеспечение сопровождения безбумажного документооборота, снижение трудоемкости рутинных операций по обработке документов. К системам автоматизации данной технологии относятся:

Дело-96 (компания «Электронные офисные системы»);

система Золушка — WIN. Служебная корреспонденция. НТЦ ИРМ, г. Москва.

система Office Media компании InterTrust, Москва (LotusNotes);

система Ирида компании IBS, Москва (Lotus Notes);

комплекс программ Делопроизводство фирмы ИнТорКон,Челябинск (Lotus Notes);

система Золушка—Кабинет НТЦ ИРМ, Москва (LotusNotes);

решения компании АО «Весть», Москва (DocsOpen).

решения компании «Метатехнология», Москва (StafTware иExcalibur);

система Optima-WorkFlow компании АОЗТ «Оптима» (MSExchange, MS SQL).

система LandDocs компании «Ланит»;

система Effect Office компании «Гарант International»;

система Документ2000 компании Telecom Service;

система Крон компании «Анкей»;

система Евфрат компании Cognitive Technologies.

Электронно-цифровая подпись

В современном мире стремительно развивающиеся инфор­мационные технологии позволяют менять привычные представ­ления о работе с документами. Возможности сети Интернет раз­решают оперативно находить информацию на нужную тему и проводить с ней необходимые операции. В связи с этим возни­кают уникальные возможности работы с документацией, напри­мер, такие, как электронно-цифровая подпись.

В Федеральном законе РФ №1 от 10.01.2002г. «Об электронной цифровой подписи» подпись указывается как обязатель­ное средство документированной информации. Это обусловли­вает возникновение специальных, не имеющих аналогов в мире технических и юридических проблем.

Применение рукописной подписи имеет исторический и тра­диционный характер. На финансовых документах необходимо наличие двух рукописных подписей (первой и второй), а также печати юридического лица. Характерной особенностью рукопис­ной подписи является ее неразрывная связь с носителем инфор­мации, т. е. рукописная подпись возможна только на документах, имеющих материальную природу. Электронные документы име­ют логическую природу. Электронно-цифровая подпись (ЭЦП) — это цифровое представление информации об отправителе электрон­ного сообщения, созданное с применением закрытого ключа подписи и позволяющее при использовании открытого ключа подписи подтвердить неизменность и целостность данного сооб­щения.

К одним из основных понятий относится понятие «электрон­ное сообщение» — информация, пересылаемая в цифровом виде посредством компьютерной техники, в том числе по телекомму­никационным сетям. Закрытый ключ (ЗК) — это информация (после­довательность символов), известная только ее пользователю, по­зволяющая создавать электронно-цифровую подпись. Открытый ключ (ОК) — это информация (последовательность символов), предна­значенная для проверки электронно-цифровой подписи и сооб­щаемая пользователем закрытого ключа получателю электронно­го сообщения, либо Центру удостоверения открытых ключей (Удостоверяющему центру) с целью обеспечения открытого дос­тупа к ней. Удостоверяющий центр (УЦ) — это лицо, осуществляющее деятельность по хранению открытых ключей электронно-цифро­вой подписи и по удостоверению их соответствия атрибутам Сви­детельств электронно-цифровой подписи пользователей закры­тых ключей. Свидетельство электронно-цифровой подписи — это документ, содержащий сведения о пользователе закрытого ключа, выдаваемый пользователю Удостоверяющим центром.

В электронных документах подпись представлена в виде цифрового кода. Проверка электронно-цифровой подписи — это действия получателя электронного сообщения, позволяющие подтвердить неизменность и целостность электронного сообще­ния после его подписания электронно-цифровой подписью с применением средств электронно-цифровой подписи.

Экспертиза рукописных подписей является одной из самых сложных идентификационных задач. Исследование подлинности электронно-цифровой подписи еще более сложная задача, тре­бующая высокопрофессионального подхода для ее решения1.

В Федеральном законе «Об электронно-цифровой подписи» устанавливается порядок использования электрон­но-цифровой подписи при совершении гражданско-правовых сделок и в других случаях, предусмотренных законодательством Российской Федерации.

Электронно-цифровая подпись представляет собой уникаль­ную последовательность битов, жестко связанную с конкретным документом. Ее структура зависит от двух аргументов: текста документа и так называемого секретного ключа, известного только его владельцу. Любое несанкционированное изменение текста документа ведет к искажению цифровой подписи. Считается, что из-за сложной привязки к указанным аргументам электрон­ную подпись теоретически невозможно подделать.

Наиболее распространенные принципы реализации элек­тронно-цифровой подписи основаны на применении хэш-функ­ций, в частности MD5, которая выполняет специальное преоб­разование битов в файле и генерирует в его конце псевдослу­чайное 128-битное число, соответствующее количеству бит в записи. MD5 может использоваться для файлов любой длины. Если два файла отличаются хотя бы на 1 бит, значение числа MD5 будет иным. И наоборот, если два файла имеют одно и то же характеризующее их число, вероятность того, что это разные файлы, бесконечно мала. После вычисления этого числа оно шифруется с использованием открытого ключа собственника за­писи в файле, что и представляет собой цифровую подпись. Пе­ред тем как проверить подпись, пользователь дешифрует ее с применением своего открытого ключа. Если полученное значе­ние числа совпадает с исходным, это означает, что запись в фай­ле не изменялась, и цифровая подпись считается аутентичной. Получателю документа для его дешифрации передается значение открытого ключа. Достоинством использования MD5 в качестве цифровой подписи является высокая скорость вычислений для больших файлов, однако 100%-ной гарантии того, что код может быть вскрыт, дать невозможно.

Надежность электронно-цифровой подписи находится в пря­мой зависимости от длины кода в ключе. Существуют различные алгоритмы электронно-цифровой подписи. К ним следует отне­сти отечественные ГОСТ Р34.10-94 и ГОСТ 28147-89 (обяза­тельные для применения в государственных организациях Рос­сии), новый ГОСТ Р34.10—2001.

Электронно-цифровая подпись должна являться аналогом собственноручной подписи. Электронное сообщение с элек­тронно-цифровой подписью должно признаваться документом при наличии всех остальных реквизитов, позволяющих его иден­тифицировать. Обмен электронными сообщениями с электрон­но-цифровыми подписями, выражающими содержание граждан­ско-правовой сделки, должен признаваться заключением догово­ра в письменной форме. Отправитель электронного сообщения самостоятельно принимает решение о его подписании электронно-цифровой подписью. Использование электронно-цифровой подписи не является способом шифрования информации, а средства электронно-цифровой подписи — средствами шифро­вания информации. Любое лицо, отправляющее электронные сообщения, вправе создать свою электронно-цифровую подпись и подписывать ею свои сообщения.

Лицо, получившее электронное сообщение, подписанное электронной подписью, может обратиться в Удостоверяющий центр для проверки подписи. Удостоверяющим центром выдает­ся Свидетельство электронно-цифровой подписи по получении от него открытого ключа и сведений, подлежащих включению в Свидетельство, которое имеет обязательные атрибуты:

наименование пользователя закрытого ключа (фамилия, имя, отчество гражданина);

регистрационный номер;

наименование и местонахождение Удостоверяющего центра;

дата выдачи Свидетельства электронно-цифровой подписи и дата окончания срока его действия;

наименование средств электронно-цифровой подписи;

открытый ключ;

сведения о порядке предоставления открытого доступа коткрытому ключу (в частности, указание адреса электрон­ной почты сети Интернет). Порядок получения Свидетельства показан на рис. 2.62.

Использование электронно-цифровой подписи государст­венными органами и органами местного самоуправления долж­но производиться в порядке, установленном законом. Форми­рование и распределение закрытых ключей для федеральных и иных органов власти, органов местного самоуправления долж­но производиться организациями, уполномоченными на совер­шение указанных действий Правительством Российской Феде­рации.

При направлении органами государственной власти и орга­нами местного самоуправления документов в электронной фор­ме, указанные документы должны быть подписаны электрон­но-цифровой подписью должностного лица соответствующего органа государственной власти, уполномоченного на подписание официальных документов от имени такого органа.

Особенности применения электронно-цифровой подписи при выполнении процессуальных действий органами судебной власти и органами охраны правопорядка должны устанавливаться гражданско-процессуальным, арбитражно-процессуальным и уголовно-процессуальным законодательством Российской Феде­рации (рис.2.63).

Порядок работы с ЭЦП следующий при сохранения документа необходимо открывать опцию в меню Офис – 2007 «Подготовить» и после включения спецустройства ЭЦП на системном блоке, нажать «Добавить ЭЦП».

Документы в электронной форме, подписанные электрон­но-цифровой подписью, должны приниматься судами в качестве письменных доказательств. При наличии спора о достоверности электронно-цифровой подписи к соответствующему электрон­но-цифровому сообщению должна быть представлена надлежа­ще заверенная копия Свидетельства электронно-цифровой подписи. Лица, неправомерно использующие электронно-цифровую подпись другого лица, должны нести гражданскую, администра­тивную и уголовную ответственность в порядке, установленном законодательством Российской Федерации. Пользователи закры­тых ключей электронно-цифровой подписи должны нести ответ­ственность за необеспечение соответствующей охраны закрытого ключа, обязаны направить Удостоверяющему центру, выдавше­му Свидетельство электронно-цифровой подписи, заявление с требованием прекращения действия данного Свидетельства.

При проверке подписи проверяющий должен располагать открытым ключом абонента, поставившего подпись, причем ключ должен быть аутентифицирован, т. е. данный открытый ключ должен соответствовать тому абоненту, который выдает себя за «хозяина». В случае, когда

Рис.2.62. Схема получания электронной подписи

Рис.2.63. Порядок работы электронной подписи

абоненты самостоятельно об­мениваются ключами, эта уверенность может подкрепляться связью по телефону, личным контактом или любым другим спо­собом. Если абоненты действуют в сети с выделенным Удостове­ряющим центром, открытые ключи абонентов подписываются (сертифицируются) центром, и непосредственный контакт або­нентов между собой (при передаче или подтверждении подлин­ности ключей) заменяется на контакт каждого из них в отдель­ности с Удостоверяющим центром.

Процедура проверки электронно-цифровой подписи состоит из двух этапов: вычисления хэш-функции документа и собствен­но математических вычислений, предусмотренных в данном ал­горитме подписи. Математические вычисления заключаются в проверке того или иного сообщения, связывающего хэш-функ­цию документа, подпись под этим документом и открытый ключ подписавшего абонента. Если рассматриваемое соотношение оказывается выполненным, то подпись признается правильной, сам документ считается измененным, а подпись под ним — не-действительной.

Программные средства автоматизации переводов

Глобализация и интеграция мировых процессов сделали проблему взаимопонимание различных народов особенно актуальной. К тому же Интернет открыла доступ к мировым многоязычным информационным ресурсам, и все это в комплексе является мощным стимулом развития переводческих услуг. Традиционный перевод текстов, т. е. без применения средств автоматизации, многих перестает устраивать, поскольку требует больших затрат времени. Какие средства автоматизации перево­да текстов появились благодаря возможностям компьютера?

Прежде всего это текстовый редактор, сокративший время на последующее редактирование перевода, а также многочислен­ные электронные словари, позволяющие быстро и без труда на­ходить требуемое значение любого слова и вставлять его в пере­веденный текст. Применение только этих средств обеспечило рост производительности перевода на 20—30% по сравнению с ручной работой.

Следующим шагом автоматизации перевода стало примене­ние систем Translation Memory (TM) и технологий машинного перевода (МП). Принцип работы систем ТМ построен на сравне­нии текста, подлежащего переводу, с внутренней базой, храня­щей разбитый на предложения параллельный текст на исходном язьке и его перевод, полученный традиционным способом. При загрузке нового документа в ТМ-систему происходит его разделе­ние на сегменты и сопоставление с текстами из базы. Часть этих фрагментов оказывается уже переведенной ранее, и система визуа­лизирует их как уже известные, другие — как частично совпада­ющие с БД, а некоторые — как требующие перевода.

Таким образом, переводчику не нужно тратить усилия на то, что он уже делал прежде. Подобные системы оказываются весьма эффективными при переводе аналогичных документов, например, повторяющейся технической документации: ее можно перевести один раз, а для последующих выпусков достаточно переводить лишь изменения в первоисточнике.

Наиболее известными системами ТМ в настоящее время являются Trados TWB и Transit. Они используются в большинстве переводческих бюро мира. В России они пока не получили широ­кого распространения в силу относительно высокой стоимости.

Технологии МП тоже нашли определенное место при автома­тизации процесса переводов, но наибольшую эффективность обеспечивает комплексное решение, опирающееся на все имею­щиеся в настоящий момент лингвистические технологии машин­ного перевода.

Работы по машинному переводу начались с середины 1950-х гг. Это интересно. В 2004 г. отмечался неофициальный юбилей — 50-летие машинного перевода. В далеком 1954 г. в Джорджтаунском университете (США) были проведены первые эксперименты, доказавшие саму возможность с помощью ЭВМ переводить тексты с одного языка на другой. 50 лет назад машины были «слабыми», поэтому пользоваться можно было только ограниченным набором лингвистических средств. Именно поэтому тогда использовались пословный пере­вод и словосочетания, но преимущественно в идиоматических выражениях. По мере развития вычислительной техники подхо­ды к машинному переводу менялись.

Активные исследования в области машинного перевода ве­лись и за рубежом силами таких известных компьютерных линг­вистов, как А. Эттингер (США), И. Бар-Хиллер (США), Н. Хомски (Израиль). Наибольшую известность приобрели труды япон­ского ученого М. Нагао, который предложил использовать при машинном переводе уже готовые, занесенные в память ЭВМ ва­рианты прочтения исходных текстов, ранее сделанных опытны­ми лингвистами. Эти труды и легли в основу методики Transla­tion Memory («Память переводчика»), широко используемой до сих пор при переводе документации в крупнейших корпорациях мира.

У нас в стране пионерами теории машинного перевода были Д. Ю. Панов, А. А. Ляпунов и И. С. Мухин. В их трудах заложен фундамент, на основе которого в наши дни развиваются такие известные системымашинного перевода, как PROMT, «Сократ» и более менее новая Retrans Vista.

В России программа-переводчик четвертого поколения PROMT-98 (1998 г.) состоит из трех компонентов, объ единенных оболочкой: PROMT — среда переводчика; File Translator — приложение для пакетной обработки большого количества документов; Web View — браузер с синхронным переводом HTML-страниц.

В основе программ-переводчиков четвертого поколения лежит технология HTML-to-HTML, позволяющая переводить Web - страницы с полным сохранением форматирования и впоследствии двигаться по переведенным ссылкам. В 1998 г. появляется также новая версия переводчика для Интернета — WebTranSite-98 и версия 1.0 переводчика для карманных компьютеров — Pocket PROMT.

WebTranSite-98 отличается от предыдущей версии возможно, стью подключения дополнительных словарей, улучшающих ка-чество перевода, и новой системой поиска, которая служит для формирования запросов разной сложности на родном языке, их перевода и отправки на один из популярных поисковых серверов.

Pocket PROMT открывает новую линию программных про­дуктов компании, ориентированную на платформу Windows СЕ для карманных компьютеров. Текст для перевода можно наби­рать на клавиатуре либо открыть готовый небольшой файл раз­мером до 32 Кбайт в текстовом формате или формате Pocket Word.

В 2000 г. компания PROMT выпустила «двухтысячные» вер­сии своих трех главных переводческих пакетов: профессиональ­ного — PROMT Translation Office 2000, для Интернета—PROMT Internet-2000 и домашнего — Magic Gooddy-2000.

В состав пакета PROMT Translation Office 2000 входят восемь компонентов: SmarTool (Microsoft Office 97/2000 Support) Mail Translator, PROMT, Dictionary Editor, Electronic Dictionary (входит в комплект «Гигант» и ERRE), WebWiew, QTrans, Clipboard Trans­lator и Integrator.

Многоязычные переводчики PROMT Translation Office 2000 и PROMT Internet поддерживают семь направлений перевода с уча­стием русского языка, в том числе с итальянского на русский-Интерфейс PROMT Translation Office и PROMT Internet оформле­ны в стиле Office 2000.

Соседние файлы в папке УчПосИТ СБ