
Под информационной системой понимают систему, функционирование которой связано с формированием, регистрацией, сбором, обработкой и хранением информации, адекватно отражающей состояние определенных объектов в процессе их развития.
«Архитектура ИС — это набор решений, наиболее существенным образом влияющих на совокупную стоимость владения системой».
«Архитектура ИС — это набор ключевых решений, неизменных при изменении бизнес-технологии в рамках бизнес-видения».
Конструктивно архитектура обычно определяется как набор ответов на следующие вопросы: — что делает система; — на какие части она разделяется; — как эти части взаимодействуют; — где эти части размещены.
Таким образом архитектура ИС является логическим построением, или моделью, и влияет на совокупную стоимость владения через набор связанных с ней решений по выбору средств реализации СУБД.
Требования к методике выбора архитектуры.
Методика должна:
отражать связь архитектуры и совокупной стоимости владения;
связывать разработку архитектуры, бизнес-анализ и технико-экономическое обоснование в едином процессе;
отражать итерационную природу разработки ИС;
иметь своей целью выбор архитектуры системы в целом, а не только ее программной составляющей.
На основе вышесказанного получаем следующую методику выбора архитектуры ИС.
1. Проводится описание бизнес-процессов в организации с ограниченным уровнем детальности. Описание бизнес-процесса должно включать его целевые нефункциональные характеристики (частоту возникновения, продолжительность и т. п.).
2. На основе описания бизнес-процессов описываются бизнес-риски. Каждый бизнес-риск оценивается в терминах бизнес-потерь.
3. Определяются возможные вариации бизнес-процессов. На их основе описываются неопределенности.
4. На основе описания бизнес-процессов описываются архитектурно-значимые функциональные модули системы. Описание каждого модуля включает функции и данные, объединяемые в данный модуль.
5. Строятся архитектуры-кандидаты с учетом нефункциональных требований к системе и неопределенностей. Различные архитектуры-кандидаты реализуют один и тот же набор функций и функциональных модулей и отличаются только способами физического размещения и реализации этих модулей.
6. Выбираются необходимые для реализации архитектуры элементы инфраструктуры — аппаратные средства, операционная система, СУБД, инструментальные средства, прикладные комплексы. Для каждого элемента инфраструктуры рассматриваются варианты его реализации. Оцениваются стоимость владения каждым элементом инфраструктуры архитектуры-кандидата в течение планового периода жизни системы и вероятности возникновения технических рисков в виде отказов элементов инфраструктуры архитектуры-кандидата.
7. Строится матрица соответствия элементов архитектуры-кандидата и операций. На основе этой матрицы и матрицы соответствия статических бизнес-рисков и операционных рисков строится матрица соответствия технических рисков и бизнес-рисков. Если целью является именно построение архитектуры, то нужно вывести из рассмотрения те бизнес-риски, которые во всех архитектурах-кандидатах реализуются совершенно одинаково, и далее установить соответствие между оставшимися рисками и вариантами бизнес-использования
8. На основе матрицы соответствия технических рисков и бизнес-рисков для каждой архитектуры-кандидата и каждого варианта инфраструктуры оценивается часть общей стоимости владения системой, ассоциированная с бизнес-рисками. Выбираются оптимальные для каждой архитектуры-кандидата элементы инфраструктуры.
9. В качестве архитектуры системы выбирается архитектура-кандидат с минимальной оценкой совокупной стоимости владения.
2. Документ является основным способом представления информации, на основе которой функционирует любое предприятие, т.е. это некая обособленная часть информации представленная на определенном носителе.
Много времени сотрудник тратит на поиск необходимых для работы документов.
Нужно отметить еще и фактор повышения безопасности при работе с документами - организация глубокой системы защиты документов, в зависимости от операций и пользователей, позволяет защитить документы от несанкционированного доступа. Кроме того, запись всех операций с документов позволяет восстановить всю историю действий с ними.
Общие требования к системе документооборота
1. Масштабируемость
Желательно, чтобы система документооборота могла поддерживать как пять, так и пять тысяч пользователей, и способность системы наращивать свою мощность определялось только мощностью соответствующего аппаратного обеспечения.
2 Распределенность
Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура системы должна поддерживать взаимодействие с удаленными пользователями.
3. Открытость
Система документооборота не может и не должна существовать в отрыве от других систем, например иногда необходимо интегрировать систему с прикладной бухгалтерской программой. Тогда система документооборота должна иметь открытые интерфейсы для возможной доработки и интеграции с другими системами.
Задачи, решаемые системами документооборота
Спектр задач и соответственно необходимая система автоматизации определяются стадией жизненного цикла документа, которую необходимо поддерживать. Жизненный цикл документа состоит из двух основных стадий.
1. Стадия разработки документа, которая может включать:
собственно разработка содержания документа; оформление документа; утверждение документа.
В том случае если документ находится на стадии разработки, то он считается неопубликованным, и права на документ определяются правами доступа конкретного пользователя.
2. Стадия опубликованного документа, которая может включать:
активный доступ; архивный документ: краткосрочного хранения; долгосрочного хранения; уничтожение документа.
Когда документ переходит на вторую стадию, он считается опубликованным, тогда права на документ остаются только одни - доступ на чтение.
Система САДО (система автоматизации деловых операций) и Д (документооборот) позволяют автоматизировать рутинные операции, передавать и отслеживать перемещение документов.
Можно выделить два класса подобных систем:
Системы work flow;
Системы groupware.
Основное назначение систем обоих классов – автоматизация и поддержка коллективной работы в офисе, однако имеются некоторые различия в их назначении и, следовательно, в наборе реализуемых функций.
Основные характеристики систем автоматизации документооборота
Системы класса groupware |
Системы класса work flow |
Множество работающих |
Множество работающих |
Одна выполняемая задача, т.е поддерживается коллективная работа с одной задачей в данный момент времени. |
Множество выполняемых задач, т.е. поддерживается многопользовательская работа с несколькими задачами одновременно. |
Отсутствие структуризации в организации работ, т.е. нет никаких правил и предписаний кто и как должен работать в рамках системы. |
Строгая структуризация, т.е. выполнение работ строго расписано по ролям, документам, времени обработки документов. |
Реализация на РС и ориентация на небольшие коллективы |
Реализация в среде «клиент-сервер» и ориентация на масштаб всей организации |
Т.о. системы класса groupware ориентированы на автоматизацию работы небольшого коллектива и поддерживают корректное разделение, т.е. совместное использование информации группой пользователей. Системы класса work flow ориентированы на автоматизацию работы корпорации и поддерживают разделение работ, т.е выполнение одной большой работы группой исполнителей.
Системы work flow и groupware не конкурируют между собой, а скорее дополняют друг друга. Выбор одной из них, а также использование их в комбинации определяются задачами, решаемыми организацией.
3.Системы управления электронными документами EDMS (Electronic Document Management) призваны:
сократить поток бумажных документов;
уменьшить сложности, возникающие при их хранении, поиске и обработке.
В отличие от документов на бумажных носителях электронные документы обладают преимуществом при создании, совместном использовании, поиске, распространении и хранении информации.
Системы EDMS реализуют ввод, хранение и поиск всех типов электронных документов, как текстовых, так и графических. С помощью систем этого класса можно организовать хранение в электронном виде административных финансовых документов, факсов, технической библиотеки, изображений, т.е. всех документов, входящих в организацию и циркулирующих в ней.
На рынке предлагается более 500 систем EDMS. Технологически они различаются по способу индексирования и поиска информации. Основной способ ввода документов в систему – сканирование, хотя информация может поступать с магнитных носителей, через модемы и т.д.
В системах EDMS первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов, по которым и происходит поиск необходимой информации. В качестве примеров таких систем можно привести программные продукты: Soft Solutions, DocuData (Laser Data), WorkFLO Business System (FileNet).
В более поздних системах EDMS используется технология распознавания символов (OCR – Optical Character Recognition). После сканирования и ввода документа в систему происходит переход графического образа документа в текстовый файл, после чего следует достаточно трудоемкий процесс исправления ошибок, допущенных при распознавании. Необходимая информация ищется с помощью механизма четкого поиска по полному содержанию документа. Примером систем, использующих описанную технологию могут служить: ZyIMAGE (ZyLAB Division of ODI), Topic (Verity), BRS/Search (Datawere).
В начале 90-х годов на рынке систем EDMS появились новые разработки с использованием новейших технологий и искусственного интеллекта. В системах третьего поколения, реализован нечеткий поиск по полному содержанию документа и очень «компактное» индексирование (30% от исходного текста).
Нечеткий поиск означает индифферентность к ошибкам, как во входном потоке, так и в формулировке запроса, т.е. он сокращает до минимума влияние ошибок распознавания символов, ошибок набора на клавиатуре при вводе данных, а также ошибок правописания в запросах поиска.
С помощью механизма нечёткого поиска можно найти то, что необходимо, если вы не знаете, как это пишется; забыли, как называется; или если оказалось неправильно зарегистрировано. Система всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса, по которому проводится поиск.
На рынке коммерческие системы EDMS третьего поколения представлены программным продуктом: EFS (Excalibur Technologies Corp).
Пакет Excalibur EFS базируется на технологии адаптивного распознавания образов APRP (Adaptive Patten Recognition Processing), разработанной компанией Excalibur Technologies и реализованной в пакете с использованием механизма нейронных сетей.
Технология APRP обеспечивает автоматическую индексацию всего содержимого документа, что исключает необходимость выбирать ключевые слова вручную и даёт возможность проведения нечёткого поиска любого слова в документе.
Это означает, что в экстремальной ситуации пользователю системы Excalibur EFS не нужно беспокоиться о том, как вспомнить правильное название документа, точную фразу или правильное название документа, чтобы получить именно ту информацию, которая ему нужна в данный момент.
СУБД, системы work flow и системы EDMS – это средства управления информационными потоками. Рассмотрим их краткие характеристики:
|
Назначение |
Примечание |
СУБД (система управления базой данных) |
Ввод, хранение и поиск структурированной информации в электронной форме |
Это только 15% информации, в которой приходится работать |
EDMS (система управления документами) |
Ввод, хранение и поиск неструктурированной информации в электронной форме |
Это 85% всей информации, которая проходит через организации, включая бумажные документы, переведенные в электронную форму |
Система work flow (автоматизации документооборота) |
Управление, маршрутизация, координация передвижением документов в рамках КИС и контроль за своевременной обработкой документов |
Системы могут быть интегрированы как с СУБД, так и с EDMS |
Комбинации технологий СУБД, work flow и EDMS и, соответственно, интеграция программных продуктов, реализующих эти технологии, позволяет полностью решить проблему автоматизации работы с документами любого вида в организации любого рода деятельности.
4. Необходимо отметить специальный класс приложений (СППР) – позволяющий моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Системы подобного класса основаны на технологии искусственного интеллекта.
Различают два направления в развитии систем искусственного интеллекта:
Технология вывода, основанного на правилах;
Технология вывода, основанного на прецедентах.
Практически все ранние экспертные системы моделировали процесс принятия экспертом решения как чисто дедуктивный процесс с использованием вывода, основанного на правилах. Это означало, что в систему закладывалась совокупность правил «если…то…», согласно которым на основании входных данных генерировалось то или иное заключение по интересующей проблеме. Однако с течением времени было осознано, что дедуктивная модель эмулирует один из наиболее редких подходов, которому следует эксперт при решении проблемы.
На самом деле, вместо того, чтобы решать каждую задачу, исходя из первичных принципов, эксперт часто анализирует ситуацию в целом и вспоминает, какие решения принимались ранее в подобных ситуациях.
Затем он либо непосредственно использует эти решения, либо при необходимости, адаптирует их к обстоятельствам, изменившимся для конкретной проблемы.
Моделирование подхода к решению проблем, основанного на опыте прошлых ситуаций, привело к технологии вывода, основанного на прецедентах (Case Based Reasoning или CBR), и в дальнейшем к созданию программных продуктов, реализующих эту технологию.
Прецедент – это описание проблемы или ситуации в совокупности с подробным описанием действий, предпринимаемых в данной ситуации или для решения данной проблемы. Хотя не все CBR-системы полностью включают этапы, приведенные ниже, подход, основанный на прецедентах, в целом состоит из следующих этапов:
Получение подробной информации о текущей проблеме;
Сопоставление (сравнение) этой информации с деталями прецедентов, хранящихся в базе, для выявления аналогичных ситуаций;
Выбор прецедента, наиболее близкого к текущей проблеме, из базы прецедентов;
Адаптация выбранного решения к текущей проблеме, если это необходимо;
Проверка корректности каждого вновь полученного решения;
Занесение детальной информации о новом прецеденте в базу прецедентов.
Таким образом, вывод, основанный на прецедентах, представляет собой метод построения экспертных систем, которые делают заключения, относительно данной проблемы или ситуации по результатам поиска аналогий, хранящихся в базе прецедентов.
Не стоит, однако, рассчитывать, что экономическая система будет действительно принимать решения. Принятие решения всегда остается за человеком, а система лишь предлагает несколько возможных вариантов и указывает самый разумный с ее точки зрения.
Реально на рынке предлагаются лишь несколько коммерческих продуктов, реализующих технологию вывода, основанного на прецедентах (CBR Express, Case Point (Inference Corp), Apriori (Answer System) и др.). Это объясняется в первую очередь, сложностью алгоритмов и их эффективной программной реализацией.
Системы поддержки принятия решений – мощнейший инструмент, позволяющий верно применять действующее законодательство и правильно ориентироваться в практических ситуациях.
Позволяют моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Системы этого класса основаны на технологии искусственного интеллекта.
5. База данных – это именованная совокупность структурированных данных, отображающих состояние объектов и их отношений в рассматриваемой предметной области.
совокупность взаимосвязанных данных, используемых одним или несколькими приложениями и хранящихся вместе с минимальной избыточностью. Данные запоминаются так, чтобы они были независимыми от использующих их программ. Для добавления новых данных, модификации и выборки существующих данных применяется общий управляемый способ. Считается, что система содержит совокупность баз данных
Основные понятия БД: CУБД, администратор БД, словарь данных.
СУБД – совокупность языковых и программных средств, предназначенных для ведения и совместного использования ДБ пользователями.
Администратор БД – человек, который координирует проектирование, обработку и ведение БД.
Словарь данных – это средство, которое позволяет при проектировании, эксплуатации и развитии базы данных поддерживать и контролировать информацию о данных
Основные элементы базы данных: элемент данных, агрегат данных, запись, наборы данных, БД
Элемент данных - наименее семантически значимая поименованная единица информации. У элемента данных есть имя, тип (символ, число), длина, точность (количество знаков после запятой).
Агрегат данных – поименованная совокупность элементов данных внутри записи, и которую можно рассматривать как единое целое.
Агрегаты:
- простой (например, дата: год/число/месяц)
- сложный (например, п/п: наименование/адрес. Адрес: город/улица/дом).
Запись – поименованная совокупность элементов данных или агрегатов данных. Элементы данных еще называют “поле данных”.
Базы данных:
- централизованные – хранятся в памяти одной вычислительной системы;
- распределенные – хранятся в различных узлах сети.
База данных представляет собой информационную модель того объекта (организации или предприятия), информация о котором требуется пользователю для эффективного управления этим объектом.
Т.о., база данных ориентирована на интегрированные требования, а не на одну программу, и служит для удовлетворения информационных потребностей многих пользователей. В связи с этим БД позволяют в значительной степени сократить избыточность информации и тем самым сравнительно легко обеспечить поддержание целостности базы. Одним из наиболее важных преимуществ БД является обеспечение независимой логической организации данных от физической. Это означает, что пользователь не должен беспокоиться о последствиях изменения параметров физической организации или типов устройств ЭВМ. Благодаря этому облегчается создание прикладных программ и увеличивается время их жизнеспособности.
База данных – это специальным образом организованные данные, единство и целостность которых поддерживается специальными программными средствами.
БД является современной формой организации, хранения и доступа к информации.
БД обычно создаются для многоцелевого использования, а не для решения какой-либо одной задачи.
Предметная область – часть реального мира, которая описывается или моделируется с помощью БД и использующих их приложений
Часть информационного пространства, отображающего потребности некоторого ограниченного круга пользователей БД
Основные понятия БД: CУБД, администратор БД, словарь данных.
СУБД – программная система, предназначенная для создания на ЭВМ общей БД для множества приложений, поддержания ее в актуальном состоянии и обеспечения эффективного доступа пользователей к содержащимся в ней данным в рамках предоставляемых им полномочий.
Администратор БД – человек, который координирует проектирование, обработку и ведение БД.
Словарь данных – это средство, которое позволяет при проектировании, эксплуатации и развитии базы данных поддерживать и контролировать информацию о данных
Основные элементы базы данных: элемент данных, агрегат данных, запись, наборы данных, БД
Элемент данных - наименее семантически значимая поименованная единица информации. У элемента данных есть имя, тип (символ, число), длина, точность (количество знаков после запятой).
Агрегат данных – поименованная совокупность элементов данных внутри записи, и которую можно рассматривать как единое целое.
Агрегаты:
- простой (например, дата: год/число/месяц)
- сложный (например, п/п: наименование/адрес. Адрес: город/улица/дом).
Запись – поименованная совокупность элементов данных или агрегатов данных. Элементы данных еще называют “поле данных”.
Базы данных:
- централизованные – хранятся в памяти одной вычислительной системы;
- распределенные – хранятся в различных узлах сети.