Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Voprosy_IGME.doc
Скачиваний:
8
Добавлен:
01.05.2025
Размер:
3.64 Mб
Скачать
  1. Обеспечение управления

а) Управляющий блок содержит элементы, обеспечивающие управление системой и технологию работы отдельных приложений. Этот блок представляет собой администраторскую и управляющую часть.

  1. Обеспечение бизнес-процессов

б) Конвейерный блок - содержит элементы, составляющие группы решения, обеспечивающих производственный цикл работы ИС

в) Учетный блок - содержит элементы, обеспечивающие учетные функции системы.

Структура приложений в ИС.

Пользовательские приложения могут быть классифицированы не только по их функциональной принадлежности к той или иной группе, но и по формам организации отношений между ними.Форма организации взаимодействия пользовательских приложений в единую систему может иметь следующий вид:

Технологическая организация;

Временная организация;

Административная организация.

Структура хранения информации в ИС.

При проект-ии структуры хранения инф следует учитывать не только требования, но и жизненный цикл инф.

ЖЦ инф отражает то, что все данные введенные в БД имеют опр временной интервал существования.

Различают следующие группы хранения информации ИС:

Технологическая - таблицы, которые обеспечивают ЖЦ информации.

Обеспечивающая - таблицы, которые обеспечивают техн процесс и отличны от техн информации.

Архивная - информация, которая уже использована и носит эпизодический характер.

Классификация ИС. ИС можно классифицировать по ряду различ. признаков. В основу рассматриваемой класс-и положены наиболее существенные признаки, определ-щие функц-ые возможности и особенности построения соврем. сис-м. В зав-и от объема решаемых задач, используемых технических средств, организации функционирования, информационные системы делятся на ряд групп

По типу хранимых данных ИС делятся на: фактографические, документальные

Факт-ие сис-ы предназначены для хранения и обработки структурированных данных в виде чисел и текстов. Над такими данными можно выполнять различные операции.

В докум-ых сис-ах инф-я представлена в виде док-ов, сост-их из наименований, опис-ий, рефератов и текстов.

По степени автоматизации информационных процессов ИС делятся на:

ручные - характеризуются отсутствием современных технических средств переработки информации и выполнением всех операций человеком.

автоматические - все операции по переработке информации выполняются без участия человека.

автоматизированные - предполагают участие в процессе обработки информации и человека, и технических средств, причем главная роль в выполнении рутинных операций обработки данных отводится компьютеру.

В зав-и от характера обработки данных ИС делятся на: информационно-поисковые, инф-но-решающие.

Инф-поисковые сис-ы производят ввод, систематизацию, хранение, выдачу инф-ии по запросу польз-я без сложных преобразований данных. (ИС библиотечного обслуживания, бронирования мест в гостиницах и пр.)

Инф-решающие системы осущ-ют, кроме того, операции переработки инф-ии по определенному алгоритму.

По характеру использования выходной информации ИС делятся на: управляющие, советующие.

Результ-ая инф-ия управл-их ИС непосредственно трансформируется в принимаемые человеком решения. Для этих систем характерны задачи расчетного характера и обработка больших объемов данных. (Например, ИС планирования производства или заказов, бухгалтерского учета.)

Советующие ИС вырабатывают инф-ию, кот. принимается человеком к сведению и учитывается при формировании управленческих решений, а не инициирует конкретные действия. Эти системы имитируют интеллектуальные процессы обработки знаний, а не данных. (Например, экспертные системы.)

В зависимости от сферы применения различают следующие классы ИС:

ИС организационного управления - предназначены для автоматизации функций управленческого персонала как промышленных предприятий, так и непромышленных объектов (гостиниц, банков, магазинов и пр.).

ИС управления технологическими процессами (ТП) - служат для автоматизации функций производственного персонала по контролю и управлению производственными операциями. ИС автоматизированного проектирования (САПР) – предназнач. для автомат-ии функций инженеров-проектировщиков, конструкторов, архитекторов, дизайнеров при создании новой техники или технологии. Осн функциями подобных систем являются: инженерные расчеты, создание графической документации (чертежей, схем, планов), создание проектной документации, моделирование проектируемых объектов.

Интегрированные (корпоративные) ИС - используются для автом-ии всех функций фирмы и охватывают весь цикл работ от планирования деятельности до сбыта продукции. Они включают в себя ряд модулей (подсистем), работающих в едином информационном пространстве и выполняющих функции поддержки соответствующих направлений деятельности.

  1. Документальные системы: информационно-поисковые (ИПС), информационно-логические (ИЛС), информационно-семантические системы (ИСС). Анализ информационных потребностей и виды информационного обслуживания индексирования.

Назначение, структурное построение и конкретные функ­ции информационно-поисковых языков могут стать понятны­ми при анализе устройства и функционирования сложных си­стем, в рамках которых они создаются. Речь идет об инфор­мационно-поисковых системах (ИПС).

Назначение ИПС — отыскивать информацию — явствует уже из их названия. Обычно ИПС является главной частью системы информационного обслуживания (или обеспече­ния) — сокращенно ИСО — или какой-либо системы управ­ления.- Примерами систем информационного обслуживания являются: система АСИНИТ Всесоюзного научно-техниче­ского центра (ВНТИЦ) Государственного комитета СССР по науке и технике; система АССИСТЕНТ Всесоюзного ин­ститута научной и технической информации (ВИНИТИ) ГКНТ и АН СССР, научно-технические библиотеки [22; 23; 59; 76].

Примером систем информационного обеспечения нужд уп­равления в области стандартизации является автоматизиро­ванная информационно-управляющая система (АИУС) Гос­стандарта и входящая в ее состав автоматизированная систе­ма научно-технической информации по нормативно-техниче­ской документации (АСНТИ по НТД) [25; 26].

В зависимости от характера информация, которая требу­ется абонентам систем информационного обслуживания, помещается в фонды и поисковые массивы ИПС. Последние разделяются на два основных класса: документальные (или документографические) и фактографические.

В документальных ИПС производится обработка доку­ментальных материалов с целью создания их формализован­ного описания, включающего в число прочих сведений поис­ковый образ документа (ПОД). Кроме того, в них получают формализованные описания запросы абонентов системы информационного обслуживания, называемые  поисковыми предписаниями (ПП). На основе сравнения поисковых обра­зов документов с поисковыми предписаниями документаль­ная ИПС выдает абонентам документы, первоначально поме­щенные в ее фонд.

В фактографических ИПС имеет место более сложный процесс работы. Первоначально документальные материалы анализируются с целью отбора нужных сведений (или фак­тов). Отобранные сведения образуют особый фонд. Каждый факт получает в нем свое индивидуальное формализованное описание или поисковый образ [1; 2; 76]. Там же производят формализованное описание информационных запросов або­нентов, в результате чего получают поисковые предписания. После сравнения поисковых образов фактов с поисковыми предписаниями фактографическая ИПС выдает абонентам непосредственно факты, а не информационные документы, из которых эти факты были взяты.

Логические ИПС.

Логические ИПС или информационно-логические си­стемы (ИЛС) не только выдают по требованию ранее введенную в них информацию, но выполняют, если это необходимо, логическую переработку этой информации с целью ее преобразования и получения новой инфор­мации, которая в явном виде в систему не вводилась.

Анализируя содержание информационных потребностей и их удовлетворение разными, в том числе и массовыми, средствами общения, следует учитывать образ жизни населения. Это позволит объяснить закономерности формирования аудитории СМИ, а также причины неодинаковой эффективности использования отдельных каналов информации определенными группами населения. Проведенные социологические исследования показывают, что увеличение роли телевидения в удовлетворении информационных и культурных запросов особенно заметно в группах, чей образ жизни характеризуется, во-первых, повышением степени урбанизированности среди населения малых городов и сел, во-вторых, большим количеством свободного времени, в третьих, большей ориентацией на домашнее времяпрепровождение, в-четвертых, ограниченными объективными и субъективными возможностями участия в активных формах духовной жизни. В то же время такие характеристики образа жизни, как проживание в культурных центрах, меньшая включенность в бытовые заботы, повышенная активность участия  в общественной работе, трудовая деятельность, связанная с решением управленческих, общественных и творческих проблем, порождают специфический комплекс информационных потребностей, которые удовлетворяются чтением газет, книг, журналов. Таким образом, если эффективность телевидения зависит от факторов вне трудовой сферы, то обращение человека к газетам, журналам, книгам (в том числе и к специальной литературе) связано в первую очередь с характером его профессиональной деятельности, статусом личности, т. е. с его трудовой сферой. Это обусловливает выбор целей деятельности СМИ и критериев эффективности, Функции, которые выполняют средства массовой информации, оказываются различными для разных групп населения в зависимости от образа жизни, информационных потребностей аудитории. Например, для определенных групп населения телевидение стало доминирующим каналом удовлетворения всех культурных запросов и интересов, занимая большую часть их свободного времени. А для людей, активно вовлеченных в другие виды духовной жизн и и пользующихся широким спектром источников печатной и межличностной информации, телевидение выполняет лишь второстепенные функции. Среди факторов, определяющих как изменение образа жизни, так и содержание информационных потребностей личности, первостепенную роль играет уровень образования. Повышение образования имеет двоякое влияние на характер информационных потребностей и эффективность СМИ в их удовлетворении. До получения среднего образования наблюдается постепенное развитие информационных потребностей «вширь» и повышение активности потребления массовой информации в целом. Особенно быстро возрастает роль телевидения. Дальнейшее повышение уровня образования такого резкого «расширяющего» влияния на информационные потребности не оказывает. В возрасте старше 18 лет основное значение приобретает тип образования (гуманитарное, техническое и т.п.), в соответствии с которым происходит углубление и дифференциация информационных потребностей, а также функций, выполняемых СМИ. Общим для групп различного типа высшего образования является возрастание роли и эффективности использования печатных источников информации, а также межличностного об щения на работе. В использовании же телевидения как средства приобщения к культуре наблюдаются заметные различия: в группах с техническим, сельскохозяйственным, экономическим высшим образованием эффективность телевидения остается сравнительно высокой, в то же время люди с высшим гуманитарным образованием ставят на первое место литературно-общественные журналы, книги и т. д., оставляя телевидению лишь роль информатора о текущих событиях культурной и политической жизни и развлекателя. Рассмотрение проблемы эффективности СМИ с точки зрения удовлетворения и развития информационных потребностей аудитории дает возможность более точно определить роль каждого конкретного канала массовой информации в общей системе идеологической работы, выявить резервы и недостатки, которые мешают слаженной и эффективной деятельности всей информационной системы современного общества. 

Понятие информационного поиска появилось только в середине прошлого века. Оно объединило такие, казалось бы, разные виды деятельности, как составление библиотечных каталогов и библиографических указателей, организация библиотек и справочно-информационного обслуживания, архивное дело, создание словарей, справочников, энциклопедий, вспомогательных указателей к монографиям и сборникам.

  1. Структура и логико-семантический аппарат ИПС: информационно-поисковый язык, система индексирования, критерии смыслового соответствия. Критерии оценки документальных систем (семантические: релевантность, пертинентность; технические: скорость поиска, сложность, экономичность и т.п.). Технологии поиска.

Лингвистическое обеспечение - это логико-семантический аппарат, состоящий из информационно-поискового языка, правил применения (методик индексирования), критерия выдачи и других языковых средств.

Информационно-поисковый язык системы  Однако, индекс - это только часть поискового аппарата, причем не видная глазу пользователя. Второй частью этого аппарата является информационно-поисковый язык. ИПЯ позволяет сформулировать запрос к системе в довольно простой и доходчивой форме. Уже давно осталась позади романтика создания ИПЯ, как естественного языка. Именно этот подход использовался в системе Wais на первых стадиях ее реализации. Если даже пользователю предлагается вводить запросы на естественном языке, то это не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из этого списка удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR. Таким образом запрос типа:  >Software that is used on Unix Platform будет преобразован в:  >Unix AND Platform AND Software что будет означать примерно следующее: "Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно".  Возможны и варианты. Так в большинстве систем фраза "Unix Platform" будет опознана как ключевая фраза, и не будет разделяться на отдельные слова. Вообще говоря, и все три слова могут быть опознаны как одна ключевая фраза. Другой подход заключается в вычислении близости между запросом и документом. Именно этот подход используется в Lycos, например. В этом случае, в соответствии с векторной моделью представления документов и запросов вычисляется мера близости. К настоящему времени известно около дюжины различных мер близости. Наиболее часто применяется cos угла между поисковым образом документа и запросом пользователя. Именно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.  Наиболее продвинутым языком запросов из современных информационно-поисковых систем Internet обладает AltaVista[4]. Кроме обычного набора AND, OR, NOT, эта система позволяет использовать еще и NEAR. Последний оператор позволяет организовать контекстный поиск. Все документы в системе разбиты на поля, поэтому в запросе можно указать в какой части документа пользователь хочет увидеть ключевое слово (в ссылке, заголовке и т.п.). Можно также задать поле ранжирования выдачи и критерий близости документов запросу. 

Критерий смыслового соответствия ( КСС) - совокупность правил, по которым определяется степень смысловой близости между поисковым образом документа и поисковым предписанием. [1]

Критерий смыслового соответствия, критерий релевантности ( документов, данных) [ relevancy criterion ] - признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой. [2]

Критерий смыслового соответствия на вхождение - в двух режимах: с предпочтением и экстремальный. [3]

Наиболее простым и распространенным критерием смыслового соответствия является полное совпадение поискового образа документа с поисковым предписанием. Для его проверки вычисляют величину R ( QJD) 100 %, где Q - число дескрипторов запроса ( ПП), значения которых совпадают со значениями дескрипторов в ПОД; D - общее число дескрипторов в ПОД. [4]

Понятие критерия смыслового соответствия введено В. С. Чернявским, Э. С. Бернштейном и Д. Г. Лахути; эти же авторы выделили критерий смыслового соответствия в самостоятельный составной элемент абстрактной ИПС. [5]

Реализация критерия смыслового соответствия - одна из наиболее сложных проблем в разработке ИПС, так как информационный язык системы, используемый для представления и поисковых образов документов и поисковых запросов, чаще всего основан на подмножестве естественного языка. Кроме того, здесь необходимо исключить такие явления, как неполнота поиска и информационный шум, т.е. ситуации, когда в ответ на запрос не выдаются релевантные документы или выдаются документы, не имеющие отношения к запросу. Причинами указанных явлений могут быть некачественное индексирование документов, дефекты в средствах поддержки информационного языка системы. [6]

Под критерием смыслового соответствия в ИПС понимают совокупность формальных правил установления смыслового соответствия ( релевантности) поискового предписания поисковым образам документов в поисковом массиве. [7]

Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов. [1]

Система индексирования документов и фактов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска. [2]

Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов. [3]

Система индексирования документов и фактов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска. [4]

Система индексирования документов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации более точного поиска информации. [5]

Первый путь обеспечивает полную обратимость системы индексирования, поисковые запросы в этом случае могут формулироваться как, на русском, так и на английском языках. Однако вследствие неоднозначного членения действительности двумя языковыми системами установление соответствия между независимо разрабатываемыми русскими и английскими классами эквивалентности затрудняется. Поэтому было решено разработать сначала русскую часть словаря индексирования, а затем использовать ее при разработке английской части. [6]

На основе определённых критериев ДИС осуществляет поиск и выдачу документов, поисковые образы которых соответствуют поисковым образам запроса пользователя

Релевантность - способность информации соответствовать потребностям пользователя, поэтому в первую очередь хранилища должны быть наполнены информацией, необходимой ОВУ для решения поставленных перед ними задач.

Пертинентность (в информационном поиске) — соответствие полученной информации информационной потребности пользователя.

Стратегия поиска - общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными "стратегическими" решениями - архитектурой БД, методами и средствами поиска в конкретной АИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значительной степени он определяется искусством достижения компромисса между практическими потребностями и возможностями имеющихся средств.

Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса (ПОЗ), отбора документов (сопоставление поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.

Поисковый образ запроса - записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.

Методы поиска, т.е. выделение подмножества документов, потенциально содержащих описание решения задачи отбора документов (ОД), являются отражением процесса нахождения решения и зависят от характера задачи и предметной области.  Рассматривая поиск как итеративный процесс, методы сокращения пространства перебора (просматриваемого подмножества) образуют по существу методологическую основу стратегии поиска и могут быть разделены на следующие классы - методы поиска в:

1) одном пространстве (обычно, тематическом);  2) иерархически упорядоченном пространстве;  3) альтернативных пространствах;  4) динамическом (изменяющемся в процессе поиска) пространстве.

Реализуемый метод построения ПОЗа должен обеспечивать эффективные способы построения запроса для достижения целей различного типа.

Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на поисковый запрос.

Средства поиска, с одной стороны, - взаимозависимый комплекс информационно-поисковых языков (ИПЯ) и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов конкретной АИПС.

Поисковые технологии - унифицированные (оптимизированные в рамках конкретной АИПС) последовательности эффективного использования отдельных средств поиска в процессе взаимодействия пользователя с системой для устойчивого получения конечного и промежуточных результатов.

Процесс поиска можно представить в виде следующих основных компонент:

1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;  2) проведение поиска в одной или нескольких поисковых системах;  3) обзор полученных результатов (ссылок);  4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;  5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.

По используемым поисковым технологиям ИС можно разбить на 4 категории:

1. Тематические каталоги;  2. Специализированные каталоги (онлайновые справочники);  3. Поисковые машины (полнотекстовый поиск);  4. Средства метапоиска.

  1. Фактографические системы: предметная область, концептуальные средства описания, модель сущность-связь. Модели данных. Представление данных в памяти ЭВМ. Программные средства реализации фактографических ИС. Виды фактографических ИС: системы обработки данных (СОД), банки (хранилища) данных (БД).

Поскольку объектное ядро произвольной предметной области потен­циально содержит бесконечное число объектов, которые находятся в по­тенциально бесконечном множестве взаимосвязей, то становится ясным, что прямой подход к описанию предметной области через описание всех объектов и взаимосвязей между ними обречен на провал. _ Очевидной альтернативой в этой ситуации является подход к описа­нию предметной области, фиксирующий только то общее, что является неизменным и характеризует ситуацию в любой момент времени, или, го­воря иными словами, отражающий семантику предметной области. Отсюда следует, что необходимы специальные средства описания пред­метной области, которые были бы применимы к любым областям, доста­точно просто интерпретировались в конкретном фрагменте внешнего мира и одновременно являлись точными, структурированными и обозримыми (конечными). Приспособленность указанных средств для описания любой предмет­ной области означает, что они обязаны быть достаточно универсальными. Для обеспечения универсальности необходима высокая общность, абст­рактность системы базисных метапонятий и правил порождения новых понятий, которые допускают интерпретацию в любой предметной облас­ти. В силу своей абстрактности средства описания предметной области называются концептуальными.  Тип - это понятие, объединяющее все объекты данного типа. В отличие от объекта, существующего в данный момент в конкретном месте, тип не имеет пространственно-временной локализации. Он охватывает все суще­ствовавшие, существующие и мыслимые объекты, относимые к данному типу. Типы обеспечивают непротиворечивое объединение локальных "то­чек зрения" различных групп пользователей. Каждый тип имеет уникальное имя. Например, при описании учебного процесса могут быть введены следующие типы людей: ПРЕПОДАВАТЕЛЬ, СТУДЕНТ, АСПИРАНТ и т. д. Считается, что в каждом состоянии предметной области любой объект имеет один или несколько типов. Множество типов данной предметной области, снабженное некоторой структурой, является моделью в матема­тическом смысле. Эту модель естественно называть концептуальной моде­лью или схемой предметной области. Отметим, что различны не только множества типов различных пред­метных областей, но и связи между ними. Поэтому для концептуальных моделей предметных областей, по-видимому, нельзя указать общую струк­туру или, более точно, указать общую сигнатуру отношений и операций. Однако некоторые базовые типы, отношения и операции целесообразно включать в любую концептуальную схему. ^ Отношение между типами . Пусть S – фиксированное множество типов. Т.к. в каждый момент времени t двум типам T1 и T2 соответствуют два множества объектов (T1)tob и (T2)tob , то между ними существуют определенные теоретически множественные отношения, например, (T1)tob   (T2)tob или (T1)tob ∩ (T2)tob =  . Эти отношения могут носить случайный характер или, наоборот, быть справедливыми для любых значений t. Во втором случае они, как правило, выражают устойчивые закономерности предметной области. Чтобы иметь возможность отразить эти аксиомы в концептуальной модели, множество S снабжается отношением частичного порядка, которое принято обозначать IS-A. Это от­ношение интерпретируется следующим образом: "Если Т1IS-A Т2, то в любой момент времени t каждый объект типа Т1 является объектом типа Т2". Други­ми словами, справедлива следующая аксиома:  . Если множество типов S конечно, то его можно изобразить в виде ори­ентированного графа, вершины которого помечены именами типов, а дуги соединяют те вершины, которые находятся в отношении IS-A. На рисунке представлен фрагмент такого графа. ^ Фрагмент модели предметной области «учебный процесс» Операции над типами. Наиболее употребительными являют­ся операции   соответствующие обычным теоретико-множественным конструкциям. Эти операции порождают новые типы, которые сначала не были определены. Например, ^ ЧЕЛОВЕК = МУЖЧИНА  ЖЕНЩИНА  МУЖЧИНА   ЖЕНЩИНА =  Описанный арсенал средств моде­лирования позволяет представлять достаточно сложные структуры пред­метных областей. ^

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]