- •4 Курс, 7 семестр, специальность 080802
- •Общее понятие информационной системы. Компоненты информационных систем.
- •Отличия систем управления базами данных и информационных систем. Сфера применения информационных систем.
- •Аппаратное и программное обеспечение как ресурсы информационных систем.
- •Лингвистические, информационные, человеческие ресурсы информационных систем.
- •Понятие «пользователь» информационных систем.
- •Понятие модели в информационных системах. Понятие предметной области, сущности предметной области.
- •Слабоструктурированные модели реальности в информационных системах.
- •Формальные модели реальности. Формальные языки.
- •Неструктурированные модели реальности. Средства описания неструктурированных моделей.
- •Понятие модели данных. Назначение моделей данных, область применения.
- •Материализация моделей предметной области в информационных системах.
- •Сбор и регистрация данных как функции информационных систем.
- •Хранение как функция информационных систем. Управления ресурсами памяти.
- •Вспомогательные структуры хранения данных в информационных системах. Индексирование, хеширование.
- •Актуализация информационных ресурсов информационных систем.
- •Обработка информационных ресурсов информационных систем.
- •Pull-технологии предоставления информационных ресурсов информационных систем.
- •Push-технологии предоставления информационных ресурсов информационных систем.
- •Особенности взаимодействия конечных пользователей с информационной системой.
- •Особенности взаимодействия прикладных программ с информационной системой.
- •Критерии сравнения характеристик информационных систем.
- •Свойства Web как глобальной информационной системы.
- •Общая архитектура Web. Компоненты системы, модели взаимодействия.
- •Понятие структурирования информации. Языки разметки. Гипертекст. Назначение. Общие принципы. Область применения.
- •Язык разметки гипертекстовых документов html. Назначение. Область применения. Основные понятия.
- •Организация простейших web-приложений. Схема взаимодействия в web-приложениях.
- •Расширение функциональности на стороне клиента в технологии web.
- •Расширение функциональности на стороне сервера в технологии web.
- •Метод передачи данных от клиента серверу get. Общие принципы. Область применения. Достоинства и недостатки.
- •Метод передачи данных от клиента серверу post. Общие принципы. Область применения. Достоинства и недостатки.
- •Назначение и общие форматы записи универсального указателя ресурсов (url). Назначение элементов. Форматы записи.
- •Интерфейс взаимодействия cgi. Область применения. Достоинства и недостатки.
- •Интерфейс взаимодействия api. Область применения. Достоинства и недостатки.
- •Организация web-приложений с использованием баз данных. Схема взаимодействия web-приложения и баз данных.
- •Основные положения языка xml. Сфера применения, история языка xml.
- •Описание типа документа. Состав, назначение.
- •Описание элементов в языке xml.
- •Описание атрибутов элементов в языке xml.
- •Общие сведения о системах текстового поиска. История развития. Область применения.
- •Терминология систем текстового поиска. Документ, коллекция документов, релевантность, критерии поиска, методы создания документов.
- •Общие принципы текстового поиска. Проблемы текстового поиска.
- •Структурированное представление документов. Задачи и методы структурирования.
- •Индексирование документов. Способы организации индексов документов.
- •Представление пользовательских запросов. Критерии релевантности.
- •Функционирование систем текстового поиска. Методы работы в системах текстового поиска.
- •Средства лингвистической поддержки в системах текстового поиска. Словари и тезаурусы.
Понятие модели данных. Назначение моделей данных, область применения.
Модели данных.
При разработке ИС выдранный подход к моделированию предметной области существенным образом влияет на используемый при разработке информационные технологии и инструменты. Для создания структурированных и слабоструктурированных представлений предметной области и выполнения операций в терминах таких представлений используется разнообразные программные средства моделирования, которые реализуют модели данных. Концепция модели данных первоначально была использована в области бд в которой модель данных трактуется, как структура конкретной БД. В настоящее время в понятие модель данных основную роль играет не результат, а инструмент моделирования, то есть совокупность правил структурирования данных допустимых операций над ними и видов ограничения целостности, которым они должны удовлетворять. При рассмотрении ИС на различных уровнях абстракции модель данных рассматривается, как метомодель для описания интенсиональных моделей предметной области, в среде выбранной субд или иной среды управления данных. Операционные средства моделей данных используются для выполнения различных операций над элементами экстенсиональной модели. В системах бд интенсиональная модель предметной области выращенная с помощью дискриптивных(описания) средств модели данных, которая реализованна в конкретной СУБД называется СХЕМОЙ БД. На основе той или иной модели данных конструируется механизмы управления данными каждыми СУБД. Они реализуют воплощающие концепции этой модели в комплекс языковых средств определения данных и манипулирования данных, а так же языков запроса.
Материализация моделей предметной области в информационных системах.
Возникает естественный вопрос, в каком виде «материализуются» модели предметной области в информационных системах. Экстенсиональные модели материалмзуются в виде совокупности информационных ресурсов системы. Что же касается интенсиональных моделей, то они материализуются средствами метаданных в виде некоторой спецификации на языке определения данных, формальном языке и т.д., в зависимости от класса системы. Кроме того, в текстовых системах некоторые элементы интенсиональных моделей материализуются в виде средств лингвистической поддержки тезаурусов, лексических словарей и др.
Сбор и регистрация данных как функции информационных систем.
Эти функции обеспечивают «фотографирование» предметной области, формирование и поддержку на этой основе модели предметной области экстенсионального уровня.
Для выполнения этих функций проводятся работы как вне программно-аппаратного комплекса системы (в "ГОСТ 34.003-90. Информационная технология" он называется комплексом средств автоматизации), так и непосредственно в его среде. Способы реализации указанных функций зависят от характера используемых источников информации, в качестве которых могут служить: сущности и процессы в предметной области системы, различного рода автоматизированные технические системы, другие информационные системы, всевозможные данные на бумажных или электронных носителях и т.п.
Функции сбора и регистрации информационных ресурсов могут совмещаться во времени или выполняться последовательно. Возможны различные варианты их осуществления, например:
путем измерений (наблюдений) фактов в реальном мире и ввода данных в систему вручную с помощью клавиатуры и/или каких-либо манипуляторов;
полуавтоматически путем ввода в компьютер с некоторых носителей и в случае необходимости их оцифровки (например, при использовании текстов на бумажных носителях или аналоговых аудиозаписей);
автоматически с помощью различного рода датчиков или обмена .данными с другими автоматизированными системами.
С этими функциями механизмов информационных систем и их персонала связана необходимость решения ряда сопутствующих задач, таких как очистка, верификация, сжатие данных, конвертирование их из одного формата в другой и т.д.
Очистка данных — необходимая стадия предварительной обработки данных и подготовки их к загрузке в систему, особенно в случаях, когда используется несколько источников данных. Обычно она включает процедуры фильтрации данных, верификации, обеспечения логической целостности, устранения несогласованности, избыточности и различных ошибок, восполнения пропусков, а также другие процедуры, направленные на улучшение качества данных. Задачи перечисленных процедур в некоторой мере пересекаются.
В результате фильтрации производится отбор нужных данных из множества имеющихся в распоряжении. Верификация данных обеспечивает достоверность и логическую целостность данных. Проверка достоверности данных — это содержательная процедура, которая позволяет установить, адекватно ли характеризуют состояние предметной области собранные для ввода в информационную систему информационные ресурсы. Эта процедура, к сожалению, не может быть в полной мере формализована. Поэтому она в значительной мере возлагается на системный персонал и привлекаемых к этой работе экспертов. В системах баз данных за достоверность данных ответственен администратор данных. Проверка логической целостности данных может осуществляться на стадии предварительной их обработки, а также непосредственно при вводе в систему. Для этих целей в системах баз данных могут, в частности, использоваться механизмы СУБД, специально предназначенные для проверки ограничений целостности, которые были объявлены в схеме базы данных. Такая проверка осуществляется при обновлении состояния базы данных. Проверку целостности XML-документов может выполнять Web-браузер при условии, если для этого документа задано описание типа документов (DTD, см. раздел 4.7). Выбор конкретных методов обеспечения верификации данных зависит от характера их источников, качества данных, видов ограничений целостности и т.п.
В некоторых информационных системах информационные ресурсы хранятся в сжатом виде. Сжатие данных осуществляется с целью минимизации ресурсов памяти, необходимых для их хранения, а также для снижения затрат на передачу данных по коммуникационным каналам. Такой подход часто используется в различных репозиториях информационных ресурсов с файловой организацией среды хранения. Механизмы среды хранения данных некоторых СУБД включают встроенные средства, обеспечивающие сжатие отдельных значений данных, кортежей, доменов значений атрибутов и т.д., сжатие индексных файлов, резервных копий базы данных. Для рационального использования ресурсов памяти в некоторых классах систем, например в системах управления документами, документы подразделяются на активные и архивные. Хранение архивных документов осуществляется в сжатых форматах.
Конвертирование данных при вводе в систему используется для преобразования данных из одного формата в другой, допускающий автоматизированный импорт их в информационную систему. Конвертирование данных часто необходимо в случаях, когда источником данных является некоторая другая система.