- •1. Модели организации данных. Сетевая и иерархическая модели. Реляционная модель организации данных.
- •2. Организация процессов обработки данных в бд. Внутренняя схема бд фактографических ис. Физические структуры данных. Средства ускоренного доступа к данным. Индексирование данных. Хэширование данных.
- •4. Метод нормальных форм. Выявление зависимостей между атрибутами. Нормализация отношений.
- •Нормализация реляционных таблиц-отношений определяется требованиями атомарности значений полей, а также требованием рациональности группировки полей- атрибутов по различным таблицам.
- •5. Метод сущность-связь. Основные понятия метода. Правила формирования отношений.
- •Формирование отношений для связи 1:1
- •K1vk2 – означает, что ключом сформированного отношения может быть либо к1, либо к2.
- •Формирование отношений для связи 1: m
- •6. Языки баз данных. Обработка данных. Ввод-вывод данных. Запросы. Оптимизация запросов. Процедуры, правила (триггеры) и события в базах данных.
- •1. Понятие и содержание информационного обеспечения. Структура и классификация информационных систем.
- •Определение понятия «документ»
- •Структура информационных систем
- •Основные понятия автоматизированной информационной системы (аис)
- •Классификация информационных систем
- •2. По масштабу
- •Основные показатели эффективности функционирования дис
- •Механизмы поиска документов в полнотекстовых ипс
- •3. Гипертекст, гипертекстовые информационно-поисковые системы. Модели организации данных в гипертекстовых ипс. Формирование связей документов в гипертекстовых ипс.
- •4. Распределенные ис. Понятие распределенных ис, принципы их создания и функционирования. Техника представлений. Проблемы, связанные с практической реализацией техники представлений.
- •5. Распределенные ис. Технологии и модели «Клиент-сервер». Управление транзакциями.
- •Модель файлового сервера (fs)
- •Модель сервера приложений (as)
- •Модель удаленного доступа к данным (rda)
- •Модель сервера базы данных (dbs).
- •6. Распределенные ис. Управление распределенными данными. Доступ к общим данным. Технологии объектного связывания данных. Технологии реплицирования данных.
- •1. Понятие информационной технологии. Эволюция информационных технологий; их роль в развитии экономики и общества; свойства информационных технологий; понятие платформы.
- •3. Технологии открытых систем.
- •4. Сетевые информационные технологии: электронная почта, телеконференции, доска объявлений; авторские информационные технологии; гипертекстовые и мультимедийные информационные технологии.
- •Модель файлового сервера (fs)
- •Модель сервера приложений (as)
- •Модель удаленного доступа к данным (rda)
- •Модель сервера базы данных (dbs).
Основные показатели эффективности функционирования дис
Полнота информационного поиска Rопределяется отношением числа найденных пертинентных документовAк общему числу пертинентных документовC, имеющихся в системе или в исследуемой совокупности документов:R=A/C.
Точность информационного поиска Pопределяется отношением числа найденных пертинентных документовAк общему числу документовL, выданных на запрос пользователя:P=A/L.
Наличие среди отобранных на запрос пользователя нерелевантных документов называется информационным шумом системы. Коэффициент информационного шума K, соответственно, определяется отношением числа нерелевантных документов (L-A), выданных в ответе пользователю к общему числу документовL, выданных на запрос пользователя:K= (L-A)/L.
Полнотекстовые ИПСстроятся на основеинформационно- поисковых языков дескрипторного типа.Их информационно-технологическая структура включает следующие элементы:
хранилище документов;
глобальный словарь;
индекс документов;
интерфейс ввода документов в систему,
механизм индексирования;
интерфейс запросов пользователя;
механизм поиска документов (поисковую машину);
механизм извлечения найденных документов.
Хранилище документовможет быть организовано как единаялокально сосредоточенная информационная структура в видеспециального файла (файлов) с текстами документов. Организация такого файла предусматривает указательную конструкцию на основе массива адресов размещения документов.
Другой вариант не предусматривает создания локально сосредоточенного хранилища документов, а ограничивается лишь массивом адресов расположения документов в соответствующей компьютерной информационной инфраструктуре (структура дисков и каталогов отдельного компьютера или локальной информационной сети, информационная инфраструктура глобальной информационной сети). Файлы учтеныв полнотекстовой ИПС (т. е. проиндексированы по содержанию и зафиксированы по месторасположению) для эффективного поиска и доступа. Такой подход более логичен с точки зрения технологий документооборота или распределенного характера систем (например, системаWWWсети Интернет), но его недостатком является необходимость постоянного отслеживания и учета перемещений документов.
Одним из наиболее характерных элементов полнотекстовых ИПС является глобальный словарь системы.Статические словарине зависят от содержания документов, вошедших в хранилище, а определены изначально в системе.Динамические словариопределяются набором словоформ, имеющихся в накапливаемых в хранилище документах. Изначально такой словарь пуст, но с каждым новым документом в него помещаются новые словоформы, которых еще не было в ранее накопленных документах.
Элементы глобального словаря выступают в качестве дескрипторовИПЯ системы. Поступающие через интерфейс ввода/выводадокументы подвергаются операциииндексирования поглобальному словарю. Механизм индексированияв полнотекстовых ИПС полностью автоматизируется и заключается в создании специального двоичного вектора, компоненты которого показывают наличие или отсутствие в данном документе слова с соответствующим номером (позицией) из глобального словаря. В результате на «учет» в системе ставятся все слова текста документа.
В результате индексирования поисковый образ каждого нового документа представляется набором словоформ из глобального словаря, присутствующих в тексте документа, и поступает в виде соответствующего двоичного вектора для дополнения индекса системы.Индекс отражает весь (полный) текст учтенных или накопленных документов. При удалении документа из системы соответственно удаляется и поисковый образ документа, т. е. соответствующий столбец индекса.
Пользователь языком запросов ИПЯчерез соответствующий интерфейс запросоввыражает свои информационные потребности по поиску документов, которые в общем плане, так же как и документы, индексируются и в виде двоичных векторов поисковых образов запросов поступают на поисковую машину.
Механизм поискаосновывается на тех или иных алгоритмах и критериях сравнения поискового образа запроса с поисковыми образами документов, образующими индекс системы. Результатом поиска является определение номеров документов, поисковые образы которых соответствуют или близки поисковому образу запроса. Далее специальная подсистема на основе установленных в хранилище документов указательных конструкцийизвлекаетидоставляетсоответствующие документы пользователю.
Таким образом, программное обеспечение полнотекстовых ИПС обеспечивает полный технологический цикл ввода, обработки, поиска и получения документов. В практическом плане ИПС могут поставляться как готовый информационный продукт, т. е. с уже сформированной базой документов и интерфейсом поиска и доступа к ним. В других случаях поставляется программная среда, позволяющая такую базу создать и сформировать тем самым документальную информационно-поисковую систему. Такие программные средства иногда называют полнотекстовыми СУБД.