- •1. Основные понятия теории систем, ее цели и задачи. (Тема 1, стр. 2, 3).
- •Тема 1. Основные понятия теории систем (тс)
- •3. Классификация систем: реальные, абстрактные, естественные, технические, социальные, организационные, открытые, закрытые, комбинированные. (Тема 1, стр. 5, 6, 7).
- •5. Сложная и большая системы. Декомпозиция и агрегирование. (Тема 1, стр. 9, 10, 11).
- •6. Основные процессы преобразования информации. (Тема 2, стр. 14, 15).
- •7. Системы информационного обмена. Закрытая и открытая системы. (Тема 2, стр. 15, 16).
- •8. Определения информационной системы и информационной среды. (Тема 2, стр. 16, 17, 18).
- •10. Шесть типов информационных систем управления. (Тема 2, стр. 24).
- •11. Функции и задачи управления системой. (Тема 2, стр. 26-27).
- •2.8. Функции и задачи управления системой
- •12. Информационные сети и их типология. (Тема 2, стр. 27-28).
- •2.9. Информационные сети и их типология
- •13. Состав и структура процесса функционирования информационной системы. (Тема 2, стр. 29-30).
- •2.10. Состав и структура ис и аис
- •14. Определения автоматизированной информационно-поисковой системы, банков и баз данных, системы управления базами данных, программной системы. (Тема 2, стр. 31-32).
- •2.11. Аипс, банки и базы данных
- •15. Состав и структура аипс. (Тема 3, стр. 34).
- •3.2. Состав и структура аипс
- •16. Основные элементы информационно-поискового языка. (Тема 4, стр. 37-38).
- •4.1. Основные элементы информационно-поискового языка
- •17. Состав и структура дескрипторных ипя. Определения: ключевое слово, словосочетание, дескриптор, тезаурус, семантическая карта. (Тема 5, стр. 43-44).
- •5.1. Состав и структура дескрипторных ипя
- •18. Анализ информации и построение словарей. (Тема 5, стр. 45-46).
- •5.2. Анализ информации и построение словарей
- •19. Индексирование. Система индексирования. (Тема 6, стр. 47).
- •20. Типы систем индексирования. Системы свободного, полусвободного, жесткого индексирования, статистического автокодирования. (Тема 6, стр. 47-48).
- •6.1. Типы систем индексирования
- •6.2. Примеры систем индексирования (си)
- •21. Девять признаков типологии информационно-поисковых операций и их составляющие. (Тема 7, стр. 53-54).
- •7.5.1. Типология информационно-поисковых операций (ипо)
- •22. Организация поисковых массивов, прямая и инверсная схема. (Тема 7, стр. 55-56).
- •7.5.2. Организация поисковых массивов
- •23. Фактографические информационные системы. Общая характеристика. (Тема 8, стр. 58).
- •24. Схема трехуровнего представления данных в БнД. (Тема 8, стр. 60).
- •25. Структура банка данных. Основные принципы построения фактографических бд. (Тема 8, стр. 60-61).
- •8.2. Основные принципы построения фактографических бд
- •26. Характеристика процесса функционирования фактографических ис. (Тема 8, стр. 61-62).
- •8.4. Характеристика процесса функционирования фактографических ис
- •27. Схема эквивалентной интерпретации описания по на естественном и формальном языках. (Тема 9, стр. 64-65).
- •9.2. Описание по
- •28. Модель сущность-связь. Отображения 1:1,1:м, м:1 (Тема 9, стр. 65-66).
- •9.3. Модель «сущность-связь»
- •29. Модель сущность-связь: Отображение м:n. Ассоциации типов: 1, м,с.(Тема 9, стр. 66-67).
- •30. Понятие модели данных. (Тема 10, стр. 69).
- •10.1. Понятие модели данных
- •31. Способы структуризации данных. Типы абстракций: идентичность, обобщение, агрегация (Тема 10, стр. 69).
- •10.1.1. Структуры данных
- •32. Типы структур данных. Понятия: агрегат данных, запись, база данных. (Тема 10, стр. 70).
- •33. Операции над данными. Навигационная и спецификационная операции Понятия: селекция, действие, процедура бд, ограничения целостности. (Тема 10, стр. 72-73).
- •10.1.2. Операции над данными
- •10.1.3. Ограничения целостности
- •34. Понятие о реляционной модели данных. Структура данных в реляционной модели данных. (Тема 10, стр. 73-74).
- •10.3. Реляционная модель данных
- •10.3.1. Структура данных
- •35. Язык манипулирования данными. (Тема 10, стр. 75, стр.78).
- •10.3.3. Язык манипулирования данными
- •36. Структура данных в иерархической моделе данных. (Тема 10, стр. 81).
- •10.4. Иерархическая модель данных
- •37. Сетевая модель данных. (Тема 10, стр. 82-83).
- •10.5. Сетевая модель данных
- •38. Объектно-характеристическая модель данных. (Тема 10, стр. 83-87).
- •10.6. Объектно-характеристическая модель данных
- •39. Дескрипторная модель данных. (Тема 10, стр. 88-90).
- •10.7. Дескрипторная модель данных
- •40. Объектно-ориентированная модель данных. (Тема 10, стр. 90-95).
- •10.8. Объектно-ориентированная модель данных
- •41. Особенности проектирования прикладной ис. Фазы развития ис. (Тема 11, стр. 100-103).
- •11.1.3. Особенности системного проектирования прикладной ис
- •42. Концепция жизненного цикла ис. (Тема 11, стр. 103-105).
- •11.1.4. Концепция жизненного цикла ис
- •43. Понятие профиля ис. (Тема 11, стр. 105).
- •11.1.5. Понятие профиля информационной системы
- •44. Методика проектирования документальных бд. (Тема 11, стр. 108-110).
- •45. Особенности проектирования фактографических бд. (Тема 11, стр. 111-112).
- •11.3. Особенности проектирования фактографических бд
- •46. Автоматизация проектирования бд. Концептуальные основы case-технологий. (Тема 11, стр. 112-113).
- •11.3.1. Автоматизация проектирования бд. Концептуальные основы case-технологий.
- •11.3.1.1. Определение case-технологии
- •47. Основные показатели качества ис: надежность, достоверность функционирования, безопасность, эффективность. (Тема 12, стр. 120-121).
- •12.1. Качество информационной системы
- •48. Защита информации от несанкционированного доступа. (Тема 12, стр. 132-133).
- •12.5. Защита информации от несанкционированного доступа
- •49. Показатели прагматической эффективности ис. (Тема 12, стр. 134-135).
- •12.6.2. Показатели прагматической эффективности
- •50. Показатели экономической эффективности ис. (Тема 12, стр. 135-136).
- •12.6.4. Показатели экономической эффективности
22. Организация поисковых массивов, прямая и инверсная схема. (Тема 7, стр. 55-56).
7.5.2. Организация поисковых массивов
В современных ИПС могут использоваться три принципиально разных типа информационных массивов:
- пассивный массив, или массив третьего контура АИПС. Это массив оригиналов документов или сообщений, отображающих предметную область АИПС;
слабоактивный массив (массив второго контура АИПС) - упорядоченная машиночитаемая копия документов (сообщений) пассивного массива;
активный массив - массив первого контура АИПС, или информационно-поисковый массив (ИПМ), структурированный массив машиночитаемых поисковых образов документов, и/или их библиографических описаний, и/или рефератов, и/или самих документов (сообщений) и т. д. Иными словами, это база данных ИПС, структурированная в соответствии с заданными ИПЯ совокупность элементов фактографической и/или документальной информации, представленных на машиночитаемых носителях. Собственно информационный поиск проводится только в активном массиве. Однако результатами этого поиска могут быть только коды документов, отдельные фрагменты документов, их рефераты, аннотации, заголовки и т. д., но не полнозначные копии документов и тем более не оригиналы документов. Массив второго контура необходим для получения копий документов в целом или их фрагментов. Обычно этот массив хранится на машиночитаемых носителях большой емкости. Массив третьего контура используется только при необходимости обращения к оригиналу документа (сообщения). Такая необходимость возникает в библиотечных, архивных, банковских и других системах, где важен юридический статус получаемой в ИПС информации. Поисковая процедура в трехконтурной ИПС состоит в проведении собственно информационного поиска в активном массиве (базе данных) АИПС, анализе релевантности результатов поиска и обращении (при необходимости) по найденным поисковым ключам к документам второго или первого контуров АИПС.
Реализация информационного поиска в АИПС предполагает предварительное представление информационных массивов в соответствии с некоторой формальной структурой данных. Существует несколько различных структур данных. В документальных АИПС используется простейшая структура данных, включающая четыре типа элементов:
ПОЛЕ-ЗАПИСЬ-ФАЙЛ-НАБОР ФАЙЛОВ
ПОЛЕ - наименьшая поименованная единица данных (информации). Ими могут быть: автор документа, название документа, реферат документа, часть документа или реферата документа, название дескриптора или иной лексической единицы и т. д. Иными словами, ПОЛЕ - любая поименованная единица информации (данных), которая может представлять интерес в процессе информационного поиска. Различают фиксированные и свободные (гибкие) поля данных.
Фиксированное поле данных - поле с заранее заданным (фиксированным) числом символов (байт), используемых при его заполнении. Например, поля «фамилия автора документа», «год издания документа».
Свободные (гибкие) поля не предполагают явных ограничений на длину значений данных. Например, поля «реферат», «название документа» могут иметь разное число символов для различных документов.
ЗАПИСЬ - поименованная совокупность полей данных. Например, запись «документ» может включать поля: № документа, название документа, год издания, издательство, авторы и т. д.
ФАЙЛ - поименованная совокупность экземпляров записей одного типа.
НАБОР ФАЙЛОВ - поименованная совокупность файлов.
Схема записи - совокупность имени записи и имен составляющих ее ПОЛЕЙ. Например, схема записи ДОКУМЕНТ имеет вид ДОКУМЕНТ (№ документа, название документа, год издания, авторы, дескрипторы, реферат). Схема записи определяет тип записи - задает порядок композиции схем типов полей и приписывает имя типу записи.
Схема файла - совокупность имени файла, имени типа записи и имен составляющих ее полей.
Схема базы данных - совокупность имени набора файлов и схем составляющих ее файлов. База данных - совокупность состояний составляющих ее файлов. При предмашинном представлении информации схему базы данных отображают на бумажном носителе в виде, удобном для сбора и ввода информации. Такое представление носит название РАБОЧЕГО ЛИСТА АИПС, или ФОРМАТА ВВОДА ДАННЫХ АИПС. Обратное отображение РАБОЧЕГО ЛИСТА в схему базы данных выполняется компьютерной программой в процессе ввода информации в АИПС. Схема базы данных (схема организации информационно-поисковых массивов) сильно влияет на эффективность поисковых операций. Существуют разнообразные схемы организации поисковых массивов, отличающиеся между собой как наборами файлов, так и их схемами. Однако в основе любых схем БД лежат схемы файлов, а в более узком смысле - схемы записей, поскольку именно они определяют структуру организации массивов.
Рассмотрим наиболее важные в документальном поиске схемы организации массивов.
Прямая схема организации массива
Схема записи представляет собой совокупность имен интересующих пользователя полей, одним из которых обязательно является номер документа. Файл формируется как массив записей, упорядоченных по номерам документов (рис. 7.1).
Инверсная схема организации массива
Схема приемлема только для записей с фиксированными полями. Схема записи включает имя ключевого поля (по которому предполагается проводить поиск) и поля «номера документов». Файл формируется как массив упорядоченных по значениям ключевого поля записей (например, по алфавиту, по цифровым кодам и т. д.) (см. рис. 7.1).
Прямая схема организации массива требует минимальных объемов памяти для записи и хранения информации, позволяет легко вносить изменения и дополнения, учитывать синтагматические отношения в процессе поиска. Однако поиск требует много времени, так как каждый запрос предполагает просмотр всего файла. При групповом поиске этот недостаток частично снимается.
Рис. 7.1. Прямая и инверсная схемы организации массивов
Инверсная схема организации массива требует создания инверсных файлов по каждому из полей, по которым производится поиск. Это существенно увеличивает объемы занимаемой памяти. Однако время поиска при такой схеме минимально, поскольку обеспечивается прямой поиск по ключам. Недостатком инверсной организации массива является сложность корректировки записей и сложность учета синтагматических отношений в процессе поиска.
На практике приходится создавать массивы с прямой и инверсной организацией, т. е. использовать комбинированную схему организации массивов. Процесс поиска в этом случае состоит в том, что в инверсном массиве выбираются номера документов, возможно, релевантных в силу логики запроса, а затем просматривается выделенная часть прямого массива. Такой прием повышает оперативность поиска, особенно при конъюнктивной логике запросов.
