
- •5 Введение
- •Глава 1
- •1.1. Информатика — состав и структура
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.3. Структуризация взаимосвязи информатики с предметной областью применения
- •1.4. Уровни информационных процессов
- •Глава 2
- •2.1. Текстовая информация. Модель документа
- •2.2. Языки разметки документов
- •2.3. Технологии xml
- •2.4. Текстовый редактор Word
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 3
- •3.2. Форматы записи-воспроизведения аудиосигналов
- •3.3. Технологии статических изображений
- •3.4. Программные средства обработки изображений
- •3.5. Цифровое видео
- •Глава 4
- •4.1. Оптическое распознавание символов (ocr)
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 5
- •5.2. Базы данных и субд
- •Логический файл
- •Логический файл
- •Очереди
- •Время установки головок чтения-записи
- •5.4. Анализ информации и хранилища данных
- •Глава 6
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 7
- •Глава 8
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
1.3. Структуризация взаимосвязи информатики с предметной областью применения
Подобная структуризация может быть осуществлена в следующих взаимосвязанных аспектах:
уровни процессов и объектов информатики, информатизации;
факторы или компоненты (страты, слои, подслои) информационных технологий;
фазы или этапы развития автоматизированных информационных технологий (АИТ) и систем (АИС);
типология пользователей машин, программ, систем.
Уровни информационных процессов
Прежде всего, могут быть рассмотрены уровни, различающиеся степенью связи «информатики» с «предметной областью»:
информационные технологии:
информационные системы:
информационные ресурсы.
В принципе, можно утверждать, что информационные технологии являются менее зависимыми от структуры и специфики предметной области, чем информационные системы и/или ресурсы, однако эта связь всегда существует, если, например, определить автоматизированную информационную технологию как целенаправленное и согласованное использование:
технических средств информатизации (аппаратурный фактор);
программных средств и систем (программный фактор);
информационный фактор — собственно информация, т. е. сигналы, сообщения, массивы данных, файлы и базы данных;
интеллектуальных усилий и человеческого труда (человеческий, гуманитарный фактор), для решения задачи (задач) предметной области — всегда присутствует человек-пользователь, решающий задачи какой-либо предметной области с использованием инструментария информатики.
Аналогично, информационные системы рассматриваются как комплексы информационных технологий, ориентированных на процедуры сбора, обработки, хранения, поиска, передачи и отображения информации предметной области, а информационные ресурсы — комплексы соответствующих информационных систем, рассматриваемые дополнительно также и на социально-экономических уровнях описания и применения.
Этапы развития информатизации
Могут быть выделены следующие этапы развития информатизации, связанные с вышеперечисленными компонентами (факторами).
Технический период («железный век», аппаратная фаза), в течение которого сложились основные представления о структуре универсальных вычислительных машин (ЭВМ), определилась архитектура и типы устройств. За этот период отпали АВМ (анатоговые ВМ), машины для открывания и закрывания дверей, шахматные машины и пр. специализированные контроллеры. Этот период можно ограничить 1947—1970 гг., с момента появления первой ЭВМ и до окончательного утверждения современных представлений о составе, принципах функционирования и структурах ЭВМ. В последующем развитие в основном шло в направлениях повышения экономической, технической, энергетической эффективности путем миниатюризации и повышения быстродействия электронных и механических устройств ЭВМ. Нет оснований ожидать каких-либо революций с точки зрения появления неожиданных устройств или структур ЭВМ. Исследования в направлении специализированных схем или процессоров постоянно идут: появляются «машины баз данных», «процессоры изображений», «коммуникационные процессоры» и пр., однако вряд ли они смогут в обозримом будущем вытеснить с массовых рынков ЭВМ классической структуры, а разве что будут входить в их состав [14. 24. 25]. Эти машины включают центральное устройство, состоящее из процессора и главной памяти, а также широкий спектр периферийных устройств, используемых для долговременного хранения, ввода-вывода и преобразования информации. Центральный процессор и память при всем многообразии конструкций подчиняются так называемым принципам фон-Неймана [24].
Программный период («бронзовый век», программная фаза) — выработалась современная классификация программных средств, их структур и взаимосвязей, сложились языки программирования, разработаны компиляторы и принципы процедурной обработки, операционные системы, языки управления заданиями. Ограничен 1954 — 1970 гг., а именно — появлением первого языка программирования Fortran и формированием окончательных представлений о функциях операционных систем, систем программирования и прикладных программ (приложений), что наиболее ярко проявилось в появлении операционной системы UNIX и языка программирования С (Си) [9]. Можно сказать, выражаясь экстремистски, что за эти годы «все программы были написаны», осталось их только модернизировать и исправлять (здесь есть элемент преувеличения, однако более чем 2000-летняя история математики, физики, механики к 1970 г. нашла свое полное отражение в библиотеках и фондах программ и алгоритмов).
Информационный период («серебряный век», информационная фаза) — в центре внимания исследователей и разработчиков оказываются структуры данных, языки описания (ЯОД) и манипулирования (ЯМД) данными, непроцедурные подходы к построению систем обработки информации, базы данных, автоматизированные И ПС — с 1970 г. по 1990 г. Придерживаясь вышеиспользованной терминологии, скажем, что за этот период «все данные были введены в машины», и их остается только уточнять и исправлять [14].
Гуманитарный период («золотой век») — связан с резким возрастанием круга пользователей АИТ, появлением ПЭВМ, развитием систем коммуникации и повышением роли интерфейсных, коммуникационных и навигационных возможностей соответствующих систем (с 1990 г.).
Конструктивный (процедурный) аспект
Перечисленные компоненты (факторы) — технические, программные средства, информация и человеческий фактор — в значительной степени взаимозаменяемы при решении задач. Это означает, что в широких пределах некоторый эффект может быть получен, а некоторая задача — решена как в рамках электронных схем. так и посредством программ или информационных ресурсов (а также естественно-интеллектуальными усилиями человека).
Предположим, необходимо извлечь квадратный корень из некоторого числа, тогда:
электронное решение — собрать нелинейный усилитель, в котором диод или транзистор используют начальную часть вольт-амперной характеристики, которая близка к параболе;
алгоритмический подход — написать программу, реализующую алгоритм Герона извлечения корня;
информационный подход — построить таблицу величин X, Y, в которой Y= л[Х.
Аналогично могут быть рассмотрены такие примеры, как перемножение двух переменных, построение случайной последовательности чисел и т. п.
Заметим, что чисто аппаратурное решение задач положено в основу так называемых аналоговых вычислительных машин (АВМ), в настоящее время практически забытых. В 1949—1950 гг. были созданы первые АВМ. называемые интеграторами постоянного тока: ИПТ-1 —ИПТ-5. Они предназначались для решения линейных дифференциальных уравнений с постоянными и переменными коэффициентами и широко применялись для имитационного моделирования сложных динамических систем (рис. 1.3).
Здесь же надо отметить, что техническое, программное и информационное обеспечение как бы образуют различные слои об-
Рис.
1.3. АВМ ИПТ-5 и
приставка нелинейных блоков (справа).
Разработка 1952 г.
работки информации, взаимодействие между которыми должно быть сбалансировано в том смысле, что не должно быть чрезмерно «толстых» или «тонких» слоев.
Содержательный или информационный аспект
Здесь мы сталкиваемся с трактовкой и связью таких понятий, как адрес, имя, содержание'.
Электронно-аппаратурный уровень (этап) ассоциируется с понятием адреса (номера позиции) данных или устройств (элементов) ЭВМ. Машинные команды оперируют в терминах адресов оперативной памяти, все внешние устройства ЭВМ имеют машинные номера (адреса). На начальном этапе развития систем программирования существовало такое понятие, как программирование в машинных адресах (или машинных кодах), при этом управление как процессами вычислений, так и пересылкой информации между оперативной и внешней памятью осуществляется путем обращения к соответствующим абсолютным адресам памяти.
Программа при этом является просто совокупностью машинных слов и задается своими начальным и конечным адресами в памяти. Например, программист должен был описать процедуру
1 Заметим, что в повседневной жизни люди стремятся установить взаимосвязь «имя — адрес — содержание». Иногда это удается (например, профессия — кузнец; фамилия — Кузнецов: адрес — г. Москва, ул. Кузнецкий мост), но чаше — нет (например, профессия — преподаватель. фамилия — Попов, адрес — г. Москва, ул. В.Лациса...).
выборки данных с магнитной ленты примерно следующими командами: «на лентопротяжном механизме № 4 перемотать ленту, пропустив 11 блоков, начиная с этого места записать 3 блока информации с магнитной ленты в оперативную память, начиная с адреса 234 561» и т. п. Подобные манипуляции соответствуют программированию в машинных адресах.
Программный этап или уровень приводит к понятию имени данного, устройства, программы и пр. Языки программирования (системы программирования) используют символические обозначения (имена, идентификаторы) для данных (чисел, строк, структур) и элементов программ (блоков, функций, процедур). Операционные системы (ОС) оперируют именами файлов, томов, устройств, реализуя управление данными, избавляют пользователя от работы с адресами, заменяя ее на работу с именами данных. Типичная команда ОС (например, DOS) не содержит каких-либо машинных адресов:
ссру c:\games\co~ic.doc ргг. .
Информационный этап, ил и уровень, приводит к определению и использованию содержания (значения) данного. Пользователей информационных систем не волнует машинный адрес хранения информации или имя файла, их интересует содержание. Связи адреса и содержания реализуются на уровне прикладных программ, именуемых СУБД (системы управления базами данных) и АИПС (автоматизированные информационно-поисковые системы).
В свою очередь, установление таких связей может быть осуществлено как программно (вычисление адреса по содержанию, или рандомизация, хэширование) так и информационно, с помощью дополнительных файлов, указательных таблиц (индексов, инверсных списков и пр. — индексирование). Первый тип использовался в ранних СУБД и широкого распространения тогда не получил. Существенное удешевление накопителей информации привело к тому, что в последнее время преимущественно используется второй тип связей «содержание-адрес». Попытки реашзовать эти связи аппаратно (ассоциативная память. Data Base Machine и пр. [14]), еще не получили широкого коммерческого распространения. В то же время достигнуты определенные обнадеживающие результаты на пути комбинирования этих двух подходов — индексирования и р а н д о м и з а и и и.
Существенно также, что в этот период появились языки программирования информационных систем (в которых основное внимание уделяется описанию данных сложной структуры, а не описанию вычислений и алгоритмов).
Пользователи средств информатизации
Проследим вкратце развитие во времени человеческого фактора информатизации, рассмотрев динамику пользователей (ЭВМ, систем, информационных технологий), а именно:
программист-алгоритмизатор. оператор ЭВМ (доминируют на первой, аппаратурной, фазе информатизации):
системный программист, прикладной программист, администратор ОС (системы, машины), оператор ЭВМ (системный оператор, SysOp). вторая фаза:
администратор базы данных, квалифицированный конечный пользователь (EndUser), информационный посредник (третья фаза);
появление в массовом масштабе ПЭВМ (четвертая фаза) прерывает эту дифференциацию и начинает процесс интеграции указанных функций на уровне конечного пользователя, (кроме того, появляются новые профессии — например, WEB-дизайнер и пр.).
В исторической перспективе развития информатики к середине 80-х гг. сложились следующие представления о видах пользователей вычислительных и информационных систем:
администратор базы данных (АБД) — лицо или группа, отвечающая за сопровождение данных, назначение уровней доступа, включение/исключение пользователей, защиту/восстановление данных. Обычно АБД участвует в проектировании и определении структуры БД;
системный администратор — лицо (группа), отвечающее за установку и сопровождение операционной системы ЭВМ и приложений общего назначения:
оператор ЭВМ — отвечает за текущее функционирование вычислительной установки, осуществляет слежение за прохождением задач, готовностью устройств, наличием и использованием машинных ресурсов (оперативной и внешней памяти, времени, расходных материалов и пр.);
операторы подготовки данных (ОПД) — персонал, осуществляющий ввод данных с рабочих листов или документов, на основе соответствующих инструкций, в среде специальных программных интерфейсов (или аппаратных средств);
интерактивные пользователи — липа, имеющие доступ на ввод, коррекцию, обновление, уничтожение и чтение данных в рамках, как правило, ограниченной области БД;
конечные пользователи — лица, использующие БД для получения справок и решения задач.
Отдельной строкой рассматривались разработчики, среди которых принято выделять две группы:
системные программисты — персонал, занимающийся разработкой операционных систем, приложений общего назначения, с использованием машинно-ориентированных языков;
прикладные программисты — персонал, разрабатывающий конкретные прикладные задачи, с использованием систем программирования высокого уровня или готовых других прикладных систем.
Здесь видна достаточно стройная система, в которой выделяются:
разработчики программных средств (системных и прикладных);
системные пользователи ЭВМ (администраторы и операторы, ответственные за функционирование ОС и общесистемных приложений);
системные пользователи ИС и БД (администраторы и операторы, ответственные за функционирование информационной системы);
конечные пользователи (интерактивные и нет).
С появлением персональных ЭВМ начинается интеграция всех данных ролей. Рядовой пользователь ПЭВМ совмещает в одном лице:
администратора системы (когда он редактирует файлы config.sys или autoexec.bat или решает, какие файлы ОС или прикладной системы он будет копировать с дистрибутивного диска);
оператора ЭВМ (запуская и останавливая программы, просматривая содержимое дисков или даже заправляя бумагу в принтер);
администратора БД (когда он в рамках системы FoxPro создает файлы данных), оператора (когда он заполняет эти файлы);
конечного пользователя (когда он редактирует или просматривает файлы данных).
Реже пользователь такой становится прикладным программистом и почти никогда — системным.