- •5 Введение
- •Глава 1
- •1.1. Информатика — состав и структура
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.3. Структуризация взаимосвязи информатики с предметной областью применения
- •1.4. Уровни информационных процессов
- •Глава 2
- •2.1. Текстовая информация. Модель документа
- •2.2. Языки разметки документов
- •2.3. Технологии xml
- •2.4. Текстовый редактор Word
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 3
- •3.2. Форматы записи-воспроизведения аудиосигналов
- •3.3. Технологии статических изображений
- •3.4. Программные средства обработки изображений
- •3.5. Цифровое видео
- •Глава 4
- •4.1. Оптическое распознавание символов (ocr)
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 5
- •5.2. Базы данных и субд
- •Логический файл
- •Логический файл
- •Очереди
- •Время установки головок чтения-записи
- •5.4. Анализ информации и хранилища данных
- •Глава 6
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 7
- •Глава 8
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
1.2. Соотношение понятий «информация», «данные», «знания»
Понятие «информация» достаточно широко используется в обычной жизни современного человека. Значение информации в жизни общества стремительно растет, меняются методы работы с информацией, расширяются сферы применения информационных технологий. Динамизм информатики как науки отражается и в постоянном появлении новых определений и толкований основного понятия информатики — информации.
Информация
Наиболее часто термин «информация» употребляется в его исходном значении (от латинского слова informatio) — это сведения, сообщения о каком-либо событии, деятельности и т. д. При этом в различных областях знаний могут вводиться разные определения этого понятия.
Информация в кибернетических системах — основа функционирования самоуправляемых систем (технических, биологических, социальных), и она рассматривается как обозначение содержания сигнала, полученного системой из окружающего мира в процессе взаимодействия системы с ним (Н. Винер).
Объединяющим (по крайней мере, с философской точки зрения) определением является следующее: «Информация — это отраженное разнообразие» (А. Д. Урсул). Разнообразие и отражение в развивающемся материальном мире неразрывно связаны и взаимно определяют друг друга: чем выше внутреннее разнообразие системы, тем более адекватно отражение ею внешнего мира. Чем выше возможности отражения (восприятия и понимания взаимодействия с окружающей средой), тем больше у системы возможностей адаптироваться — развиваться и увеличивать свое разнообразие (принцип необходимого разнообразия).
Данные
Остановимся на понятии «данные», которое, например, в [17] вводится следующим образом: «Мы живем в материальном мире. Все, что нас окружает, и с чем мы сталкиваемся, относит
ся либо к физическим телам, либо к физическим полям. Все объекты находятся в состоянии непрерывного движения и изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Все виды энергообмена сопровождаются появлением сигналов. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств — это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать теми или иными способами — при этом возникают и регистрируются новые сигналы, т. е. образуются данные».
Это определение принимает первичность и объективность существования данных, в том числе — независимость от субъекта их использующего. Но если существование данных не зависит от того, будут ли они когда-либо использованы или нет, эффективность функционирования многих процессов (имеющих контур управления) зависит от данных. Например, данные, используемые для изменения поведения процесса на основе построения прогноза (т. е. факты, характеризующие предшествующие состояния), позволят оптимизировать получение конечного результата, и будут уже выступать в роли управляющей информации. Роль и характер используемых данных в целом отражены на обобщенной схеме управляемого функционального процесса, представленной на рис. 1.1.
Система преобразования ресурса, функциональность которой обусловлена проблемным контекстом (данными, представляющими целевую задачу), фактически преобразует и информацию. Потенциально полезные данные, выделенные из общего множества в соответствии с контекстом задачи (исходная информация) в результате использования порождает выходную ин-
Г
Ресурс
j|
Рис.
1.1. Обобщенная схема функционального
процесса, управляемого данными
и]
Данные-задач
анные-задачи
(Данн
ые-факты
Данные-факты
J
Результат
формацию — актуализированные данные, подтверждающие или отрицающие действенность выбранных исходных данных для решения задачи.
Знания
Переходя к рассмотрению роли понятия «информация» в человеко-машинных комплексах, используемых в когнитивных, социатьных и производственных системах, необходимо более полно определить понятие «знания».
Понятие «знания» может быть определено следующим образом: «Научное знание — вся совокупность сведений, являющаяся результатом отражения материальной и нематериальной действительности в человеческом сознании» (Урсул А. Д.).
С другой стороны, утверждается, что «научно-техническая информация — это задокументированное научное знание, введенное в оборот, участвующее в функционировании и развитии общества» (Муранивский Т. В.). То есть, знание, являющееся достоянием чьего-либо сознания и не получившее «толчка» для циркулирования в обществе, не может рассматриваться как информация.
Основываясь на этом, можно констатировать условность превращения знания в информацию и информации в знание. Информация выступает как форма знания, отчужденная от его носителя (сознания субъекта), и обобществляющая его для всеобщего использования: информация — это динамическая форма существования знания, обеспечивающая его распространение и действенность (применение). Получая информацию, пользователь превращает ее путем интеллектуального усвоения (информационно-когнитивного процесса) в свои новые личностные знания, т. е. происходит воссоздание знаний на основе информации.
Соответственно можно сказать, что на начальном этапе знания — это данные, актуализированные субъектом, особенностью которых является то. что они не могут быть использованы без участия самого субъекта.
Результаты решения задач (обычно, «субъективизированно- го >). обобщения в виде законов, теорий, совокупностей взглядов и представлений, выступающие как истинная, проверенная информация. отчужденные от субъекта их сформировавших, образуют обобществленные знания. Представленные обычно в форме
документов и сообщений, они. в свою очередь, могут рассматриваться как объективно существующие данные.
Субъект
2
Рис. 1.2. Соотношение понятии «информация», «данные», «знания»
Станут ли данные информацией, зависит от того, известен ли метод преобразования (отражения) данных в новые или уже известные понятия. То есть, чтобы извлечь информацию из данных, необходимо иметь метод получения информации, адекватный форме представления данных. Причем необходимо учитывать тот факт, что информация не является статичным объектом — она динамична и существует только в момент взаимодействия данных и методов. Можно сказать, что все прочее время она пребывает в «потенциальном» состоянии и представлена как данные.
Кроме того, одни и те же данные могут представлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов, к которым надо отнести и условия ее извлечения (например, наличного знания субъекта).
Таким образом, в отличие от данных, которые по своей природе являются объективными (так как это результат регистра
ции объективно существующих сигналов, вызванных изменениями в материальных телах или полях), методы являются субъективными в том смысле, что они создаются или выбираются и далее целенаправленно применяются для решения практически значимых задач конкретного субъекта. В основе создаваемых (искусственных) методов лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные субъектами (людьми), а в основе естественных методов лежат биологические свойства субъектов. Соответственно информация возникает и существует в момент взаимодействия объективных данных и субъективных методов.
Свойства информации
Как и всякий объект, информация обладает свойствами. На свойства информации влияют как свойства данных, так и свойства методов, взаимодействующих с данными в ходе информационного процесса. По окончании процесса обработки свойства информации переносятся на свойства новых данных, то есть свойства методов могут переходить в свойства данных.
Спектр свойств информации существенно шире того, которым обладают другие, например, физические объекты. Известно высказывание Б. Шоу: «Если у тебя и меня имеется по одному яблоку, и мы ими обменялись, то у каждого из нас осталось по одному яблоку; если у тебя и меня имеется по одной идее и мы ими обменялись, то у каждого из нас будет по две идеи». Информация специфична и с точки зрения старения (информация не только устаревает со временем, но и при появлении новой, отрицающей или уточняющей информации).
С другой стороны, свойства информации необходимо рассматривать в их органическом единстве: не только в контексте ее использования в сфере информационной деятельности, но и на других этапах работы и в других областях деятельности. С точки зрения исследования и создания эффективных методов и средств обработки информации эти атрибутивные свойства делятся на две группы:
• свойства, определяющие объективные закономерности, связанные с информацией и преимущественно в пределах отдельной предметной области науки, техники, производства (условно эти свойства можно назвать «внутренними»);
свойства, определяющие закономерности движения информации в межотраслевом масштабе («внешние» свойства).
Любой процесс (событие, действие) существует не сам по себе, а непременно во взаимосвязи с другими процессами, причем связи эти разнообразны:
причина — следствие:
прошлое — настоящее — будущее:
укрупнение или дробление:
часть — целое и т. п.
Говоря об информационной технологии как об автоматизированном процессе преобразования объектов (например, представленных в машинной форме описаний реальных объектов), необходимо определить адекватный способ их идентификации. Это необходимо для их поиска — «узнавания» и выделения из множества других объектов окружающей среды.
Виды и коммуникационные свойства информации
Существуют различные деления и классификации информации. Приведем наиболее известные.
Виды информации по способу восприятия. У человека пять органов чувств: зрение, слух, обоняние, вкус, осязание.
По разным оценкам от 75 до 90 % информации человек получает с помощью органов зрения. Специалисты, утверждающие, что 90 % информации человек получает через органы зрения, примерно 9 % относят к информации, получаемой с помощью органов слуха и 1 % — с помощью остальных органов чувств (обоняния, вкуса, осязания).
Классификация по структуре и форме. Отметим, что разделение информации на табличную (числовую), текстовую и графическую отражает последовательность, в которой эти виды «осваивались» компьютерами (табл. 1.1). Первоначальные языки программирования (ЯП) были рассчитаны прежде всего на обработку числовой (Fortran. Algol), нежели символьной информации. Раньше появляются и табличные базы данных, также преимущественно рассчитанные на обработку числовых таблиц (файлов). Затем осваиваются текстовые файлы (текстовые редакторы) и текстовые БД (автоматизированные информационно-поисковые системы — библиографические и полнотекстовые). Наконец, с существенным повышением быстродействия и
емкости памяти компьютеров, на сцену выходят графические и другие мультимедийные файлы (графические, аудио, видеоредакторы). Говорить о графических (мультимедиа) базах данных и АИС пока все же преждевременно.
Классы
информации
По
уровням сложности Сигнал
Базы
данных
Основание для классификации
Сообщение. Информационный Информацион- документ массив ный ресурс
п Аналоговая Цифровая
По типу сигнала , ,
(непрерывная) (дискретная)
По уровням доступа и i Данные в регист- Данные в опера- Файлы данных на
организации ровой памяти тивной памяти внешних устройствах
По
способам кодиро- Цифровая (вь:чис- Символьная
(ал-
вания
и представления (данные, файлы и БД)
лительные
данные, двоичные)
фавитно-цифро-
вая, строчная)
Графическая
-
По
организации данных (файлы и БД)
Табличная
Текстовая
Графическая
(мультимедиа)
Эта последовательность прямо противоположна той, в которой данные виды информации осваивает человек. Действительно, сначала он знакомится с графическими образами (птицы, цветы и бабочки на шкафчиках для одежды в детском саду), затем — учится читать и писать, и только потом осваивает таблицу умножения.
Классификация по содержанию. В то время как классификация по структуре и форме является более характерной и важной с точки зрения информационных систем и технологий, классификация по содержанию более соответствует уровню информационных ресурсов (табл. 1.2).
Таблица 1.2. Классификация информации по содержанию (предметная область)
Тип информации Содержание Поставщик содержания
Биржевая и финансовая Индексы рынка, котировки, цены, Биржи, банки, службы финансовой обзоры информации
|! Экономическая: демографи- Первичная и вторичная; националь- Переписи: опросы, аналитические I ческая статистика ная, региональная статистика исследования
,, Данные о предприятиях, товарах,
Коммерческая н м ' ' Аналитические службы
услугах '
Окончание
табл. 1.2
Тип
информации
Содержание
Поставщик
содержания
Деловые
новости
Состояние
рынка, события в облас
Службы
фильтрации, агентства
ти
экономики
новостей
Научно-техническая
Фундаментальные,
прикладные
Центры
НТИ, издательства,
науки
оиолиотеки
Правовая
Нормативно-правовые
акты
Законодательные
органы, Минюст
Медицинская
Медучреждения,
болезни лекарства, яды
Информационные
центры, библиотеки, госпитали
Потребительская
и развлекательная
Образование,
музыка, музеи, библиотеки, кино
Справочные
службы, учреждения
Бытовая
Погода,
туризм, справочники
Информационные
службы