- •Министерство образования Российской Федерации
- •Подготовлено и издается по заказу института Инфо
- •Глава I. Информатизация общества.
- •1.2 Информатизация общества
- •1.3 Об информационной культуре
- •1.4 Информационный потенциал общества
- •1.5 Рынок информационных продуктов и услуг
- •1.6 Правовое регулирование на информационном рынке
- •1.7 Информатика — предмет и задачи
- •Глава II информация и ее свойства
- •2.1 Информация и данные
- •Н. Винер. Кибернетика
- •2.2. Классификация и кодирование информации
- •2.3 Система кодирования
- •2.4 Кодирование данных двоичным кодом
- •Кодирование текстовых данных
- •Основные структуры данных
- •27 Сорокин Сергей Семенович
- •Иерархические структуры данных
- •Упорядочение структур данных
- •Глава III. Файловая системы.
- •3.1. Файлы и файловая структура
- •Единицы измерения данных
- •Единицы хранения данных
- •3.2. Организация файловой системы
- •3.3. Обслуживание файловой структуры
- •Создание и именование файлов
- •3.4 Создание каталогов (папок)
- •Копирование и перемещение файлов
- •Глава IV информационно-логические основы построения компьютеров
- •4.1 Логические основы построения пк
- •4.2 Программное управление эвм
- •4.3. Последовательные модели вычислителей (машины Тьюринга)
- •4.4. Параллельные модели вычислителей (однородные структуры)
- •Глава V компьютерные сети
- •5.1. Компьютерные сети
- •Сетевые службы.
- •5.3. Интернет. Основные понятия
- •5.4 Подключение к Интернету Основные понятия
- •Установка модема
- •Глава VI базы данных
- •6.1. Основные понятия баз данных
- •Структура простейшей базы данных
- •Свойства полей базы данных
- •Типы данных
- •6.2 Безопасность баз данных
- •6.3. Проектирование баз данных
- •Глава VII сжатие данных
- •7.1. Теоретические основы сжатия данных
- •7.2 Алгоритмы обратимых методов сжатия
- •Синтетические алгоритмы
- •7.3. Программные средства сжатия данных
- •Глава VIII компьютерная безопасность
- •8.1 Понятие компьютерной безопасности
- •Компьютерные вирусы
- •8.2 Методы защиты от компьютерных вирусов
- •Средства антивирусной защиты
- •8.3 Защита информации в Интернете
- •8.4 Понятие о несимметричном шифровании информации
- •Принцип достаточности защиты
- •Глава IX программирование для эвм
- •9.1. Языки программирования
- •9.2 Обзор языков программирования высокого уровня
- •9.3 Системы программирования
- •9.4 Архитектура программных систем
- •9.5 Структурное программирование
- •Глава X. Объединение нескольких компьютеров
- •10.1 Топология физических связей
- •10.2 Организация совместного использования линий связи
- •10.3 Адресация компьютеров
- •10.4 Ethernet — пример стандартного построения сетей
2.2. Классификация и кодирование информации
Важным понятием при работе с информацией является классификация объектов.
Классификация — система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.
Реквизит — логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Примером одинаковых реквизитов является информация о каждом студенте в отделе кадров университета, которая систематизирована и представлена посредством одинаковых реквизитов:
фамилия, имя, отчество;
пол;
год рождения;
место рождения;
адрес проживания;
факультет, где проходит обучение студент, и т.д.
Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".
Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.
Примером является алгоритм обработки информационных объектов библиотечного фонда, который позволяет получить информацию обо всех книгах по определенной тематике, об авторах, абонентах и т.д.
Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д.
Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.
При любой классификации желательно, чтобы соблюдались следующие требования:
полнота охвата объектов рассматриваемой области;
однозначность реквизитов;
возможность включения новых объектов.
В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор — систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.
Иерархическая система классификации
Иерархическая система классификации (рис. 2.3) строится следующим образом:
исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;
каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.
Рис. 2.3. Иерархическая система классификации
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.
В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.
В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.
Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
Достоинства иерархической системы классификации:
простота построения;
использование независимых классификационных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации:
жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Рис. 2.4. Пример иерархической системы классификации для информационного объекта "Факультет"
Фасетная система классификации
Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet — рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.
Примером фасет цвет являются значения: красный, белый, зеленый, черный, желтый.
Фасет специальность содержит названия специальностей.
Фасет образование содержит значения: среднее, среднее специальное, высшее.
Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2, ..., Фi, ..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый.
Рис. 2.5. Фасетная система классификации
Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Дня каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:
Ks = (Ф1, Ф2, ..., Фi, ..., Фn),
где Фi — i-й фасет;
n — количество фасетов.
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.
Достоинства фасетной системы классификации:
возможность создания большой емкости классификации, т.е. использования большого: числа признаков классификации и их значений для создания группировок;
возможность простой модификации всей системы классификации без изменения структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Название факультета |
Возраст |
Пол |
Дети |
Радиотехнический |
До 20 лет |
М |
Есть |
Машиностроительный |
20 — 30 лет |
Ж |
Нет |
Коммерческий |
Свыше 30 лет |
|
|
Информационные системы |
|
|
|
Математический |
|
|
|
Рис. 2.6. Пример фасетной системы классификации для информационного объекта "Факультет"
Дескрипторная система классификации
Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Суть дескрипторного метода классификации заключается в следующем:
отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний,
отобранных в результате процедуры нормализации.
Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:
синонимические, указывающие некоторую совокупность ключевых слов как синонимы;
родо-видовые, отражающие включение некоторого класса объектов в более представительный класс;
ассоциативные, соединяющие дескрипторы, обладающие общими свойствами классификации.
Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.5). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X — значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для фасета "пол" и имеет следующие значения: 1 — мужчины; 2 — женщины;
2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 — есть дети; 2 — нет детей, 0 — для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 — до 20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет; 4-й разряд выделен для фасета "название факультета" и имеет следующие значения: 1 — радиотехнический, 2 — машиностроительный, 3 — коммерческий; 4 — информационные системы; 5 — математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 — женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 — мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.
На рис. 2.7 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.
Рис. 2.7. Классификация информации, циркулирующей в организации
Место возникновения. По этому признаку информацию можно разделить на входную выходную, внутреннюю, внешнюю.
Входная информация — это информация, поступающая в фирму или ее подразделения.
Выходная информация — это информация, поступающая из фирмы в другую фирму, организацию (подразделение).
Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.
Внутренняя информация возникает внутри объекта, внешняя информация — за пределами объекта.
Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.
Первичная информация — это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.
Вторичная информация — это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.
Промежуточная информация используется в качестве исходных данных для последующих расчетов.
Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.
Пример. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны, вторичная промежуточная информация, а с другой стороны — результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные — результатная информация.
Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.
Текстовая информация — это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).
Графическая информация — это различного рода графики, диаграммы, схемы, рисунки и т.д.
Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).
Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.
Постоянная (условно-постоянная) информация — это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:
постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;
постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;
постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.
Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).
Плановая информация — информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.
Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т.д.
Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.
Нормативно-справочной информацией на предприятии являются:
время, предназначенное для изготовления типовой детали (нормы трудоемкости);
среднедневная оплата рабочего по разряду;
оклад служащего;
адрес поставщика или покупателя и т.д.
Учетная информация — это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.
Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.
Оперативная (текущая) информация — это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.
Оперативной информацией являются:
количество изготовленных деталей за час, смену, день;
количество проданной продукции за день или определенный час;
объем сырья от поставщика на начало рабочего дня и т.д.