
- •Введение
- •Глава 1. Информация и информатика Роль информатизации в развитии общества
- •Информатика –предмет и задачи
- •Информация в современном мире. Понятие и сущность информации
- •Меры информации
- •Качество информации
- •Классификация информации
- •Представление информации в эвм
- •Глава 2. История возникновения и развития эвм. Основные типы компьютеров
- •Глава 3. Технические средства обработки информации
- •Структура персонального компьютера
- •Микропроцессор
- •Генератор тактовых импульсов
- •Системная шина
- •Основная память
- •Источник питания
- •Контроллер
- •Внешние устройства пк
- •Диалоговые средства пользователя
- •Устройства ввода информации
- •Устройствам вывода информации
- •Устройства связи и телекоммуникации
- •Внешние запоминающие устройства или внешняя память пк
- •Функциональные характеристики пк
- •Глава 4. Программные средства обработки информации. Системное программное обеспечение
- •Классы программных продуктов
- •Операционные оболочки
- •Сервисное программное обеспечение
- •Операционные системы Обзор наиболее популярных операционных систем
- •Назначение операционной системы
- •Файловая система
- •Логические диски и папки
- •Fat-таблица размещения файлов
- •Характеристики осWindows
- •Глава 5. Прикладное программное обеспечение
- •Специализированные пакеты прикладных программ
- •Текстовые редакторы
- •Настольные издательские системы
- •Графические редакторы
- •Пакеты демонстрационной графики
- •Программы-переводчики
- •Программы проверки орфографии
- •Электронные таблицы и табличные процессоры
- •Системы управления базами данных (субд)
- •Справочные правовые системы
- •Программы распознавания символов
- •Интегрированные пакетыавтоматизированного офиса
- •Глава 6. Системы обработки текстовой информации Классификация текстовых редакторов
- •Текстовые процессоры
- •Набор текста
- •Редактирование
- •Форматирование
- •Верстка документа
- •Сохранение документа
- •Глава 7. Электронные таблицыИстория появления и развития электронной таблицы
- •Особенности интерфейса табличного процессора
- •Типы данных электронной таблицы
- •Относительные и абсолютные ссылки.Управление адресами ячеек при копировании и перемещении формул
- •Копирование формул
- •Перемещение формул
- •Графическое представление данных
- •Глава 8. Системы управления базами данных
- •Классификация субд
- •Информационно-логическая модель предметной области
- •Модели данных
- •Иерархическая модель
- •Сетевая модель
- •Реляционная модель данных
- •Постреляционная модель
- •Многомерная модель
- •Характеристика реляционной модели данных Основные понятия
- •Индексирование
- •Связывание таблиц
- •Основные виды связи таблиц
- •Контроль целостности связей
- •Особенности субдMicrosoftAccess Создание и ведение базы данных
- •Применение пользовательских форм
- •Организация поиска информации
- •Команды поиска и сортировки
- •Фильтрация
- •Запросы
- •Глава 9. Справочные правовые системы
- •История появления и развития компьютерных правовых систем
- •Информационные ресурсы спс
- •Дополнительная информация спс
- •Экономическая информация спс
- •Поисковые возможности спс
- •Аналитические возможности спс
- •Сервисные функции спс
- •Глава 1. Информация и информатика 2
Представление информации в эвм
Информация в ЭВМ кодируется в двоичной системе счисления.
Система счисления– это способ наименования и изображения чисел с помощью символов, имеющих определенные количественные значения.
В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные.
В позиционной системе счисления количественное значение каждой цифры зависит от ее места (позиции) в числе. В непозиционной системе счисления цифры не меняют своего количественного значения при изменении их расположения в числе.
Количество (Р) различных цифр, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления.
Значения цифр лежат в пределах от 0 до Р-1.В общем случае запись любого смешанного числа в системе счисления с основанием Р будет представлять собой ряд вида:
am-1Pm-1 + am-2Pm-2 + . . . + a1P1 + a0P0 + a-1P-1 + a-2P-2 + . . . a-sP-s,
где нижние индексы определяют местоположение цифры в числе (разряд):
положительные значения индексов – для целой части числа (тразрядов);
отрицательные значения – для дробной (s разрядов).
Пример. Позиционная система счисления – арабская десятичная система, в которой: основание Р=10, для изображения чисел используются 10 цифр (от 0 до 9). Непозиционная система счисления – римская, в которой для каждого числа используется специфическое сочетание символов (XIV, CXXVII и т.п.).
Максимальное целое число, которое может быть представлено в т разрядах:
Nmax= Pm-1.
Минимальное значащее (не равное 0) число, которое можно записать в s разрядах дробной части:
Nmin= P-s.
Имея в целой части числа т, а в дробной s разрядов, можно записать всего Рm+s разных чисел.
Двоичная система счисления имеет основание Р = 2 и использует для преставления информации всего две цифры: 0 и 1. Существуют правила перевода чисел из одной системы счисления в другую, основанные в том числе и на соотношении (1).
Пример.
101110,101(2)= 1∙25+0∙24+1∙23+1∙22+1∙21+0∙20+1∙2-1+0∙2-2+1∙2-3= 46,625(10),
т.е. двоичное число 101110,101 равно десятичному числу 46,625.
Вся информация (данные) представлена в ЭВМ в виде двоичных кодов. Для удобства работы введены следующие термины, обозначающие совокупности двоичных разрядов (табл. 1.1). Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в ЭВМ.
Таблица 1.1. Двоичные совокупности
Количество двоичных разрядов в группе |
1 |
8 |
8*1024 |
8*10242 |
8*10243 |
8*10244 |
Наименование единицы измерения информации |
Бит |
Байт |
Килобайт (Кбайт) |
Мегабайт (Мбайт) |
Гигабайт (Гбайт) |
Терабайт (Тбайт) |
Последовательность нескольких битов или байтов часто называют полем данных. Биты в числе (в слове, в поле и т.п.) нумеруются справа налево, начиная с 0-го разряда.
Для обработки на компьютере текстовой информации обычно при вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или принтер) для восприятия человеком по этим числам строятся соответствующие изображения букв. Соответствие между набором букв и числами называется кодировкой символов. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого достаточно, чтобы различными комбинациями восьми битов выразить все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы.
Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а так же противоречий корпоративного характера.
При разработке IBM PC фирма IBM заложила в знакогенераторы видеоконтроллеров кодировку символов, разработанную Институтом стандартизации США (ANSI – American National Standard Institute). Производители принтеров и других устройств также стали следовать предложенной фирмой IBM кодировке, так что она стала фактическим стандартом, получив название таблицы ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. Базовая таблица является международной и используется для кодирования управляющих символов, цифр и букв латинского алфавита; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (естественно, в разных странах разные).
Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем как производиться вывод прочих данных.
Начиная с кода 32 по 127 размещены коды символов английского алфавита, знаков препинания, арифметических действий и некоторых вспомогательных символов.
Аналогичные системы кодирования текстовых данных были разработаны в других странах. Так, например. в СССР в этой области действовала система кодирования КОИ-7 (код обмена информации семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось "отступить" во вторую, расширенную часть системы кодирования. определяющую значения кодов со 128 по 255. Отсутствие единого стандарта в этой области привело к существованию множества одновременно действующих кодировок.
Так фирма Microsoft разработала для Windows новую кодовую таблицу, получившую название ANSI-кодировка. В русской версии Windows используется модифицированная «русская» версия ANSI-таблицы, известная как кодировка Windows-1251. Учитывая широкое распространение операционных систем и других программ компании Microsoft в России, кодировка Windows-1251 глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.
Другая распространенная кодировка носит название КОИ-8 (код обмена информацией восьмизначный) – ее происхождение относится ко временам действия Совета Экономической взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.
Международный стандарт в котором предусмотрена кодировка символов русского алфавита, носит название кодировки ISO (International Standard Organization – Международный институт стандартизации). На практике данная кодировка используется редко.
На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день.
В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача международного преобразования данных – это одна из распространенных задач информатики.
Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно. что если кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система основанная на 16-разрядном кодировании символов, получила название универсальной – UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов – этого поля достаточно для размещения в одной таблице символов большинства языков планеты.
Несмотря на очевидность такого подхода. простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники ( в системе кодирования UNICODE все текстовые документы становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспечения ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования.