Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
информатика 1new.doc
Скачиваний:
2
Добавлен:
19.07.2019
Размер:
339.46 Кб
Скачать

Методические указания к выполнению контрольной работы по курсу «информатика»

Для студентов заочного отделения ИБП

Основные понятия

Информация – объективное свойство предметов и явлений окружающего мира изменяться в результате взаимодействия. При возникновении феномена «живой материи», характеризующейся целеустремленностью, появилась потребность в определении информационных состояний предметов и явлений, необходимых для достижения целей. Наши органы чувств наилучшим образом приспособлены для восприятия именно такой информации. Для достижения коллективных целей появляется потребность обмена информационными состояниями объектов без непосредственного контакта с ними – с использованием промежуточного носителя (сигнальные системы: жесты, нечленораздельная речь). По мере усложнения коллективных целей количество передаваемых информационных состояний постоянно возрастает, что приводит к необходимости появления систем кодирования, позволяющих с использованием промежуточного носителя получать необходимое число кодовых комбинаций.

При использовании в качестве меры информационных состояний интенсивности носителя кодирование называют сигнальным (высота столба ртути в термометре, угол поворота стрелки в спидометре и т.п.). Достоинство сигнального кодирования – простота реализации, недостаток – низкая помехозащищенность и небольшое количество идентифицируемых величин интенсивности (порядка нескольких сотен).

При использовании в качестве меры качественно различных информационных состояний носителя кодирование называют символьным. Если количество качественно различимых состояний носителя, называемых алфавитом, ограничено, то увеличивают количество носителей. При этом возникает понятие слова как набора носителей, разделенных во времени или пространстве. Если количество состояний носителя не ограничено, то получают представление о иероглифическом письме. Членораздельная речь, использующая в качестве носителя звуковые колебания, базируется на особенностях слуха, позволяющих на качественном уровне распознавать порядка 26 звуков (гласные, согласные, звонкие, глухие и т.д.). Этим определяется количество букв в языках с алфавитной письменностью.

Символьное кодирование данных может быть равномерным (все слова одинаковой длины) и неравномерным. В случае равномерного кодирования общее количество получаемых из алфавита с количеством букв А слов длиной n - Аn.

При использовании в качестве материального носителя данных электромагнитных явлений качественно различимыми являются 2 состояния носителя – наличие и отсутствие сигнала, что приводит к ситуации использования двоичного алфавита для кодирования информации. При представлении в этом виде обычно кодируются не информационные состояния предметов и явлений окружающего мира, а перекодируются символы «человеческого» алфавита. При этом ставится вопрос: какое количество «наших» букв должно кодироваться в электронном виде? На этапе становления задач представления человеческих букв в электронном виде (50-60 году 20 века) решили достаточным получение кодовых комбинаций электрических сигналов, позволяющих перекодировать буквы (строчные и прописные) алфавита (примерно 60), знаки препинания, цифры, знаки арифметических действий (30) и дополнительный алфавит (60), т.е. всего порядка 150 символов. Для этого необходимо 8-буквеное слово двоичного алфавита (27=128, 28=256!). Такое слово двоичного алфавита, как минимальная часть представления данных в компьютерах) получила название байт (от английского byte –часть, кусочек).

Таким образом, при кодировании данных в компьютерах используется байт, позволяющий получить 256 различных кодовых комбинаций.

При измерении количества информации используют следующие основные подходы:

  • если оценивать информацию, как выбор одного из возможных, интересующих нас, информационных состояний какого-либо объекта, кодируемое количество информации будет определяться именно этим числом (точнее, обратным числом). Так, например, указание одного из дней года содержит количество информации 1/365. Однако это количество измеряется с помощью специальной меры – бита – такого количества информации, которое позволяет уменьшить меру неопределенности объекта в 2 раза. Например, признак, позволяющий «разделить» всех людей на мужчин и женщин, может быть закодирован 1 битом («м» и «ж», «1» и «0» и т.п.). В случае с одним днем в году, для представления одного из 365 чисел, потребуется 8,4 бита (8 бит позволяет указать 1 из 256 состояний, 9 – 1 из 512). При таком подходе количество информации определяется как Ln2(K), где К – общее количество информационных состояний объекта.

  • Если оценивать информацию по количеству букв, используемых при кодировании, то она будет измеряться в байтах. Так, например, указание даты «12.11.2002» при измерении в байтах будет содержать 10 байт, а при измерении в количественном эквиваленте –1,05 байта (1 байт 8 бит)

При создании автоматизированных средств перекодирования данных (принтеры, дисплеи и т.п.) встает вопрос о стандартизации правил кодирования. Сегодня наибольшее распространение получили стандарты кодирования данных ASCII (American Standart Code for Information Interchange). Этот стандарт используется на компьютерах с текстовым режимом работы устройств отображения (печатные машинки, дисплеи с теневыми масками) и использует специальные «буквы» для изображения таблиц. При использовании графических устройств отображения данных (растровые (матричные) принтеры, дисплеи) создан стандарт ANSI, в котором для изображения таблиц используется горизонтальная или вертикальная «засветка» точек. Оба стандарта позволяют задавать правила кодирования только двух алфавитов. Для автоматизации настройки набора воспроизводимых символов введено понятие «кодовая страница» – номер правил кодирования букв национальных алфавитов. Так, например, 866 страница содержит правила кодирования русских (кириллических) шрифтов в ASCII, а 1251 – в ANSI. Этот номер передается специальной программе - знакогенератору, настраивающей набор отображаемых символов.

Для преодоления ограничений на количество кодируемых с помощью одного байта состояний (256) разработан стандарт UNICOD, в котором для перекодировки букв используется 2 байта.

Минимальной физической структурной единицей представления данных является файл – поименованная совокупность однородных данных. Основное место хранения файлов – внешняя память компьютера (диски). При обработке файл помещается во внутреннюю память компьютера. Управляет организацией хранения и доступа к файлам на диске, а также обработкой файлов во внутренней памяти компьютера специальная программа (комплекс) называемая операционной системой. Так же операционная система управляет взаимодействием пользователя с компьютером. Файлы, с точки зрения обработки, делятся на 2 категории – исполняемые (программы), т.е. те, которые могут автоматически выполняться обработчиком байтов – процессором, и текстовые, которые могут храниться, копироваться, обрабатываться какой-либо программой. В текстовых файлах обычно хранятся перекодированные с «человеческого» языка данные.

Символьные данные хранятся в следующих основных видах (файлах):

  1. Текст. В таких файлах хранятся байты, соответствующие «нажатым» клавишам на клавиатуре. Может быть обработан любой программой-инструментом.

  2. Документ. Форматированный текст. Минимальной структурной единицей является абзац. В этом виде в файле хранится не только текст, но и правила его вывода на устройство отображения, как-то размер бумаги, шрифт, размер, цвет, расстояние от границ и т.д. Документ визуализируется либо специальной программой, либо той программой, с помощью которой был создан.

  3. Таблица. Регулярно структурированный текст. Минимальная структурная единица – ячейка. В файле хранится текст, описание структуры, правила табличных расчетов.

  4. Картотека. Минимальная структурная единица – запись. В файлах хранится заголовок – описание структуры, и текстовые записи. Используются специальные типы файлов – файлы прямого доступа, в которых минимальной физической структурной единицей является запись ( в отличие от используемых в первых трех формах файлах последовательного доступа с минимальной структурной единицей – файл).

В соответствии с основными формами представления символьных данных классифицируются инструментальные программные средства:

  • Текстовые редакторы – программы для создания и редактирования текстов (Notepad)

  • Текстовые процессоры – программы для создания и редактирования документов (WinWord)

  • Табличные процессоры – программы для создания и редактирования таблиц с правилами табличных расчетов (Excel). Файлы с данными называются электронные таблицы.

  • Системы управления базами данных (СУБД) – программы для создания, редактирования и отбора данных из картотек, называемых файлами баз данных и свободных таблиц. (Access, Oracle, SQL-сервер, FoxPro)

Каждое из названных инструментальных программных средств обладает определенными достоинствами и недостатками. Так, например, WORD обладает великолепными возможностями замены частей и целиком слов, EXCEL – сортировкой, группированием данных, подведением итогов по группам, графической интерпретацией СУБД позволяют «заполнять» данными «колонки» записей, «связывать» различные таблицы, искать и отбирать данные.

Важным является понятие многозадачности. Как известно, человек по-разному воспринимает разные формы представления данных. Достаточно часто для более эффективного анализа данных желательно одновременно видеть их табличное представление, графическую интерпретацию, результат подстановки сведений из таблиц в «бланки» и т.п. Поскольку разнородные данные обрабатываются разными инструментами, необходимо обеспечить возможность одновременной работы разных программ с выводом результатов обработки данных на общий экран. Эту задачу решают многозадачные операционные системы, определяющие возможность одновременного вывода на экран нескольких окон, в каждом из которых производится обработка различных форм представления данных. Другими способами отображения разнородных данных являются технологии OLE (редактирование связанных объектов), когда «одна форма представления данных» - объект- вставляется в файл с другой формой представления данных, и при этом «запоминается» инструмент для обработки объекта; ODBC –соединение с объектом базы данных, HTML –гипертекстовые данные со ссылками на другие объекты.