- •Тема 2. Общая характеристика процессов сбора, передачи, обработки, накопления информации
- •Сбор и регистрация информации: сущность, значение, виды.
- •2 Вопрос: Технологии передачи информации.
- •2.1 Принципы передачи информации в виде электрических сигналов.
- •2.2 Современные каналы передачи данных.
- •3 Вопрос: Внутримашинная технология обработки данных (втод): составляющие и их характеристики.
- •4 Вопрос:
3 Вопрос: Внутримашинная технология обработки данных (втод): составляющие и их характеристики.
Операции внутримашинной ОД, к которым относятся сортировка, корректировка, накопление и собственно ОД, являются основными в технологическом процессе функционирования систем обработки информации.
В результате сортировки произвольно расположенные данные размещаются в определенном порядке. В системах обработки экономической информации более 25% машинного времени тратится на сортировку. Различают следующие виды сортировки:
- упорядочение, т.е. процесс, в результате которого записи сортируемого файла располагаются в порядке возрастания / убывания ключевых реквизитов-признаков
- распределение, т.е. процесс разнесений записей сортируемого файла по группам с одинаковым значением ключевых реквизитов-признаков;
- объединение (слияние), т.е. процесс, в результате которого несколько упорядоченных файлов сливаются в 1 с записями, расположенными в определенной логической последовательности.
В состав ОС любых современных ЭВМ, не говоря уже о СУБД, входят программы сортировки, обеспечивающие как внутреннюю, так и внешнюю сортировку. Задавая такие параметры, как количество записей в файле, длина записи, местоположение ключа, его длина, формат записей, указывающая об упорядоченности выходного файла, пользователь настраивает программу на конкретные условия сортировки.
Под корректировкой понимается процесс модификации сформированных файлов данных, позволяющий поддерживать их соответствие реально существующим условиям обработки. При корректировке могут выполняться следующие действия: добавление, исключение, изменение записей существующих файлов данных.
Объектами корректировки могут быть записи файла или отдельные поля записей. Одним из основных условий выполнения корректировки является поиск местоположения данных, который, как правило, осуществляется по ключам.
В зависимости от того, сколько записей одновременно подвергаются модификации, принято разделять ее на индивидуальную и групповую. При индивидуальной корректировке одна корректирующая запись вызывает модификацию одной записи файла, а при групповой - нескольких записей. (Так, примером групповой корректировки могут служить изменение значения некоторого реквизита во всех записях файла).
Необходимо различать корректировку автономных файлов и БД. В первом случае модификации подвергаются только записи соответствующего файла, а во втором - записи файлов и соответствующие связи.
Корректировка проводится в основном по принципу "отец-сын". Сущность его заключается в том, что для выполнения модификации необходим исходный файл (отец) и файл корректуры, в результате получается откорректированный файл (сын).
Большое значение при корректировке придается контролю достоверности информации и ее защите от несанкционированного доступа. Это обеспечивается путем сохранения исходного файла и файла корректуры (а также введением системы паролей и ключей защиты).
Накопление данных представляет собой процесс периодического добавления данных в существующие файлы с целью получения сведений за определенный интервал времени. Накопление данных можно считать частным случаем корректировки данных.
Собственно обработка данных включает в себя выполнение арифметических операций на битовом уровне. При обработке экономической информации большой удельный вес занимают операции таксировки(Оценка натуральных показателей в денежном (стоимостном) выражении) и получения итогов. Вообще, обработка данных на ЭВМ характеризуется тем, что лишь 20% машинного времени (работы процессора) затрачивается непосредственно на алгебраическую обработку, а 80% - на обработку данных, одним из важных принципов построения мобильных программ является отделение описаний данных от программ по их обработке. Последовательное применение этого принципа обеспечивает хорошую основу для создания систем автоматизированного проектирования систем ОД, т.к. с помощью автономных описаний данных можно автоматизировать построение необходимой системы обработки информации.
Вывод данных подразумевает получение результатов решения задач. По способу отображения выходной (результатной) информации различают вывод данных на бумагу, на машинные носители и на видеотерминальные устройства (дисплеи).
Традиционно результаты обработки отображаются в виде бумажных документов. При этом они проверяются на комплектность и логическую непротиворечивость, а затем оформляются юридически.
С развитием технического, программного и иного обеспечения стала преобладать тенденция перехода на безбумажную технологию обработки данных, но полный отказ от бумажных документов пока невозможен, в частности, из-за нерешенности правовых вопросов оформления информации.
В зависимости от способа формирования выходных данных различают пакетный и интерактивный режимы. При пакетном режиме должна быть определена совокупность выгодных форм, являющихся результатом решения регламентированных задач. Интерактивный режим дает возможность пользователю формировать выходные документы в такой форме, которая ему больше подходит в каждом конкретном случае. При этом можно определить не только форму, но и алгоритм ее заполнения.
Вывод данных может осуществляться как непосредственно в месте обработки, так и по каналам связи для удаленных абонентов. По степени ориентации на пользователей различают автономный вывод и с помощью АРМов.
Автономный вывод характеризуется тем, что результаты решения задач попадают к пользователю через некоторое время, т.к. при этом формирование и использование выходных данных разобщено по времени и в пространстве.
В случае использования АРМов пользователь получает результатную информацию сразу после обработки на своем рабочем месте.
Создание первых ЭВМ было связано с необходимостью решить проблему ввода в них управляющих воздействий и представления данных. Все логические устройства и электронные схемы памяти имеют 2 устойчивых состояния - открыто (включено) и закрыто (выключено). Этим 2 состояниям поставили в соответствие 2 цифры двоичной системы исчисления - 0 и 1. Т.о., вся информация в компьютере представляется в числах двоичной системы исчисления, в отличие от привычной десятичной. На физическом уровне 1 означает наличие электрического заряда, а 0 - его отсутствие. Т.о., чтобы обращаться к ЭВМ напрямую, нужно владеть машинным языком, представляющим собой последовательность цифр двоичной системы (1 и 0).
Наименьшая единица информации, представленная в виде 0 или 1, называется битом(один двоичный разряд в двоичной системе счисления)( английское bit, от binary - двоичный и digit - знак, цифра), 1) цифра в двоичной системе счисления. 2) Единица измерения количества информации, численно равна объему информации, содержащейся в сообщении типа "да" - "нет). Каждый символ (число, цифра, знак), представляемый в компьютере, кодируется в виде комбинации из 8 нулей и единиц. Такая совокупность битов образует 1 байт.
Т.о., 1 байт = 8 бит
1 Кбайт = 1024 байт
1 Мбайт = 1024 Кбайт = 1024х1024 байт
1 Гбайт = 1024 Мбайт = и т.д.
1 ТбайтТера) = 1024 Гбайт…
1 Пбайт(Пета) = 1024 Тбайт
1 Эксабайт = 1024 Пбайт
Аналогичным образом кодируются не только символы, но и все выполняемые операции: сложение, вычитание, умножение, деление, сдвиг.
Любая информация, с которой работает компьютер, записывается в специальные ячейки памяти микропроцессора, которые называются регистрами.
Регистр имеет свой адрес, по которому определяется местонахождение той или иной информации.
Следовательно, программа, написанная в машинных кодах представляется собой совокупность команд, содержащих коды операций, и адреса данных, записанные в двоичном коде.
При этом программисту для работы с ЭВМ нужно знать не только тонкости машинного языка, но и архитектуру используемого компьютера, а это достаточно сложно. Поэтому машинные языки долгое время сдерживали дальнейшее распространение ЭВМ, являясь барьером между машиной и пользователем-непрограммистом.
Впоследствии появились специальные программы - трансляторы, которые переводят программы и отдельные команды с языков программирования (Бейсик, Фортран, Паскаль, Си) на машинный язык. Современные языки программирования ближе к человеческим, их логика больше похожа на логику человека по сравнению с машинными языками, а средства записи напоминают слова разговорного английского языка.
Существуют различные способы оценки количества информации. Классическим является подход, использующий Клода Шеннона. Применительно к двоичной системе она имеет вид:
,
где H – количество информации, несущей представление о состоянии, в котором находится объект;
N – количество равновероятных альтернативных состояний объекта.
СКОРОСТЬ ПЕРЕДАЧИ ИНФОРМАЦИИ:
V = v * t
V-объем передаваемого файла
v-скорость передачи файла(бит/с)
t-время передачи файла
АЛФАВИТНЫЙ ПОДХОД
I = i * k
I – количество информации при алфавитном подходе
i – количество информации, которое несет каждый символ алфавита
k – количество символов в сообщении
