Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Заочники / Тема 4.doc
Скачиваний:
112
Добавлен:
16.03.2016
Размер:
745.98 Кб
Скачать

3.2. Обработка данных и информации

ИТ широко используются в самых различных сферах деятельности современного общества и, в первую очередь, — в информационной сфере. Они позволяют оптимизировать разнообразные ИП, начиная от подготовки и издания печатной продукции и кончая информационным моделированием и прогнозированием глобальных процессов развития природы и общества. При этом ИТ в любых предметных областях наиболее часто используются для обработки данных (информации).

Обработка — понятие широкое, часто включает в себя несколько взаимосвязанных более мелких операций. К обработке относят операции проведения расчетов, выборки, поиска, объединения, слияния, сортировки, фильтрации и др. Важно помнить, что обработка — это систематическое выполнение операций над данными (информацией, знаниями); процесс преобразования, вычисления, анализа и синтеза любых форм данных, информации и знаний путем систематического выполнения операций над ними.

Обработка данных - процесс выполнения последовательности операций над данными. Обычно отдельно выделяют операции обработки данных, информации и знаний.

Технология обработки информации - это упорядоченная взаимосвязь действий, выполняемых в строго определенной последовательности с момента возникновения информации до получения заданных результатов.

Технология обработки информации зависит от характера решаемых задач, используемых средств вычислительной техники, числа пользователей, систем контроля за процессом обработки информации и т. д. При этом она используется при решении хорошо структурированных задач с имеющимися входными данными и алгоритмами, а также стандартными процедурами их обработки.

Технологический процесс обработки информации может включать следующие операции (действия): генерация, сбор, регистрация, анализ, собственно обработка, накопление, поиск данных, информации, знаний и др.

Обработка информации происходит в процессе реализации технологического процесса, определяемого предметной областью. Рассмотрим основные операции (действия) технологического процесса обработки информации.

Обработка часто включает в себя несколько взаимосвязанных более мелких операций. К обработке можно отнести такие операции, как: проведение расчетов, выборка, поиск, объединение, слияние, сортировка, фильтрация и т. д. Обработка представляет собой систематическое выполнение операций над данными, процесс преобразования, вычисления, анализа и синтеза любых форм данных, информации и знаний посредством систематического выполнения операций над ними.

При определении такой операции, как обработка, выделяют понятия «обработка данных», «обработка информации» и «обработка знаний». При этом отмечают обработку текстовой, графической, мультимедийной и иной информации.

Обработка текстов является одним из средств электронного офиса. Обычно наиболее трудоемким процессом работы с электронным текстом является его ввод в ЭВМ. За ним следуют этапы подготовки (в том числе редактирование) текста, его оформление, сохранение и вывод. Этот вид обработки предоставляет пользователям различный инструментарий, повышающий эффективность и производительность их деятельности. При этом существуют программы, распознающие отсканированный текст, что существенно облегчает работу с подобными данными.

Обработка изображений получила широкое распространение с развитием электронной техники и технологий. При обработке изображений требуются высокие скорости, большие объемы памяти, специализированное техническое и программное обеспечение. При этом существуют средства сканирования изображений, существенно облегчающие их ввод и обработку в ЭВМ. В компьютерных технологиях используют векторную, растровую и фрактальную графику. Изображения имеют различный вид, могут быть двух- и трехмерными, с выделенными контурами и т. д.

Обработка таблиц осуществляется специальными прикладными программами, дополненными макросами, диаграммами, аналитическими и иными возможностями. Работа с электронной таблицей позволяет вводить и обновлять данные, команды, формулы, определять взаимосвязь и взаимозависимость между клетками (ячейками), таблицами, страницами, файлами с таблицами и БД, данными в виде функций, аргументами которых являются записи в ячейках.

Обработка данных (от англ. data processing) — это процесс последовательного управления данными (числа и символы) и преобразования их в информацию.

Обработка данных может осуществляться в интерактивном и фоновом режимах. Основное развитие эта технология получила в СУБД.

Общеизвестны следующие способы обработки данных: централизованная, децентрализованная, распределенная и интегрированная.

Централизованная обработка данных в ЭВМ в основном представляла собой пакетную обработку информации. При этом пользователь доставлял в вычислительный центр (далее — ВЦ) свою исходную информацию, а затем получал результаты обработки в виде документов и (или) носителей. Особенностью такого способа являются сложность и трудоемкость налаживания быстрой, бесперебойной работы, большая загруженность ВЦ информацией (большой объем), регламентация времени выполнения операций, организация безопасности системы от возможного несанкционированного доступа. Поскольку сложность решаемых задач обычно обратно пропорциональна их количеству, то централизованная обработка данных зачастую приводила к неэффективному использованию вычислительных ресурсов центральной ЭВМ, ограничивала доступ пользователей к ее ресурсам, но требовала значительных материальных затрат на создание и эксплуатацию систем обработки данных.

Принцип централизованной обработки данных ранее не отвечал высоким требованиям к надежности процесса обработки, затруднял развитие систем, не мог обеспечить необходимые временные параметры при диалоговой обработке данных в многопользовательском режиме. А даже кратковременный выход из строя центральной ЭВМ мог привести к серьезным негативным последствиям. Ныне эта технология полумиля новое развитие в создаваемых высоконадежных и эффективных центров обработки данных (далее — ЦОД).

Децентрализованная обработка данных связана с появлением ПЭВМ (малых ЭВМ, микроЭВМ), позволивших автоматизировать конкретные рабочие места и повлекших за собой возникновение распределенной обработки данных.

Распределенная обработка данных — это обработка данных, выполняемая на независимых, но связанных между собой компьютерах, представляющих распределенную систему, т. е. в компьютерных информационных сетях. Она реализуется двумя путями. Первый предполагает установку ЭВМ в каждом узле сети (или на каждом уровне системы), при этом обработка данных осуществляется одной или несколькими ЭВМ в зависимости от реальных возможностей системы и ее потребностей на текущий момент времени.

Второй путь предполагает размещение большого числа различных процессоров внутри одной системы. Распределенный способ основывается на комплексе специализированных процессоров — каждая ЭВМ используется для решения определенных задач, или задач своего уровня. Он применяется там, где необходима сеть обработки данных (филиалы, отделения и т.'д.), например, в системах обработки банковской и финансовой информации.

Преимущества такого способа заключаются в возможности: обрабатывать в заданные сроки любой объем данных с высокой степенью надежности (при отказе одного технического средства можно моментально заменить его на другой); сократить время и затраты на передачу данных; повысить гибкость систем; упростить разработку и эксплуатацию ПО и т. д.

Интегрированный способ обработки информации предусматривает создание информационной модели управляемого объекта — РБД. Он обеспечивает максимальное удобство для пользователя. С одной стороны, БД предусматривают коллективное пользование и централизованное управление. С другой стороны, объем информации, разнообразие решаемых задач требуют распределения БД. Технология интегрированной обработки информации позволяет улучшить качество, достоверность и скорость обработки, так как обработка производится на основе единого информационного массива, однократно введенного в ЭВМ.

Особенность этого способа заключается в отделении технологически и по времени процедуры обработки от процедур сбора, подготовки и ввода данных.

В информационных сетях обработка информации осуществляется различным образом: в пакетном и регламентном режимах; режимах реального масштаба времени, разделения времени и телеобработки, а также запросном, диалоговом, интерактивном; однопрограммном и многопрограммном (мультиобработка) режимах.

Обработка данных в пакетном режиме означает, что каждая порция не срочно передаваемой информации (как правило, в больших объемах) обрабатывается без вмешательства извне — формирование отчетных данных (сводок и т. п.). При его использовании пользователь не имеет непосредственного общения с ЭВМ. Как правило, это задачи неоперативного характера, с долговременным сроком действия результатов решения. При этом сбор, регистрация, ввод и обработка информации не совпадают по времени. Сначала пользователь собирает информацию и формирует ее в пакеты в соответствии с видом задач или другим признаком. По окончании приема информации производится ее ввод и обработка. В результате происходит задержка обработки.

Этот режим порой называют фоновым. Он реализуется, когда свободны ресурсы вычислительных систем и обработка может прерваться более срочными и приоритетными процессами и сообщениями, по окончании которых она возобновляется автоматически. Режим используется, как правило, при централизованном способе обработки информации.

В режиме разделения времени в одном компьютере осуществляется чередование во времени процессов решения разных задач. В этом режиме ресурсы компьютера (системы) для оптимального их использования предоставляются сразу группе пользователей циклично, на короткие интервалы времени. При этом система выделяет свои ресурсы группе пользователей поочередно. Поскольку ЭВМ быстро обслуживает каждого из группы пользователей, создается впечатление одновременной их работы. Такая возможность достигается путем использования специального ПО.

Режим реального времени — это технология, обеспечивающая реакцию управления объектом, соответствующую динамике его производственных процессов. Он означает способность вычислительной системы взаимодействовать с контролируемыми или управляемыми процессами в темпе протекания этих процессов. Время реакции может измеряться секундами, минутами, часами и должно удовлетворять темпу контролируемого процесса или требованиям пользователей и иметь минимальную задержку.

В системах реального времени обработка данных по одному сообщению (запросу) завершается до появления другого. Как правило, такой режим используется при децентрализованной и распределенной обработке данных и применяется для объектов с динамическими процессами. Например, обслуживание клиентов в банке по любому набору услуг должно учитывать допустимое время ожидания клиента, одновременное обслуживание нескольких клиентов и укладываться в заданный интервал времени (время реакции системы).

Интерактивный режим предполагает возможность двустороннего взаимодействия пользователя с системой, т. е. пользователь может воздействовать на процесс обработки данных. Интерактивная работа осуществляется в режиме реального времени и обычно используется для организации диалога (диалоговый режим).

Диалоговый (запросный) режим характеризуется возможностью пользователя в процессе работы с ЭВМ непосредственно взаимодействовать с ней. Программы обработки данных могут находиться в памяти компьютера постоянно (ЭВМ доступна в любое время) или в течение определенного промежутка времени (только когда ЭВМ доступна пользователю).

Диалоговое взаимодействие пользователя с компьютером может быть многоаспектным и определяться такими факторами, как: язык общения; активная или пассивная роль пользователя; кто является инициатором диалога (пользователь или ЭВМ); время ответа; структура диалога и т. д. Если инициатором диалога является пользователь, то он должен обладать знаниями и навыками работы с процедурами, форматами данных и т. п. Если инициатор — ЭВМ, то она сама на каждом шаге сообщает, что нужно делать пользователю — метод «выбора меню». Данный метод обеспечивает поддержку действий пользователя и предписывает их последовательность. При этом от пользователя требуется меньшая подготовленность.

Диалоговый режим требует определенного уровня технической оснащенности пользователя: наличие терминала или ПЭВМ, связанных телекоммуникациями с центральной ЭВМ. Возможность работы в диалоговом режиме может быть ограничена во времени началом и концом работы, а может быть неограниченной. Режим используется для доступа к информации, вычислительным или программным ресурсам.

Иногда различают диалоговый и запросный режимы. Под запросным режимом понимается одноразовое обращение к системе, после которого она выдает ответ и отключается (например, справочная система), а под диалоговым — режим, при котором система после запроса выдает ответ и ждет дальнейших действий пользователя.

Режим телеобработки позволяет удаленному пользователю взаимодействовать с ЭВМ (его порой называют терминальным).

Однопрограммный и многопрограммный режимы характеризуют возможность системы работать одновременно по Одной или нескольким программам.

Регламентный режим ориентирован на определенную во времени последовательность выполнения отдельных задач пользователя. Например, регулярное (ежемесячное, квартальное и т. п.) получение результатных сводок и отчетов, расчет ведомостей начисления зарплаты к определенным датам и т. д. При этом выделяют регулярные, специальные, сравнительные, чрезвычайные и иные виды отчетов. Регулярные отчеты обычно создаются в соответствии с установленным графиком, определяющим время их создания, например месячный анализ продаж организации. Специальные отчеты создаются по запросам администрации или в случае незапланированных ситуаций. Названные отчеты могут иметь форму суммирующих, сравнительных и чрезвычайных отчетов. В суммирующих отчетах данные объединяют в отдельные группы, сортируют, представляют в виде промежуточных и окончательных итогов по отдельным полям. Сравнительные отчеты включают данные, полученные из разных источников или классифицированные по различным признакам и используемые для целей сравнения. Чрезвычайные отчеты содержат данные исключительного (чрезвычайного) характера.

Обработка информации подразумевает переработку информации определенного типа (текстовой, звуковой, графической и др.) и преобразования ее в информацию другого определенного типа. Так, например, принято различать обработку текстовой информации, изображений (графики, фото, видео и мультипликация) и звуковой информации (речь, музыка, другие звуковые сигналы). Использование новейших технологий обеспечивает их комплексное представление. При этом человеческое мышление может рассматриваться как процесс обработки информации.

ИТ обработки информации предназначена для решения хорошо структурированных задач, по которым имеются необходимые входные данные, известны алгоритмы и другие стандартные процедуры их обработки. Эта технология применяется в целях автоматизации рутинных постоянно повторяющихся операций, что позволяет повышать производительность труда, освобождая исполнителей от рутинных операций, а порой и сокращая численность работников. При этом решаются задачи: обработки данных; создания периодических отчетов о состоянии дел; связанные с получением ответов на различные текущие запросы и оформлением их в виде документов или отчетов. При этом применяют такие ИТ, как: сбор и регистрация данных непосредственно в процессе производства в форме документа с использованием центральной ЭВМ или персональных компьютеров; обработка данных в режиме диалога; агрегирование (объединение) данных; использование электронных носителей информации (например, дисков).

Технологический процесс обработки информации с использованием ЭВМ включает следующие операции:

  • прием и комплектование первичных документов (проверка пол ноты и качества их заполнения, комплектности и т. д.);

  • подготовка электронного носителя и контроль его состояния;

  • ввод данных в ЭВМ;

  • контроль, результаты которого выдаются на внешние устройства (принтер, монитор и т. д.).

Существуют и другие подобные технологии, однако обратим внимание на ИТ (операции) контроля данных, редко рассматриваемые в специальной учебной литературе. В различных ситуациях приходится контролировать получаемые или распространяемые данные и информацию. С этой целью широко применяют ИТ. Различают визуальный и программный контроль, позволяющий отслеживать информацию на полноту ввода, нарушение структуры исходных данных, ошибки кодирования. Контроль не является самоцелью. При обнаружении ошибки производят:

  • исправление вводимых данных, корректировку и их повторный ввод;

  • запись входной информации в исходные массивы;

  • сортировку (если в этом есть необходимость);

  • обработку данных;

  • повторный контроль и выдачу окончательной информации

Рассмотрим более подробно обработку различных названных выше типов (видов) информации.

Обработка текстовой информации

Текстовая обработка включает в себя следующие процессы: занесение (ввод) текста; изменение текстовых фрагментов, порядка следования предложений и параграфов; форматирование текста; автоматическое разбиение текста на страницы и др. Эти процессы реализуются с помощью специального ПО — текстовых редакторов и процессоров, используемых для составления, редактирования и обработки различных видов информации. Отличие текстовых редакторов от процессоров (от англ. word processor) заключается в том, что редакторы (от англ. text editor), как правило, предназначены для подготовки текстов без форматирования, а процессоры используют большее количество операций обработки документов. Результатом работы простого редактора является файл, в котором все знаки являются знаками кодовой таблицы ASCII. Такие файлы называются ASCII-файлами. Подобные программы условно можно разделить на обычные (подготовка писем и других простых документов) и сложные (оформление документов с разными шрифтами, включающие графики, рисунки и др.).

Для подготовки текстов на естественных языках, вывода их на печатающие устройства, для обработки документов, имеющих структуру документа, т. е. состоящих из абзацев, страниц, разделов, необходимо существенно расширить количество операций редактора. При этом программный продукт переходит в новое качество — систему подготовки текстов. Среди таких систем выделяют три больших класса: форматеры, текстовые процессоры и настольные издательские системы.

Форматер не использует для внутреннего представления текста никаких дополнительных кодов, кроме стандартных ASCII символов (конец строки, перевод каретки, конец страницы и т. п.) — это текстовый редактор.

Текстовый процессор во внутреннем представлении снабжает текст специальными кодами — разметкой.

В основном экранные (текстовые) редакторы и текстовые процессоры различаются по назначению: первые создают ASCII-файлы, используемые затем компиляторами или форматерами, вторые предназначены для подготовки текстов и последующей печати на бумаге. Форма представления текста имеет большое значение. Наибольшей популярностью пользуется текстовый процессор Microsoft Word for Windows (MS Word).

Текстовые процессоры обычно имеют уникальную структуру данных для представления текста, поэтому текст, подготовленный в одном текстовом процессоре, может не прочитаться другими. В целях совместимости текстовых документов при переносе их из одного текстового процессора в другой используют программы-конвертеры. Такая программа получает информацию в одном файловом формате и выдает файл с информацией в требуемом формате. Современные программы текстовой обработки содержат встроенные модули конвертации (конвертирования), поддерживающие популярные файловые форматы. В версии Microsoft Word 2007 вместо основного формата «.doc» предлагается формат «.docx». При этом можно сохранять данные в форматах PDF, XPS (XML Paper Specification) и открытых форматах.

Настольные издательские системы предназначены для подготовки текстов по правилам полиграфии и с типографским качеством. Прикладная программа настольной издательской системы (например, Microsoft Office Publisher, Adobe InDesign CS3) является инструментом верстальщика, дизайнера, технического редактора. В ней можно легко менять форматы страниц, размер отступов, комбинировать различные шрифты и т. п.

Современные текстовые процессоры, как и другие прикладные программы, используют единый интерфейс, обеспечивающий пользователям комфортные условия работы и включающий инструменты, помогающие создавать и редактировать файлы, просматривать команды, параметры диалоговых окон, разделы справки, использовать мастера и шаблоны и т. д. Рассмотрим некоторые их возможности.

Многовариантность выполнения операций позволяет выполнять операции одним из трех-четырех возможных способов.

Колонтитулом называют одинаковые для группы страниц текст и (или) графическое изображение, расположенные на полях печатной страницы вне основного текста документа. Различают верхний (от англ. header — над текстом документа) и нижний (от англ. footer — ниже основного текста) колонтитулы. Порядковые номера страниц входят в колонтитул. Их называют колонцифрами.

Шаблоны. В текстовом, как и в табличном процессоре можно формировать шаблоны страниц или рабочих листов, применяемые для создания бланков писем и факсов, различных калькуляций.

Программирование. Для автоматизации выполнения часто повто ряемых действий можно использовать встроенный язык программиро вания макрокоманд, позволяющий упростить работу с прикладной про граммой. Самый простой макрос — это записанная последовательность нажатия клавиш, перемещений и щелчков кнопками мыши. Она может «воспроизводиться», обрабатываться и изменяться.

Создание текстовых документов заключается в последовательном выполнении ряда этапов. Среди них выделяют: набор текста; редактирование введенной информации; форматирование (оформление) отдельных структурных элементов создаваемого документа; печать документа; сохранение текста документа и ведение архива текстов. Каждый из этих этапов состоит из множества операций.

При работе с текстом обычно происходит многократное чередование операций различных этапов, поэтому отдельные операции нельзя четко отнести к определенному этапу подготовки документа. К основным операциям редактирования относят: добавление; удаление; перемещение; копирование фрагмента текста, а также поиск и контекстная замена.

Под фрагментом понимают область текста, указанную (выделенную, маркированную) пользователем. Минимальный размер фрагмента — один символ, максимальный — весь текст документа. Различают строчные, прямоугольные выделенные фрагменты и цепочки символов. В последнем случае границами выделения служат первый и последний символ в цепочке. Выделенный фрагмент на экране монитора отмечается цветом или негативным изображением. Снять с него маркировку можно специальной командой

Текстовый редактор WinWord содержит набор шаблонов для создания различных типовых, а порой и стандартизированных, документов. При создании нового документа предполагается использование шаблона (по умолчанию это «Normal.dot»). Шаблоны содержат разнообразную информацию о стилях форматирования частей документа, вставленных полях и т. д. В них хранятся выбранные и установленные для них макрокоманды, элементы глоссария, кнопки панели инструментов, нестандартные меню и способы установки клавиш сокращения, облегчающие работу с документами. Пользователи могут создавать собственные шаблоны, позволяющие быстро готовить аналогичные по форме (но не по содержанию) документы.

Технология связи и внедрения объектов (от англ. object linking and embedding, OLE) позволяет легко выполнять эти задачи. При связывании отслеживается положение файла — источника изображения. Любое изменение данных этого файла с помощью OLE вызывает автоматическое обновление связанного объекта. При встраивании объекта он хранится непосредственно в составном документе вместе с информацией о приложении-источнике. Редактирование объекта происходит непосредственно из среды текстового процессора, для чего автоматически запускается программа, умеющая его редактировать.

Размещение графических фрагментов в текстовом документе производится с использованием кадров.

Кадр — это хранилище для размещения объектов в области страницы, не управляемой параметрами полей печатной страницы (например, между колонками текста или в области полей страницы). Кадр появляется как окно вокруг заключаемого объекта и обладает особыми свойствами. Одно из самых важных его свойств — возможность окружать объект текстом. Развитые системы компьютерной подготовки текстов позволяют использовать кадры как прямоугольной, так и неправильной формы.

Обработка числовой информации

Числовая обработка, как правило, осуществляется с помощью таблиц.

Термин «таблица» означает:

  • перечень сведений, цифровых данных, запись их в известном по рядке по графам;

  • печатный материал, сгруппированный в виде нескольких столб цов (граф), имеющих самостоятельные заголовки и отделенных друг от друга линейками.

Табличная обработка подразумевает: хранение текста (заголовка таблицы, имени поля и т. п.), чисел, ссылок на расчетную формулу, по которой осуществляются вычисления в соответствующих клетках таблицы, проведение расчетов на компьютере в табличной форме. Программы, позволяющие выполнять подобные действия, называют электронными таблицами.

Электронная таблица — это интерактивная система обработки информации, упорядоченной в виде таблицы с поименованными строками и столбцами.

Структура таблицы включает нумерационный и тематический заголовки, головку (шапку), боковик (первая графа таблицы, содержащая заголовки строк) и прографку (собственно данные таблицы). С помощью электронных таблиц решаются задачи расчетов, поддержки принятия решений, моделирования и представления результатов практически во всех сферах деятельности. В большинстве случаев достаточно один раз отработать форму таблицы и установить характер необходимых расчетов (например, расчет заработных плат и доплат, статистический расчет и др.). Затем технологический процесс сводится к вводу или корректировке данных и получении, в результате автоматического расчета, окончательных значений и решений.

Одной из первых электронных таблиц была программа Visual Calc, разработанная в 1979 г. в США. При решении планово-экономических задач, бухгалтерском и банковском учете, проектно-сметных работах и т. п. наиболее часто используют табличный процессор Microsoft Excel, хотя находят применение и другие процессоры, например, Lotus 1—2—3.

Работа табличного процессора рассматривается на примере ПО Excel.

Excel представляет собой мощный арсенал средств ввода, обработки и вывода в удобных для пользователя формах фактографической информации. Эти средства позволяют обрабатывать фактографическую информацию, используя типовые функциональные зависимости (финансовые, математические, статистические, логические и т. д.), строить объемные и плоские диаграммы, обрабатывать информацию по пользовательским программам, анализировать ошибки, возникающие при обработке информации, выводить на экран или печать результаты обработки информации в наиболее удобной для пользователя форме.

Соседние файлы в папке Заочники