Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Иформационные технологии анализа данных в MS Office.doc
Скачиваний:
298
Добавлен:
16.12.2013
Размер:
2.7 Mб
Скачать

Аналитическая обработка данных в microsoft office

Пакет Microsoft Office 2000 полностью ориентирован на интеграцию разнородных данных и работу с информационными ресурсами INTERNET. Наиболее подходящими для аналитической обработки данных являются следующие программы: Microsoft Excel, СУБДAccess, языкMicrosoftQuery,PowerPoint.

Microsoft Excel – удобная среда анализа данных, включая обработку OLAP–кубов. Средствами Microsoft Excel реализуются базовые вычисления и моделирование данных:

  • Встроенные функции различных категорий.

  • Решение задачи «обратного вывода» путем подбора значения аргумента по заданному значению функции.

  • Сценарный подход для многовариантных значений параметров модели (задача «Что если?»).

  • Таблица подстановок значений одного аргумента для нескольких функций или двух аргументов для одной функции (задача «анализа чувствительности»).

  • Методы математического программирования для решения оптимизационных задач.

  • Методы статистической обработки с помощью Пакета анализа.

  • Агрегирование информации (промежуточные итоги, консолидация данных, сводные таблицы).

  • Графические методы решения экономических задач.

  • Web–публикации данных анализа в виде интерактивных сводных таблиц, диаграмм.

СУБД Access – среда хранения и обработки больших массивов данных. Имеются мощные языковые средства для автоматизации обработки данных: языки запросов высокого уровня QBE (Query By Example) и SQL (Structured Query Language), язык программирования VB (Visual Basic). Возможно создание клиент–серверных приложений, подготовка данных для серверной БД КИС.

Пакет презентационной графики Power Point обеспечивает мультимедийное оформление результатов анализа (графика, текст, звуковое сопровождение), их публикацию в виде Web–страниц.

Таким образом, с помощью средств Microsoft Office можно создавать приложения, которые поддерживают основные этапы анализа данных:

  • Получение/создание данных для анализа.

  • Контроль достоверности исходных данных.

  • Применение различных математических методов для анализа данных.

  • Интерпретация результатов анализа.

Интеграция данных в microsoft office

Одним из основных средств интеграции является метод конвертирования форматов данных. В состав программ Microsoft Office входят внутренние и внешние конверторы, состав которых может расширяться без ограничений.

При работе в среде Microsoft Excel возможен как импорт, так и экспорт данных. В основном импорт данных обеспечивается при открытии файлов с помощью команды меню ФайлОткрыть. В табл. 2 приведены допустимые форматы преобразования файлов в электронные таблицы.

Таблица 2

Формат

Программа

.dbf

DBase II, III и IV

wq1 (*.wq1)

Quattro Pro для MS-DOS

.wb1

Quattro Pro версии 5.0 для Windows

.wb2

Quattro Pro версии 6.0 для Windows

.wb3

Quattro Pro версии 7.0 для Windows

.wks

Microsoft Works версии 2.0 для Windows и Microsoft Works для MS-DOS

В открытую электронную таблицу EXCEL можно передать через буфер обмена фрагменты активных документов Microsoft Word. Таким способом импортируются таблицы для продолжения вычислений, тексты, вставляемые в качестве комментариев, рисунки Microsoft Word и др.

  1. В среде Microsoft Word выделяется импортируемый объект.

 Если таких объектов несколько, следует воспользоваться буфером обмена. Microsoft Office 2000 поддерживает буфер обмена, который может содержать до 12 фрагментов. Для вызова панели буфера обмена выполняется команда меню Microsoft Word ВидПанели инструментов, выбирается панель Буфер обмена.

  1. Создание буфера обмена – команда меню ПравкаКопировать.

 После выделения нового фрагмента и выполнения очередного копирования создается новый буфер обмена.

  1. Курсор устанавливается в электронной таблице в место вставки фрагмента.

  2. Вставка буфера обмена – команда меню ПравкаВставить.

 Если буферов обмена несколько, вставляемый фрагмент указывается на панели инструментов Буфер обмена, нажимается кнопка Вставить.

Для вставки фрагмента текстового документа в Microsoft Excel может применяться и команда меню ПравкаСпециальная вставка, которая позволяет вставить фрагмент как:

  • Объект Документ Microsoft Word – фрагмент текстового документа с полным сохранением форматов, данные не могут использоваться для вычислений (фрагмент можно вставить в электронную таблицу как значок).

  • Метафайл Windows (EMF) – рисунок, данные не могут использоваться для вычислений.

  • HTML –фрагмент текстового документа с частичным сохранением форматирования, данные фрагмента доступны для вычислений, форматирования и редактирования непосредственно в электронной таблице.

  • Текст в кодировке UNICODE – фрагмент текстового документа без искажения символов языка оригинала, на котором он подготовлен. Возможности использования фрагмента – аналогично HTML.

  • Текст – обычная вставка без сохранения форматирования фрагмента текстового документа, возможности использования фрагмента – аналогично HTML.

  • Гиперссылка – создание гиперссылки для перехода к фрагменту текстового документа.

 Особенности специальной вставки проявляются, если панель инструментов Буфер обмена не используется.

В открытый текстовый документ Microsoft Word могут вставляться диапазоны ячеек таблиц открытых рабочих книг Microsoft Excel с помощью буфера обмена:

  1. Выделить диапазон ячеек таблицы.

  2. Создать буфер обмена – команда меню ПравкаКопировать.

  3. Курсор устанавливается в текстовом документе в место вставки фрагмента.

  4. Вставка буфера обмена – команда меню ПравкаВставить ячейки.

 Таблица вставляется в текстовый документ с сохранением форматов, формулы не переносятся, данные доступны для редактирования.

Если для вставки фрагмента Microsoft Excel в текстовый документ MicrosoftWordиспользуется команда менюПравкаСпециальная вставка, возможны следующие варианты вставки объектов из буфера обмена (с учетом типа объекта):

  • Лист Microsoft Excel (объект) – вставка диапазона ячеек электронной таблицы.

  • Текст в формате RTF – вставка блока ячеек таблицы с сохранением форматов данных (диаграммы вставляются как рисунки).

  • Неформатированный текст – ячейки строк таблицы отделены друг от друга спецсимволом табуляция, форматирование данных не сохраняется. Для превращения вставленного текста в таблицу Microsoft Word:

  1. Выделить вставленные строки.

  2. Выполнить команду меню Таблица  Преобразовать  Преобразовать в таблицу, указать разделитель – символ табуляции.

  • Формат HTML – вставка блока ячеек таблицы с сохранением формата данных.

 Вставка диаграммы или иных рисунков в этом формате невозможна.

  • Рисунок, Точечный рисунок, Метафайл Windows (EMF) – вставка фрагмента электронной таблицы как рисунка без возможности доступа к данным.

  • Word Hyperlink – вставка гиперссылки для перехода к источнику – текстовому документу.

  • Текст в кодировке Юникод – аналог неформатированного текста искажения символов не происходит.

С помощью команды меню СервисНадстройкиНадстройка AccessLinks Microsoft Excel добавляются в режим Данные новые команды:

  • Форма MS Access

  • Отчет MS Access

  • Перенести в MS Access

Электронную таблицу Microsoft Excel можно преобразовать в несвязанную таблицу в указанной базе данных СУБД Access. Фрагмент электронной таблицы является внедренным объектом в приложение Access. С помощью команды меню ДанныеПеренести в MS Accessячейки электронной таблицы переносятся в базу данных СУБДAccess, создается новая или используется существующая таблица базы данных. Изменения данных в электронной таблице не отражаются в таблице БДACCESSи наоборот. Эта информационная технология позволяет «сбрасывать» данные электронных таблиц в БДAccessдля дальнейшей обработки.

Электронную таблицу Microsoft Excel можно связать с таблицей в указанной базе данных СУБД Access. При работе с данными электронной таблицы Microsoft Excel будет использован стандартный интерфейс (форма или отчет) СУБД Access. По команде ДанныеФорма MS Access осуществляет присоединение электронной таблицы Microsoft Excel к базу банных СУБД Access в виде внешней связанной таблицы, создается экранная форма для работы с таблицей базы данных. Данные в электронную таблицу Microsoft Excel могут вводиться с помощью экранной формы СУБД Access:

  1. Установить курсор в диапазон ячеек таблицы Microsoft Excel.

  2. Выполнить команду меню ДанныеФорма MS Access.

  3. В окне Создание формы Microsoft Access указать:

  • Файл базы данных (можно создать новый файл по имени рабочей книги).

  • Наличие в первой строке заголовка столбцов.

  • Поля, которые включаются в форму.

  • Внешний вид формы, стиль формы, имя экранной формы.

На рабочем листе Microsoft Excel автоматически вставляется командная кнопка Форма MS Access, нажатие которой обеспечивает запуск СУБД Access и работу с данными электронной таблицы через форму базы таблицы данных.

 Работа по вводу данных выполняется в среде СУБД Access.

Команда меню Microsoft Excel ДанныеОтчет MS Access осуществляет присоединение к базе данных СУБД Access и подготовку отчета для электронной таблицы.

  1. Установить курсор в диапазон ячеек таблицы Microsoft Excel.

  2. Выполнить команду меню ДанныеОтчет MS Access.

  3. В окне Создание отчета Microsoft Access указать:

  • Файл базы данных (можно создать новый файл по имени рабочей книги).

  • Наличие в первой строке заголовка столбцов.

  • Поля, которые включаются в отчет.

  • Структуру итогов, стиль отчета, имя отчета.

На рабочем листе Microsoft Excel автоматически вставляется командная кнопка Отчет MS Access, нажатие которой обеспечивает запуск СУБД Access для работы с данными электронной формы и вывод отчета.

Форматы импортируемых при открытии файлов в СУБД Accessпредставлены в табл. 3.

Таблица 3

Тип источника

Версия

СУБД Microsoft Access

2.0, 7.0/95, 8.0/97, 9.0/2000

Проект Microsoft Access

9.0/2000

Dbase

III, III+, IV, V, VII (для чтения/записи требуется наличия Borland Database Engine версии 4.x и старше)

Paradox, Paradox для Windows

3.x, 4.x, 5.0 и 8.0 (для чтения/записи требует наличия Borland Database Engine версии 4.x и старше)

Электронные таблицы Microsoft Excel

3.0, 4.0, 5.0, 7.0/95, 8.0/97 и 9.0/2000

Электронные таблицы Lotus 1-2-3 (связь только для чтения)

.wks, .wk1, .wk3 и .wk4

Microsoft Exchange

Все версии

Текстовые файлы с разделителями

Все наборы символов

Текстовые файлы фиксированной длины

Все наборы символов

HTML

1.0 (в списке) 2.0, 3.x (в таблице или списке)

Таблицы SQL, Microsoft Visual FoxPro и данные из программ и БД, поддерживающих протокол ODBC

Visual FoxPro версий 2.x, 3.0, 5.0 и 6.x (только импорт)

Применительно к внешним данным в СУБД Access осуществляется:

  • Импорт данных с потерей связи с источником – информационная технология внедрения объекта;

  • Присоединение таблиц с сохранением связи с источником и одновременной работой нескольких приложений – информационная технология связывания с объектом–источником.

Импорт внешних данных электронных таблиц Microsoft Excel в базу данных осуществляется с помощью команды меню СУБД Access ФайлВнешние данныеИмпорт. В окне Импорт следует указать:

  • Имя файла рабочей книги.

  • Лист, содержащий диапазон ячеек.

  • Наличие заголовков в первой строке таблицы.

  • Поля таблицы, ключ, имя новой таблицы.

 Информационная технология импорта данных пригодна и для обмена данными различных баз данных СУБД Access, создания страховых копий.

Присоединение таблиц к БД обеспечивает возможность параллельной работы нескольких приложений с одним источником данных. Команда меню ФайлВнешние данныеСвязь с таблицами СУБД Access обеспечивает вызов окна Связь, в котором следует указать:

  • Имя файла электронной таблицы.

  • Лист содержащий диапазон ячеек.

  • Наличие заголовков в первой строке таблицы.

  • Имя новой таблицы.

Присоединенная таблица в базе данных СУБД Access соответствует электронной таблице Microsoft Excel. Можно одновременно работать с этой таблицей, выполняя добавление новых записей, удаление существующих записей только в электронной таблице, редактирование записей. Для разрыва связи с присоединенной таблицей в СУБД Access следует удалить значок связанной электронной таблицы.

При работе в СУБД Access команда меню СервисСвязи с Office поддерживает комплексные информационные технологии:

  1. Слияние с MS WORD – экспорт объектов базы данных (таблиц, запросов) для создания составного документа Microsoft Word.

При выполнении команды можно создавать новый или использовать существующий текстовый документ, в который вставляются поля слияния объектов базы данных СУБД Access.

  1. Публикация в MS WORD – сохранение объектов базы данных (таблиц, форм или отчетов) в формате RTF с автоматической загрузкой этого файла в Microsoft Word. Этот формат сохраняет шрифты и цвета.

  2. Анализ в MS EXCEL – создание файла рабочей книги, имя которого соответствует выделенному объекту базы данных СУБД Access (таблице, форме, отчету запросу).

СУБД Access обеспечивает экспорт объектов базы данных Access (таблиц, форм, отчетов, запросов) в виде файлов выбранного формата – команда меню ФайлЭкспорт. Форматы экспорта данных из базы данных Access:

  • Microsoft Access (версии 2.0, 7.0/95, 8.0/97, 9.0/2000 файлы в формате *.mdb; *.mdw; *.mda; *.mde).

  • Microsoft Excel (5-7; 97 и 9.0/2000).

  • Microsoft Word, формат RTF.

  • Текстовые файлы (*.txt; *.csv; *.tab; *.asc).

  • Rich Text Format (*.rtf).

  • Файлы реляционных БД, поддерживающих протоколы ODBC.

  • Документы HTML (*.html; *.htm) и другие.

Запросы к внешним данным средствами Microsoft Query обеспечивают как конвертирование, так и алгоритмическую обработку данных, фильтрацию записей источников по сложным условиям отбора, совместную обработку нескольких источников данных, непосредственное редактирование внешних данных, создание новых источников и т.п.

Программа MicrosoftQueryможет запускаться различным образом в программах Microsoft Office. Так, вMicrosoftWordпрограммаMicrosoftQueryиспользуется при работе с внешними реляционными базами данных и подготовке документов по технологии слияния.

Работу с базами данных в MicrosoftWordподдерживает панель инструментовБазы данных.

 Панель Базы данных вызывается командой меню ВидПанели инструментов.

Кнопка Добавить базу данныхобеспечивает вызов диалогового окнаБаза данных для указания файла источника. При нажатии кнопкиMS Query происходит запуск программы. Аналогично при указании источника для слияния нажатие кнопкиMS Query происходит запуск программыMicrosoftQuery.

Варианты вызова MS Query: из Microsoft Excel:

  • Команда меню ДанныеВнешние данныеСоздать запрос обеспечивает запуск MS Query для создания нового запроса;

  • Команда меню ДанныеВнешние данныеВыполнить запрос к БД обеспечивает запуск MS Query для выполнения ранее сохраненного запроса в формате файла с расширением .dqy, .iqy, .oqy, .rqy;

  • Команда меню ДанныеСводная таблица обеспечивает вызов MS Query для создания сводной таблицы на основе внешних данных.

 Возможен и самостоятельный запуск MS Query – файла MSQRY32.EXE (папка \MICROSOFT OFFICE\OFFICE\).

В MS Query выбирается источник данных, для которого строится запрос на извлечение или обработку данных баз данных следующих типов:

SQL Server SQL Server OLAP Services dBase

MS Access Oracle MS FoxPro

MSExcelParadoxБД в текстовых файлах

Запрос может быть сохранен в виде файла запроса определенного формата:

  • .dqy – запрос для извлечения данных из реляционных баз данных, текстовых файлов или списков Excel.

  • .oqy – подключение к данным в БД OLAP на сервере или использование файла автономного куба, включает информацию, определяющую содержимое куба, сведения о подключении к реляционной БД.

  • .rqy - поддержка драйверов источников данных OLE-DB (только для электронной таблицы Microsoft Excel 2000).

  • .qry - предыдущие версии Microsoft Query (не позволяет открывать файлы .dqy), требует преобразования.

  • .iqy – файлы Web-запросов, предназначенные для извлечения данных из Web.

MicrosoftQuery позволяет сохранить результат запроса (таблицу данных) в виде файла базы данных определенного формата.

Файл запросов – текстовый файл, содержит сведения об источнике данных (местоположение базы данных, состав информации, сведения о подключении) и используемом драйвере для доступа к данным.

Различают следующие типы драйверов (программ интерпретации внешних форматов данных):

  • ODBC (Open Data Base Connectivity) – библиотека динамической компоновки (DLL) для подключения к БД.

  • OLE–DB для доступа по сети и через INTERNET/intranet к реляционным источникам данных, почтовым файлам, неформатированным текстовым файлам и электронным таблицам.

  • OLE–DB OLAP (On-line Analytical Processing) – для доступа к базам данных OLAP, представленных в виде кубов иерархической структуры данных.

При создании нового запроса в MicrosoftQueryвыводится диалоговое окно для выбора типа источника данных. Запрос создается на языке QBE (Query By Example) или SQL (Structured Query Language).

Результат запроса может передаваться в текстовый документ MicrosoftWordили электронную таблицу Microsoft Excel непосредственно.

MicrosoftQuery в составе Microsoft Office 2000 является клиентом серверов OLAP и обеспечивает подключение к реляционным базам данных для создания кубов OLAP. С помощью команды меню MicrosoftQueryФайлСоздать кубOLAPзапускается Мастер создания куба, который последовательно осуществляет:

  1. Выбор полей результирующей таблицы запроса для формирования итогов. Для каждого поля указывается вид функции:

  • Число – подсчет количества значений;

  • Минимум – определение минимального значения поля среди всех записей;

  • Максимум – определение максимального значения поля среди всех записей;

  • Сумма – суммирование значений поля.

 Если для поля необходимо иметь несколько видов итого, его следует включить в результирующую таблицу несколько раз, а также убрать ненужные поля итогов.

  1. Формируется иерархическая структура измерений куба. Допускается вложенность полей и нахождение на одном уровне иерархии нескольких полей измерений.

  2. Выбор вида куба:

  • Создание куба только при открытии отчета, данные извлекаются при просмотре отчета. Рекомендуется в случае дефицита дисковой памяти, а также для редко изменяемых отчетов.

  • Полное извлечение всех записей для куба. Записи размещаются в оперативной памяти при открытии отчета. Рекомендуется для интенсивно используемых или постоянно изменяемых данных при дефиците дисковой памяти.

  • Создание на диске автономного файла куба (файла с расширением *.cub), который обеспечивает независимый от средств реализации исходной БД доступ к данным.

  1. Указание имени файла куба, формат *.oqy.