Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kit.doc
Скачиваний:
5
Добавлен:
25.09.2019
Размер:
156.67 Кб
Скачать

58. Табличный процессор ms excel. Использование списка в качестве базы данных.

Набор строк таблицы, содержащий связанные данные, образует список. Список может использоваться как база данных, в которой строки выступают в качестве записей, а столбцы являются полями. Первая строка списка при этом содержит названия столбцов. Можно выбрать диапазон ячеек и определить его в качестве списка.

Списки на листе Excel позволяют группировать данные и выполнять различные действия над связанными данными. Управление данными в нем и их анализ производится независимо от данных за пределами списка. К каждому столбцу списка по умолчанию применяется Автофильтр, кнопки которого расположены в строке заголовков, что позволяет быстро фильтровать и сортировать данные. В список можно добавить строку итогов. Щелкнув ячейку в строке итогов, можно выбрать из раскрывающегося списка нужную обобщенную функцию. Путем перемещения метки изменения размера, находящейся в правом нижнем углу рамки списка, можно изменить размер списка. В качестве примера, составим список студентов группы. В ячейку А1 введем Список студентов, в А2 – №п/п, В2 – Фамилия, С2 – Имя, D2 – Год рождения и заполним первую строку списка, не указывая №п/п, например, Андреев Петр 1978

На экране отобразится диалоговое окно с именем листа, на котором расположен список. Назначение кнопок в этом окне:

  • Дoбaвumь (New) – позволяет создать новую запись. После нажатия клавиши Enter запись будет добавлена в конец списка. Поля формы очистятся и в них можно будет ввести новую запись.

  • Удалить (Delete) – удаляет текущую запись из списка.

  • Вернуть (Restore) – отменяет все изменения, внесенные в текущую запись. Нажатие этой кнопки не восстанавливает удаленную запись.

  • Далее (Find Next), Назад (Find Prev) – позволяет перейти к следующей или к предыдущей записи списка.

  • Критерии (Criteria) – позволяет производить поиск записей, основанных на заданном условии поиска (поиск данных по заданным условиям рассмотрен ниже).

  • Закрыть (Close) – добавляет запись и закрывает диалоговое окно.

59. Табличный процессор MS EXCEL. Консолидация данных. Сводные таблицы.

В процессе консолидации данных решаются следующие задачи:

  • выбор источников данных;

  • разработка стратегии консолидации;

  • оценка качества данных;

  • обогащение;

  • очистка;

  • перенос в хранилище данных.

Сначала осуществляется выбор источников, содержащих данные, которые могут иметь отношение к решаемой задаче, затем определяются тип источников и методика организации доступа к ним. В связи с этим можно выделить три основных подхода к организации хранения данных.

Данные, хранящиеся в отдельных (локальных) файлах, например в текстовых файлах с разделителями, документах Word, Excel и т.д. Такого рода источником может быть любой файл, данные в котором организованы в виде столбцов и записей. Столбцы должны быть типизированы, то есть содержать данные одного типа, например только текстовые или только числовые. Преимущество таких источников в том, что они могут создаваться и редактироваться с помощью простых и популярных офисных приложений, работа с которыми не требует от персонала специальной подготовки. К недостаткам следует отнести то, что они далеко не всегда оптимальны с точки зрения скорости доступа к ним, компактности представления данных и поддержки их структурной целостности. Например, ничто не мешает пользователю табличного процессора разместить в одном столбце данные различных типов (числовые и текстовые), что впоследствии обязательно приведет к проблемам при их обработке в аналитическом приложении.

Базы данных (БД) различных СУБД, таких как Oracle, SQL Server, Firebird, dBase, FoxPro, Access и т.д. Файлы БД лучше поддерживают целостность структуры данных, поскольку тип и свойства их полей жестко задаются при построении таблиц. Однако для создания и администрирования БД требуются специалисты с более высоким уровнем подготовки, чем для работы с популярными офисными приложениями.

Специализированные хранилища данных (ХД) являются наиболее предпочтительным решением, поскольку их структура и функционирование специально оптимизируются для работы с аналитической платформой. Большинство ХД обеспечивают высокую скорость обмена данными с аналитическими приложениями, автоматически поддерживают целостность и непротиворечивость данных. Главное преимущество ХД перед остальными типами источников данных — наличие семантического слоя, который дает пользователю возможность оперировать терминами предметной области для формирования аналитических запросов к хранилищу.

При разработке стратегии консолидации данных необходимо учитывать характер расположения источников данных — локальный, когда они размещены на том же ПК, что и аналитическое приложение, либо удаленный, если источники доступны только через локальную или Глобальную компьютерные сети. Характер расположения источников данных может существенно повлиять на качество собранных данных (потеря фрагментов, несогласованность во времени их обновления, противоречивость и т.д.).

Другой важной задачей, которую требуется решить в рамках консолидации, является оценка качества данных с точки зрения их пригодности для обработки с помощью различных аналитических алгоритмов и методов. В большинстве случаев исходные данные являются «грязными», то есть содержат факторы, не позволяющие их корректно анализировать, обнаруживать скрытые структуры и закономерности, устанавливать связи между элементами данных и выполнять другие действия, которые могут потребоваться для получения аналитического решения. К таким факторам относятся ошибки ввода, пропуски, аномальные значения, шумы, противоречия и т.д. Поэтому перед тем, как приступить к анализу данных, необходимо оценить их качество и соответствие требованиям, предъявляемым аналитической платформой. Если в процессе оценки качества будут выявлены факторы, которые не позволяют корректно применить к данным те или иные аналитические методы, необходимо выполнить соответствующую очистку данных.

Сводные таблицы. «Сводный отчет» (сводная таблица, Pivot Table) - это пользовательский интерфейс для отображения многомерных данных. С помощью данного интерфейса можно группировать, сортировать, фильтровать и менять расположение данных с целью получения различных аналитических выборок. Обновление отчета производится простыми средствами пользовательского интерфейса, данные автоматически агрегируются по заданным правилам, при этом не требуется дополнительный или повторный ввод какой-либо информации. Интерфейс сводных таблиц Excel является, пожалуй, самым популярным программным продуктом для работы с многомерными данными. Он поддерживает в качестве источника данных как внешние источники данных (OLAP-кубам и реляционным базам данных), так и внутренние диапазоны электронных таблиц. Начиная с версии 2000 (9.0), Excel поддерживает также графическую форму отображения многомерных данных – сводная диаграмма (Pivot Chart).Реализованный в Excel интерфейс сводных таблиц позволяет расположить измерения многомерных данных в области рабочего листа. Для простоты можно представлять себе сводную таблицу, как отчет, лежащий сверху диапазона ячеек (на самом деле есть определенная привязка форматов ячеек к полям сводной таблицы). Сводная таблица Excel имеет четыре области отображения информации: фильтр, столбцы, строки и данные. Измерения данных именуютсяполями сводной таблицы. Эти поля имеют собственные свойства и формат отображения.

Еще раз хочется обратить внимание, что сводная таблица Excel предназначена исключительно для анализа данных без возможности редактирования информации. Ближе по смыслу было бы повсеместное употребление термина «сводный отчет» (Pivot Report), и именно так этот интерфейс и назывался до 2000го года. Но почему-то в последующих версиях разработчики от него отказались.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]