
- •0. Начало работы со средствами анализа таблиц Краткое содержание видеоролика
- •Введение
- •Образец рабочей книги Excel
- •Создание соединения
- •Заключение
- •1. «Анализ ключевых факторов влияния» Введение
- •2. «Поиск категорий» Введение
- •3. «Заполнение по примеру» Введение
- •4. «Прогноз» Введение
- •5. «Выделение исключений» Введение
2. «Поиск категорий» Введение
Средство поиска категорий использует алгоритм кластеризации (Майкрософт) для автоматического поиска в таблице строк, обладающих общими характеристиками.
После завершения своей работы средство создает отчет, где представлены обнаруженные категории со своими отличительными характеристиками. По умолчанию средство добавляет в таблицу данных новых столбец, содержащий предлагаемую категорию для каждой строки данных. Затем можно просмотреть и переименовать категории.
Мастер
Вначале создадим копию листа Образцы данных для средства анализа таблиц (Table Analysis Tools Sample).
Средство поиска категорий создает новый столбец в исходной таблице данных. Наличие этого столбца может повлиять на результаты дальнейших операций интеллектуального анализа данных. Чтобы избежать этого влияния, сначала создается копия листа.
Щелкните правой кнопкой мыши вкладку Образцы данных для средства анализа таблиц (Table Analysis Tools Sample) и выберите команду Переместить/скопировать (Move or Copy).
Установите флажок Создавать копию (Create a copy).
Выделите пункт Образцы данных для средств анализа таблиц (Table Analysis Tools Sample), чтобы поместить копию перед оригиналом.
Нажмите кнопку ОК.
Щелкните вкладку Образцы данных для средств анализа таблиц (2) (Table Analysis Tools Sample (2)) и щелкните в любом месте таблицы, чтобы активировать средства анализа таблиц.
В меню Работа с таблицами (Table Tools) выберите вкладку Анализ (Analyze), чтобы открыть ленту Средства анализа таблиц (Table Analysis Tools).
Выберите пункт Поиск категорий (Detect Categories), чтобы запустить мастер.
В диалоговом окне мастера укажите столбцы для использования в анализе. Можно отменить выбор столбцов, содержащих уникальные значения, такие как имена людей и идентификаторы записей, поскольку они не будут полезны для анализа. Заметьте, что выбор столбца ID отменяется автоматически. Остальные столбцы останутся выбранными.
Дополнительно можно указать максимальное количество создаваемых категорий. По умолчанию средство автоматически создает столько категорий, сколько удается обнаружить. Мы оставим значение по умолчанию.
Установите флажок Добавить столбец категорий к исходной таблице Excel (Append a Category column to the original Excel table).
Нажмите кнопку Запуск (Run).
Средство создает новый лист, который называется «Отчет по категориям» и содержит список категорий и их характеристик.
Отчеты
Лист Отчет по категориям (Categories Report) содержит две таблицы и диаграмму Профили категорий (Category Profiles). Изучение результатов может выявить в данных закономерности, которые помогут получить сведения о клиентах.
В первой таблице перечислены новые категории с указанием временных имен и указано количество строк исходных данных, попадающих в каждую категорию.
Во второй таблице, Характеристики категории (Category Characteristics), показаны данные о подобии, обнаруженном в категории. Нажмите кнопку Фильтр (Filter) в верхней части столбца Категория (Category), чтобы показать характеристики для другой категории.
Полоска с заливкой Относительная важность (Relative importance) показывает, насколько важна пара «атрибут-значение» в качестве отличительного фактора. Чем длиннее полоска, тем в большей степени этот атрибут является репрезентативным для данной категории.
В этом примере видно, что Категория 1 (Category 1) образована клиентами из Европы с низким уровнем дохода и небольшим расстоянием от дома до работы. С помощью этих данных можно дать этой категории (Category 1) более информативное имя.
Выберите категорию 1 (Category 1) в первой таблице двойным щелчком.
Введите текст Eur Low-Income, Short Commute.
Затем увеличьте ширину столбца, чтобы показать метку целиком.
Новое имя категории немедленно отражается на другой диаграмме и в столбце назначения категорий на листе исходных данных. Однако на диаграмме Профили категорий (Category Profiles) новое имя не появляется.
Диаграмма Профили категорий (Category Profiles) в нижней части страницы является интерактивным средством, позволяющим подробно просматривать обнаруженные закономерности.
Щелкните в любом месте диаграммы, чтобы открыть элемент управления «Сводная таблица», который позволяет интерактивно фильтровать поля и изменять их расположение.
На ленте меню Excel также находится вкладка Работа со сводными диаграммами (PivotChart Tools), содержащая различные параметры для изменения формата диаграммы, изменения расположения данных, слияния данных и других операций с данными.
Теперь мы обновим диаграмму, чтобы в ней отображалось новое имя категории.
Щелкните за пределами диаграммы и нажмите клавиши CTRL+ALT+F5. Появится новая метка. Не забывайте нажимать клавиши CTRL+ALT+F5 для обновления диаграммы после каждого изменения, вносимого в одну из таблиц выше или с помощью элемента управления «Сводная таблица».
Изучая диаграмму, можно заметить, что Категория 3 (Category 3) состоит из клиентов очень молодого возраста. Синяя полоска соответствует возрасту Very Low, а небольшая часть красного представляет возраст Low.
Посмотрим на другой столбец.
В окне Список полей сводной таблицы (PivotTable Field List) выберите пункт Столбец (Column).
Снимите флажок Age и установите флажок Region.
Нажмите кнопку ОК.
Справа в категории 1 с именем European Low-Income Short-Commute наблюдается большой процент европейских клиентов.
С этой диаграммой можно выполнять множество других действий. Выше представлены ссылки на дополнительные сведения по использованию сводных таблиц.
Вернемся к нашим данным.
Щелкните вкладку Образцы данных для средств анализа таблиц (2) (Table Analysis Tools Sample (2)). Справа в таблице появился новый столбец — Категория (Category). Теперь можно сортировать и фильтровать данные по значениям в столбце «Категория».
В раскрывающемся списке Категория (Category) в группе Текстовые фильтры (Text Filters) установите флажок рядом с категорией Eur Low-Income, Short Commute.
Нажмите кнопку ОК.
Данные будут отсортированы и отфильтрованы по категории.