Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб1-ИА Таблиц.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
54.77 Кб
Скачать

Создание соединения

Давайте подробнее познакомимся со средствами анализа таблиц. На панели меню выберите Средства таблиц (Table Tools), а затем меню Анализ (Analyze). Лента Средства анализа таблиц (Table Analysis Tools) содержит средства интеллектуального анализа данных. Все они рассматриваются в следующих обучающих материалах.

Обратите внимание на кнопку Справка (Help) в конце ленты. Через нее доступна документация по надстройкам, а также мастер начала работы.

Перед началом работы нужно подключиться к серверу служб Analysis Services. Кнопка Соединение (Connection) позволяет создавать соединения с базой данных и сервером служб Analysis Services, а также управлять такими соединениями. Соединение должно быть установлено до того, как будет запущено любое из средств анализа таблиц.

Если вы открыли образец данных и завершили работу мастера, то подключение к DMAddinsDB уже должно быть установлено. В таком случае можно пропустить начальную часть этого материала.

  1. Чтобы установить соединение со службами Analysis Services, нажмите на ленте кнопку «Соединение». Открывается диалоговое окно соединения со службами Analysis Services.

  2. Нажмите кнопку Создать (New), чтобы создать новое соединение. Здесь нужно указать имя сервера, к которому производится подключение, и базу данных, в которой будут храниться создаваемые модели. Кроме того, для соединения можно указать понятное имя, которое будет отображаться на ленте.

  3. Введите имя сервера DMAddinsDB.

  4. Выберите параметр Использовать проверку подлинности Windows (Use Windows Authentication) и нажмите кнопку ОК. Имя и состояние соединения отображаются на ленте «Соединение».

Заключение

Теперь, после того как вы научились открывать образцы данных Excel, подключаться к серверу служб Analysis Services и получать доступ к средствам анализа таблиц, можно переходить к работе с надстройками интеллектуального анализа данных для Excel. Чтобы узнать больше о средствах анализа таблиц, рекомендую посмотреть другие обучающие видеоролики, а также посетить страницу на веб-узле microsoft.com. Спасибо за внимание.

1. «Анализ ключевых факторов влияния» Введение

Средство «Анализ ключевых факторов влияния» использует алгоритм кластеризации (Майкрософт) и позволяет выбрать столбец, содержащий нужные выходные данные или целевое значение, а затем проанализировать закономерности в данных и определить, какие факторы больше всего влияют на результат. Например, если есть список клиентов, который включает столбец, содержащий все их покупки за последний год, то можно проанализировать эту таблицу и определить демографические данные лучших покупателей.

Это средство также позволяет выбрать пару возможных результатов и сравнить их. Например, если прогнозируемый столбец содержит дискретные значения, такие как Purchase = Yes, Purchase = No или Purchase = Yes but not now, то можно сравнить клиентов, которые делали покупку сразу, с теми, которые откладывали ее, а также тех, кто откладывал покупку, с теми, кто вообще не покупал. Это позволяет выявить основные факторы, которые оказывают влияние на покупку.

В этом учебном материале мы рассмотрим факторы, которые оказывают влияние на решение о покупке велосипеда. Полученные данные затем могут быть использованы для выявления клиентов, которые являются наиболее вероятными покупателями наших продуктов.

Мастер

  1. Для начала откроем вкладку Образцы данных для средств анализа таблиц (Table Analysis Tools Sample) и щелкнем любую ячейку таблицы, чтобы активировать средства анализа таблиц.

  2. В меню Работа с таблицами (Table Tools) выберем вкладку Анализ (Analyze), чтобы открыть ленту Средства анализа таблиц (Table Analysis Tools).

  3. Дважды щелкнем Анализ ключевых факторов влияния (Analyze Key Influencers), чтобы запустить мастер.

  4. В диалоговом окне мастера выберем анализируемый столбец. Мастер автоматически выбирает первый столбец рабочего листа, но нас интересует покупка велосипеда. Если теперь нажать кнопку Выполнить (Run), то будет произведен анализ всех столбцов. Вместо этого мы сделаем следующее.

  5. Щелкнем ссылку Выбор столбцов для анализа (Choose columns to be used for analysis). В диалоговом окне Расширенный выбор столбцов (Advanced Columns Selection) выберем столбцы, которые, скорее всего, оказывают влияние на продажи велосипедов. Мы хотели бы узнать, какое влияние на продажи велосипедов оказывают значения столбцов Marital Status, Number of Cars Owned, Region и Gender. Упрощая анализ, мы повышаем его скорость и точность.

  6. Нажмем кнопку Выполнить (Run). Если мастер обнаружил какие-либо закономерности, то он создает на новом листе отчет, в котором они будут отображены. Этот отчет называется Ключевые факторы влияния на <приобретение велосипеда> (Key Influencers for Purchased Bike). Если закономерности не найдены, то будет создан новый лист, содержащий описание проблемы.

Отчеты

Откроем отчет Ключевые факторы влияния на приобретение велосипеда (Key Influencers for Purchased Bike report). В таблице содержатся факторы, связанные с каждым из результатов, и графически отображены вероятности отношений.

  1. Глядя на результаты, в первую очередь можно заметить, что столбец Gender (Пол) не представлен в списке, то есть не оказывает заметного влияния на приобретение велосипеда.

  2. Результаты упорядочены в порядке убывания влияния для каждого из возможных значений в столбце Purcased Bike (Купленный велосипед). Наиболее значимый фактор, заставляющий НЕ приобретать велосипед, — наличие двух автомобилей. Наиболее значимый фактор, заставляющий приобрести велосипед, — отсутствие автомобилей.

  3. Попробуем еще немного видоизменить отчет, чтобы еще глубже исследовать результаты. В диалоговом окне Сравнение, основанное на ключевых факторах влияния (Discrimination based on key influencers) создадим новый отчет для сравнения каждого из возможных результатов. По сути дела, мы собираемся отфильтровать результаты и детализировать модель, чтобы исследовать отдельные атрибуты и выделить различия между двумя ключевыми факторами влияния. В данном случае имеется всего два варианта — Да (Yes) и Нет (No).

  4. Нажмем кнопку Добавить отчет (Add Report). Для каждой пары сравниваемых факторов мастер создает новую таблицу. Поскольку у нас всего два значения, то эта таблица всего лишь по-другому представляет те же данные.

  5. Закончив сравнение, нажмите кнопку Закрыть (Close).

В этом учебном видеоматериале мы рассматривали столбец, содержащий всего два значения — «Да» и «Нет». В более сложных случаях можно проанализировать факторы влияния на результаты, которые имеют много значений. Например, Number of Bikes Purchased может иметь следующие значения: 0, 1, 2, 3, 4 и т.д. Кроме того, на основе тех же баз данных можно рассмотреть ключевые факторы влияния по столбцу Region, после чего детализировать модель и сравнить столбцы со значением Pacific и North America.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]