Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб1-ИА Таблиц.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
54.77 Кб
Скачать

3. «Заполнение по примеру» Введение

Этот видеоролик научит вас пользоваться инструментом «Заполнение по примеру», который позволяет быстро создавать новые столбцы данных на основе закономерностей, обнаруженных в таблице Excel и образцах новых значений, предоставленных пользователем.

В этом видеоматериале компания AdventureWorks хочет выявить самых крупных покупателей. Допустим, у нас нет возможности ввести эти значения в базу данных по всем клиентам вручную. Воспользуемся для этого средством «Заполнение по примеру» для обучения модели, чтобы выявить существующие в данных закономерности. Затем просмотрим отчет о закономерностях и рассчитаем новый столбец данных, добавленный к нашему листу.

Существуют некоторые моменты, о которых стоит упомянуть перед началом работы.

  • Анализ выполняется только для данных, находящихся в столбцах. Если ряд, который необходимо заполнить, хранится в виде строки, то следует с помощью функции Excel Вставка и транспонирование (Paste, Transpose) преобразовать данные в столбец.

  • Для каждого значения, для которого необходимо формирование прогноза, должен быть введен хотя бы один образец.

Мастер

  1. Чтобы начать работу, откройте лист Заполнение по примеру (Fill From Example).

  2. Прокрутите страницу до столбца High Value Customer. Обратите внимание, что AdventureWorks на основе своих знаний о клиентах классифицирует 10 из них по группам Крупный (High Value) и Некрупный (Not High Value). Средство «Заполнение по примеру» проанализирует существующие закономерности в данных наряду с введенными примерами и заполнит значениями оставшуюся часть столбца. Если результат окажется неудовлетворительным, то можно сделать уточнение, введя дополнительные примеры значений.

  3. Выберите вкладку Fill From Example и щелкните любое место в таблице, чтобы активировать средства анализа таблиц.

  4. В меню Работа с таблицами (Table Tools) выберите вкладку Анализ (Analyze), чтобы открыть ленту Средства анализа таблиц (Table Analysis Tools).

  5. Щелкните Заполнение по примеру (Fill From Example), чтобы запустить мастер.

  6. В диалоговом окне Заполнение по примеру (Fill From Example) будет автоматически выбран столбец, имеющий наибольшее число отсутствующих значений или значений NULL, в этом случае High Value Customer. Если бы понадобился какой-то другой столбец, следовало бы выбрать его из списка.

  7. Щелкните ссылку Выбор столбцов для анализа (Choose columns to be used for analysis). Хотя рекомендованные столбцы подбираются для анализа автоматически, их можно выбрать самостоятельно. Например, если известно, что существует причинно-следственная связь между столбцами Income, Age и столбцом, в котором отсутствуют некоторые значения, то для улучшения результата, возможно, будет лучше отключить все остальные столбцы. Если неизвестно, какие из столбцов могут понадобиться, то можно добавить их все. Что мы и сделаем, но за исключением столбца ID.

  8. Нажмите кнопку ОК.

  9. Нажмите кнопку Выполнить (Run). Отчет отображается на новом листе. Если закономерности были выявлены, то отсутствующие значения будут автоматически заполнены на листе Fill From Example.

Отчеты

Отчет о закономерностях описывает правила, которые были использованы для заполнения отсутствующих значений. Описание каждого влияющего фактора или правила содержит в себе имя и значение столбца, а также относительное влияние данного правила на прогноз.

Относительное влияние (Relative Impact) отображается в виде полосы с соответствующей степенью заливки. Чем длиннее эта полоса, тем больше вероятность того, что правило оказалось способным выработать прогноз для заполненного значения.

Это означает, что результат в столбце High Value Customer с большой вероятностью для значений Pacific столбца Region будет No, а для значений 2–5 mile столбца Commute — Yes.

Кроме того, в исходную таблицу данных добавляется новый столбец High Value Customer_Extended.

  1. Вернитесь на лист Fill From Example.

  2. Прокрутите файл до нового столбца High Value Customer_Extended. Обратите внимание, что прогнозируемые значения были заполнены для всех строк листа. Они основаны на закономерностях, обнаруженных в данных. Изначальный столбец, который использовался для обучения, остался неизменным.

  3. Отсортируйте строки по значимости клиента.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]