Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Владимирский государственный университет им. Столетовых

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

guide_analyst_5.2.0.pdf

Скачиваний:

376

Добавлен:

21.03.2015

Размер:

6.37 Mб

Скачать

☆

<<< < Предыдущая 23 24 25 26 27 28 29 30 31 32 33 3435 / 4835 36 37 38 39 40 41 42 43 44 45 46 47 > Следующая >>>

www.basegroup.ru

Как видим, качество построенной модели значительно ниже по сравнению с моделями на основе нейронных сетей или линейной регрессии. Тем не менее, учитывая столь маленький объем выборки, даже такая модель прогноза представляет определенный интерес. Диаграмма прогноза, построенного на один месяц, показана на рисунке ниже.

Прогнозируемое значение объема продаж составило 141,67, т.е. средний объем продаж за последние три месяца.

Вспомогательные методы обработки

Помимо перечисленных выше алгоритмов в программе есть обработчики, которые трудно отнести к очистке, трансформации или методам Data Mining. Но эти механизмы обработки могут быть важной частью при создании сценариев для анализа данных.

стр. 140 из 192

www.basegroup.ru

Скрипт

Скрипты предназначены для автоматизации процесса добавления в сценарий однотипных ветвей обработки. По сути скрипт представляет собой динамическую копию выбранного участка сценария. Скрипт является готовой моделью, и поэтому входящие в него узлы не могут быть изменены отдельно от исходной ветки сценария. Тем не менее, на скрипте отражаются все изменения, вносимые в ветку, на которую он ссылается, т.е. при переобучении или перенастройке узлов этой ветки все сделанные изменения будут внесены в работу скрипта.

Аналогом скрипта является функция или процедура в языках программирования. Ветвь обработки строится один раз, а затем скриптами выполняются определенные в ней действия.

Для настройки скрипта достаточно указать начальный и конечный узлы, находящиеся на одной ветви обработки. Тогда при выполнении узла скрипта будут последовательно выполнены начальный, все промежуточные узлы между начальным и конечным и конечный узел.

Если исходный набор данный имеет меньшее число полей, чем начальный компонент цепочки, то система выдаст следующее сообщение: «Количество столбцов начального компонента цепочки не должно быть больше, чем количество столбцов исходного набора данных». При этом в момент обработки скрипта будет предпринята попытка выполнить с имеющимся набором полей. В случае, если какое-то из отсутствующих полей является критичным для любого узла, содержащегося в скипрте, то обработка будет остановлена с выдачей сообщения об ошибке.

Под исходным набором данных подразумевается тот набор данных, к которому применяется обработчик «Скрипт», начальный компонент цепочки – набор данных, на который настраивается «Скрипт».

Нажав кнопку Ок, можно продолжить выполнение данного компонента.

В случае, когда исходный набор данных содержит большее количество полей, чем набор данных, являющийся начальным компонентом цепочки, предусмотрена возможность настройки информационных полей. В данном случае под информационными полями понимаются те поля, которые не будут использоваться в модели, но которые будут помещены в результирующий набор данных, полученный после применения рассматриваемого компонента.

Возможна ситуация, когда столбцам начального компонента цепочки нет сопоставимых столбцов в исходном наборе данных. В такой ситуации система выдаст следующее сообщение: «Столбцам начального компонента цепочки нельзя сопоставить столбцы исходного набора данных». При этом в момент обработки скрипта будет предпринята попытка выполнить с имеющимся набором полей. В случае, если какое-то из отсутствующих полей является критичным для любого узла, содержащегося в скрипте, то обработка будет остановлена с выдачей сообщения об ошибке.

Столбцы исходного набора данных, по которым не было установлено соответствие полям в скрипте, идентифицируются программой как «Информационные» и могут быть при желании добавлены в выходной набор данных. Необходимо иметь в виду, что эти поля появятся в результирующем наборе только если в скрипте не используются следующие обработчики: группировка, разгруппировка и расчет автокорреляции.

Нажав кнопку Оk, можно продолжить выполнение данного компонента.

Основное назначение скриптов – применение готовой модели (фрагмента сценария) к различным наборам данных в рамках одного проекта.

Пример

Пусть даны две таблицы с объемами продаж товара. В первой таблице продажи заданы в разрезе по дням, во второй – по месяцам, причем вторая таблица имеет дополнительное поле «Код товара». Требуется построить прогноз объемов продаж товара на один месяц по обеим таблицам, поскольку неизвестно, какая из них будет подаваться на вход в будущем.

стр. 141 из 192

www.basegroup.ru

Дата (День)		Количество

17.09.2000		3

17.09.2003		38

18.09.2003		52

19.09.2003		43

20.09.2003		84

21.09.2003		60

22.09.2003		78

23.09.2003		63

24.09.2003		77

25.09.2003		78

…		…

Количество	Дата (Месяц)	Код товара

3	01.09.2000	11698

3384	01.10.2003	10

4915	01.11.2003	10

7301	01.12.2003	10

6228	01.01.2004	10

6497	01.02.2004	10

…	…	…

Построим ветвь прогноза объема продаж по таблице с данными в месячном разрезе.

Теперь импортируем данные из второй таблицы и преобразуем дату к представлению по месяцам/

стр. 142 из 192

www.basegroup.ru

После узла группировки добавим обработчик «Скрипт» со следующими настройками начального узла.

Здесь узел «Скользящее окно» – начальный компонент цепочки, а узел «Группировка» – исходный набор данных. Поскольку набор данных, к которому применяется обработчик «Скрипт», имеет большее количество полей, чем начальный компонент цепочки, то в мастере обработки можно указать, какие поля в качестве информационных будут включены в результирующий набор данных. В качестве информационного в данном случае выступает поле Код товара.

Конечным узлом укажем обработчик «Прогноз».

Нам не пришлось строить модель прогноза для второй таблицы, вместо этого мы воспользовались уже готовой моделью, применив ее в другой ветви сценария. Полностью выполненный сценарий имеет ниже представленный вид:

стр. 143 из 192

<<< < Предыдущая 23 24 25 26 27 28 29 30 31 32 33 3435 / 4835 36 37 38 39 40 41 42 43 44 45 46 47 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.11.2018122.88 Кб62grammar modal verbs from Arakin.doc
#
15.11.2019198.14 Кб1Grammar notes.doc
#
21.03.20157.61 Mб30Grammatika_kinoyazyka_Daniel_Arizhon.doc
#
21.03.201549.15 Кб64Granatkina_zadachi.dec.doc
#
21.08.2019114.58 Кб0Grazhdanskoe_Pravo_-_elektronnye_lektsii.docx
#
21.03.20156.37 Mб376guide_analyst_5.2.0.pdf
#
21.09.201956.32 Кб0Hole.doc
#
11.11.2019353.79 Кб1Home Work ex. Со словами.doc
#
21.11.201951.2 Кб2hometask Our Institute.doc
#
21.03.201527.34 Mб35How To Rebuild Your Small-Block Ford.pdf
#
08.07.20191.05 Mб1HTML.doc