- •080801 - «Прикладная информатика (в экономике)»
- •3.2. Методика предсказания временных рядов
- •3.2.1. Метод погружения. Теорема Такенса.
- •3.2.2. Эмпирические свидетельства предсказуемости финансовых рядов
- •3.3. Система нейронной сети PathFinder
- •3.3.1. Нейронная сеть
- •3.3.2. Ключевые требования к работе с нейронной сетью
- •4. Последовательность выполнения практического задания
- •4.1Прогнозирование объема продаж кондитерских изделий.
- •5. Пример выполнения практического задания
- •5.1. Ввод диапазонов данных.
- •6. Требования к оформлению отчета
- •1. Цель работы.
- •Контрольные вопросы
5. Пример выполнения практического задания
Рассмотрим пример «Прогнозирование потребления электричества». Для начала работы необходимо запустить систему PathFinder, в появившемся окне перейти на вкладку ввода диапазонов данных (Вкладка Datasets). Также для работы необходимо открыть файл Microsoft Excel "PF_tutorial.xls". Таким образом, для правильной работы необходимо, чтобы были открыты оба приложения Microsoft Excel и PathFinder.
Задача данного примера в том, чтобы построить модель ежедневного предельного уровня расхода электричества для компании энергоснабжения.
Входные данные Необходимо использовать максимальную почасовую температуру в течение дня и минимальную почасовую температура в течение дня, а также наименование дня недели.
Обозначения:
PEAK - почасовое необходимое количество электричества в день (в мегаваттах);
minT - почасовая минимальная температура в течение дня (градусы F);
mахТ - почасовая максимальная температура в течение дня (градусы F);
DOW_N1 - воскресенье (0 = нет, 1 = да);
D0W_N2 - понедельник (0 = нет, 1 = да);
DOWN3 - вторник (0 = нет, 1 = да);
DOW_N4 - среда (0 = нет, 1 = да);
DOW_N5 - четверг (0 = нет, 1 = да);
DOW_N6 - пятница (0 = нет, 1 = да);
DOW_N7 - суббота (0 = нет, 1 = да).
5.1. Ввод диапазонов данных.
Имена переменных
Активируйте
Microsoft
Excel,
выберете лист "Varsl".
Затем выделите диапазон названия
переменных, они обозначены желтым цветом
(ячейки А1 к
I1).
Как только этот диапазон выделен,
перейдите к окну PathFinder
и щелкните маленькую
кнопку с рукой
рядом с текстовым полем, названным "
Variable
names
".
Также необходимо, чтобы текстовое поле с названием "Excel File Name" содержало имя файла с расширением (*.xls/). В данном примере это файл PF_tutorial.xls. Если файл Excel указан верно, то поле Variable names заполнится определенным заданным диапазоном (в примере: VARS1! R1C1:R1C9), который содержит имена переменных.
Данные для обучения
Теперь определение диапазона данных для обучения. Необходимо возвратитесь к окну Excel, и выделить диапазон до синей границы (ячейки А2 к I601).
Этот диапазон определяет данные, которые используются в обучающейся нейронной сети, чтобы обновлять функцию сети. Далее в окне PathFinder необходимо щелкнуть кнопку с рукой напротив поля с именем от "Training Data". Поле заполниться соответствующим диапазоном. (В примере: VARS1! R2C1:R6O1C9).
Данные для тестирования
Возвращаемся к окну Excel, выделяем диапазон от синей до красной границы (эти данные следуют за данными для обучения).
Переходим обратно к окну PathFinder, и нажимаем кнопку напротив поля с названием " Test data ".
Поле заполниться соответствующим диапазоном. (В примере: VARS1! R6O2C1:R751C9). Данные для тестирования используются в процессе обучения, чтобы определить, когда учебная сессия должна быть остановлена
Данные для проверки
Возвращаемся к окну Excel, и выделяем диапазон до фиолетовой границы (эти данные следуют за данными для тестирования). Переключитесь назад к окну PathFinder, и нажмите кнопку напротив поля с именем " Validate data ". Поле заполниться диапазоном VARS1! R752C1 :R951С9.
Данные для проверки используются после того, как обучение закончено, чтобы определить, насколько точной получилась модель нейронной сети, есть ли данные пропущенные в процессе обучения.
Данные для вычислений
Возвращаемся к окну Excel, и перемещаемся вниз до последней заполненной строки (ряд 1251). Выделяем 4 заключительных ряда данных (ячейки А1248 к I1251). Это данные для вычислений, используемые в процессе моделирования. Колонка слева это обозначение "критической точки", которая является минимальным/максимальным значением из всех встречающихся в колонке, а также обозначение количества повторений данной критической точки.
Например, в колонке (maxt - максимальная температура) минимальное значение, найденное в этой колонке составляет 40 градусов.
Ряд с названием "Scale max" для колонки 2 показывает сколько раз встречается максимальное значение 98 в данной колонке, это число повторений равно 1.
Переходим в окно PathFinder и нажимаем кнопку напротив поля с названием "Scaling data" - диапазон будет заполнен (VARS1! R1248C1:R1251C9).
Результат
В конце мы должны определить диапазон ячеек в Excel для записи прогнозируемых значений найденных в процессе работы нейронной сети. Возвратитесь в Excel, и выделите ячейки К752 к К951. Затем в окне Path Finder нажмите на кнопку напротив поля с именем "Results"
Теперь окно PathFinder на вкладке Datasets будет выглядеть следующим образом (рис. 8).
Рис.8. Окно PathFinder после заполнения
Примечание: диапазоны данных можно вводить вручную.
Теперь, когда все диапазоны определены, необходимо, чтобы программа прочла данные. В окне PathFinder, необходимо нажать на кнопку "Read From Excel". Программа загрузит данные, и проставит число наблюдений в каждом из этих трех наборов данных. Теперь окно должно выглядеть так (рис.9).
Рис.9. Окно PathFinder после загрузки данных из Excel
Обучение нейронной сети
После прочтения данных, нейронная сеть готова к обучению. В окне PathFinder, перейдите на вкладку Variables. Переменные уже определены, они считываются из таблицы Excel, все переменные перечислены в поле Available Variables. Выберите данные для модели. Теперь перейдите на вкладку Design. Здесь определяется архитектура нейронной сети и параметры настройки, связанные с учебным процессом. Используйте значения по умолчанию.
Перейдите на вкладку Train. Щелкните на кнопке "Run", которая начинает обучение. Процесс закончен, когда график перестает обновляться.
Окно PathFinder теперь выглядит следующим образом (рис.10)
Рис.10. Результат обучения сети
Проверка функции
Как только обучение окончено, мы можем перейти на вкладку Examine Weight , чтобы увидеть матрицу функций для нашей сети (рис.11). Ячейки - цвет, которых синий содержат значения наибольших функций, зеленый - средних, и белые - наименьших.
Значение входов
Одного способа недостаточно, чтобы судить об относительных значениях входов. Другой метод, доступный в PathFinder - тест значения. Щелкните на вкладке Significant и нажмите на кнопку "Run".
Рис.11. Матрица функций сети
Применение данных к нейронной сети
Как только сеть обучалась в PathFinder, можно применить получившийся набор данных к сети, чтобы увидеть как они обрабатываются. Проверяя получившиеся данные, мы используем данные, которые не использовались в учебном процессе. Переходим на вкладку "Apply" и нажимаем кнопку "Run" (рис.12).
Теперь окно PathFinder выглядит следующим образом, при этом поле "МАРЕ" содержит средний абсолютный процент ошибки.
Рис.12. Средний абсолютный процент ошибки
