Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
прогн. все лекции11г.doc
Скачиваний:
7
Добавлен:
16.12.2018
Размер:
824.32 Кб
Скачать

40. Применение нейросетевого и статистического анализа для моделирования системы управления.

Один из методов определения путей повышения эффективности управления земельными ресурсами — создание математической мо­дели на основе социально-экономических факторов, влияющих на конечный результат повышения эффективности управления — сни­жение финансовых затрат на процесс управления и, самое важное, повышение собираемости земельных платежей.

Для группы методов, общая цель которых — выявление сложных зависимостей, обработка больших массивов информации для на­хождения новых, скрытых ранее закономерностей, сложился тер­мин Data Mining (добыча данных), определяемый как процесс ана­литического исследования больших массивов информации (обычно экономической) с целью выявления определенных закономернос­тей и систематических взаимосвязей между переменными в услови­ях неопределенности.

Этот процесс включает три основных этапа: исследование; по­строение модели или структуры; проверка модели.

Хотя в последнее время возрос интерес к разработке новых ме­тодов анализа данных, специально предназначенных для сферы бизнеса (например, деревья классификации), в целом системы по­лучения данных по-прежнему основываются на классических прин­ципах разведывательного анализа данных (РАД) и построения мо­делей, используя аналогичные подходы и методы.

Имеется важное отличие процедуры добычи данных от класси­ческого разведывательного анализа данных (РАД), так как системы добычи данных в большей степени ориентированы на практическое приложение полученных результатов, чем на выяснение их природы. Выяснение природы участвующих функций или конкретной формы интерактивных многомерных зависимостей между переменными не является главной целью этой процедуры, а основное внимание уде­ляют поиску решений, на основе которых можно было бы строить достоверные прогнозы.

Таким образом, при методе добычи данных используют подход к анализу данных и извлечению знаний, который иногда называют «черный ящик». При этом применяют не только классические приемы разведочного анализа данных, но и такие, как нейронные сети, по­зволяющие строить достоверные прогнозы, не уточняя конкретный вид тех зависимостей, на которых такой прогноз основан.

Разведывательный анализ данных (РАД) применяется для на­хождения связей между переменными в ситуациях, когда отсутст­вуют (или недостаточны) априорные представления о природе этих связей. Как правило, при разведывательном анализе учитывают и сравнивают большое число переменных, а для поиска закономер­ностей используют самые разные методы.

Вычислительные методы разведывательного анализа данных включают основные статистические методы, а также более сложные специально разработанные методы многомерного анализа, предназ­наченные для отыскания закономерностей в многомерных данных. Основные методы разведывательного статистического анализа: процедура анализа распределений переменных (например, чтобы выявить переменные с несимметричным или негауссовым распре­делением, в том числе и бимодальные);

просмотр корреляционных матриц с целью поиска коэффици­ентов, превышающих определенные пороговые значения;

анализ многовходовых таблиц частот (например, «послойный» последовательный просмотр комбинаций уровней управляющих пе­ременных).

Методы многомерного разведочного анализа специально разра­ботаны для поиска закономерностей в многомерных данных (или последовательностях одномерных данных).

К ним относятся: кластерный анализ; факторный анализ; анализ дискриминантных функций; многомерное шкалирование; логлиней- ный анализ; канонические корреляции; пошаговая линейная и нели­нейная регрессия; анализ соответствий; анализ временных рядов.

Нейронные сети — это класс аналитических методов, построен­ных на (гипотетических) принципах обучения мыслящих существ и функционирования мо^га и позволяющих прогнозировать значения некоторых переменных в новых наблюдениях по данным других на­блюдений (для этих же или других переменных) после прохождения этапа так называемого обучения на имеющихся данных. Нейронные сети — один из методов добычи данных.

При применении этих методов прежде всего необходимо выбрать конкретную архитектуру сети (число «слоев» и число «нейронов» в каждом из них). Размер и структура сети должны соответствовать (например, в смысле формальной вычислительной сложности) су­ществу исследуемого явления. Поскольку на начальном этапе ана­лиза природа явления обычно не бывает хорошо известна, выбор архитектуры — непростая задача и часто связан с длительным про­цессом «проб и ошибок» (однако в последнее время стали появлять­ся нейронно-сетевые программы, в которых для решения этой тру­доемкой задачи поиска «наилучшей» архитектуры сети применяют методы искусственного интеллекта).

Затем выбранная сеть подвергается процессу так называемого «обучения». На этом этапе нейроны сети обрабатывают входные данные и корректируют их удельные веса таким образом, чтобы сеть наилучшим образом соответствовала (в традиционных терминах следовало бы сказать «осуществляла подгонку») существующей сис­теме факторов, на которых выполнялось «обучение». После обуче­ния на имеющихся данных сеть готова к работе и ее можно исполь­зовать для построения прогнозов.

«Сеть», полученная в результате «обучения», отражает законо­мерности, присутствующие в существующих данных. При таком подходе она оказывается функциональным эквивалентом некото­рой модели зависимостей между переменными. Однако в отличие от традиционных моделей в случае «сетей» эти зависимости не мо­гут быть записаны в явном виде, подобно тому, как это делается в статистике (например, «А положительно коррелировано с В для на­блюдений, у которых величина С мала, a D велика»).

Методы нейронных сетей можно применять и в таких исследо­ваниях, где целью является построение объясняющей модели явле­ния, поскольку с помощью нейронных сетей определяют значимые переменные или группы таких переменных. При этом полученные результаты могут облегчить процесс последующего построения мо­дели.

Имеются нейросетевые программы, которые с помощью слож­ных алгоритмов могут находить наиболее важные входные перемен­ные, что уже непосредственно помогает строить модель.

Одно из главных преимуществ нейронных сетей — возможность теоретически аппроксимировать любую непрерывную функцию, когда исследователю не нужно заранее принимать какие-либо ги­потезы относительно модели и какие переменные действительно важны.

Однако существенным недостатком нейронных сетей является то обстоятельство, что окончательное решение зависит от начальных установок сети и, как уже отмечалось ранее, его практически невоз­можно «интерпретировать» в традиционных аналитических терми­нах, которые обычно применяют при построении теории явления.

64