Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат.мод.doc
Скачиваний:
11
Добавлен:
24.04.2019
Размер:
156.16 Кб
Скачать

2. Различия между процессами идентификации и аппроксимации

Главным недостатком всех существующих методов статистического моделирования является применение аппроксимации полиномов. Вна­чале рассмотрим некоторые определения.

Аппроксимация - это процесс подбора уравнения произвольной конструкции, которая с наименьшей погрешностью описывает стати­стические данные. При этом смысловое содержание подобранного та­ким образом уравнения даже не обсуждается. В итоге получаются моде­ли, не имеющие физическою смысла.

Идентификация - это процесс установления сходства конструкции и содержательного смысла модели не только по наименьшей погрешно­сти к статистическим данным, но, прежде всего, по эвристическому со­ответствию смысла принимаемой формулы как статистической законо­мерности с содержательным смыслом изучаемого явления или процесса. Идентифицировать - устанавливать совпадение кого-либо, чего-либо, сходство с подобным, однородным ему. В процессе многофакторного эвристического регрессионного ана­лиза (МЭРА) [29 - 43, 73, 85, 86] под идентификацией понимается про­цесс деятельности исследователя при сравнении реальных или мыслен­ных объектов друг с другом.

В последующих главах мы покажем примеры из книг различных ав­торов, которые были получены методами аппроксимации и повторно моделированы нами с использованием методологии идентификации.

При этом оказывается, что аппроксимация является частным, причем грубо упрошенным, случаем идентификации.

Для этого рассмотрим все варианты отношений между двумя объек­тами, учитываемыми в статистическом моделировании - это статисти­ческие данные и математическое уравнение. Несомненным фактом яв­ляется то, что первичным является табличная модель статистических данных. Априори также ясно, что табличная модель имеет все три вида информационного описания - эвристическое, структурное и параметри­ческое.

Тогда становится понятным, что аппроксимация предполагает под­бор произвольного уравнения по какому-то количественному критерию адекватности (как правило, это минимум расхождения между расчет­ными и фактическими значениями изучаемого показателя по методу наименьших квадратов). Для ПЭВМ существуют математические среды, в которых имеется библиотека из более 2000 подбираемых уравнений. Но почти все они не имеют содержательного смысла.

С позиций методологии идентификации при аппроксимации проис­ходит только параметрическое сравнение без проверки соответствия структуры модели, а тем более без проверки соответствия смысла урав­нения содержанию изучаемого явления или процесса. Иначе говоря, по­лучение регрессионных уравнений методом аппроксимации относится с грубой идентификации искомых закономерностей по только одному ко­личественному критерию - минимуму среднеквадратичного отклонения теоретических значений от фактических данных.

Предлагаемая нами методология статистического моделирования предполагает реализацию всех трех этапов информационного описания: эвристический - подбор устойчивых законов и их фрагментов, которые имеют общепринятый в научной среде содержательный смысл и прове­рены на большом числе практических примеров вне зависимости от от­расли науки; структурный - конструкции принимаемых устойчивых за­конов и их фрагментов располагаются определенным образом в искомой статистической закономерности, причем каждая составляющая этой искомой статистической закономерности получает эвристический и структурный смысл. В итоге каждый параметр статистической зако­номерности, идентифицированной по табличной модели статистических данных, получает также содержательный смысл.

Дальнейшее развитие и распространение методов статистического моделирования не может быть плодотворным, пока не будет преодолен психологический барьер привязанности всей классической математики к методам аппроксимации. Поэтому внимательно рассмотрим понятие адаптации всего теоретического к естественным процессам в природе и обществе.

Любой природный объект имеет высокую адаптивность по отноше­нию и к техногенным воздействиям. Однако эта адаптивность чаще все­го негативная дли дальнейшей жизни на земле всего человечества. По­этому и создаваемые технические объекты, и соответствующие способы пользования природными ресурсами должны быть еще более адаптив­ными к и экологическим изменениям. В этом смысле любая функция и структура деятельности должна стать адаптивной. Поэтому любые тех­нические средства становятся моделями, в той или иной степени адап­тирующим к экологическим функциям.

Этот же принцип можно перенести и на полученные статистические модели. Их можно рассматривать также как машины, только не как ма­териальные, а формальные. Тогда статистическая (в общем случае - ма­тематическая) модель становится конечной продукцией, которая полу­чается последовательным преобразованием состояний «исследуемый объект - процесс поведения - факторы - переменные и показатели - ма­тематическая модель».

При этом по отношению к исследуемому объекту математическая (статистическая) модель получает следующие свойства:

а) адекватность, то есть результаты расчетов по математической модели совмещаются (с некоторой погрешностью) с результатами поведения исследуемого объекта;

б) адаптивность, то есть при изменении (из-за каких-то причин, чаще всего из-за действий людей) поведения объекта происходит соответствующее изменение и математической (статистической) модели, чтобы погрешность расхождения результатов объекта исследования и модели была минимальной.

Свойство адаптивности позволяет по прогнозным расчетам, полу­ченным на основе готовой статистической модели, спроектировать тс или иные экологические, технологические и иные мероприятия, но ко­торым возможно будет оценить смещение тенденций в положительное или отрицательное направление приращений (функциональных, конст­руктивных, параметрических).

Таким образом, появляется практическая возможность влиять на бу­дущее через «ломку» линий прогнозных графиков, полученных на гори­зонт прогноза. Причем прогноз не будет отделяться от процесса стати­стического исследования, последующего статистического моделирования и практического использования полученных статисти­ческих моделей в прогнозировании и проектировании.

3. Процесс идентификации закономерности в программной среде CurveExpert

Полная идентификация включает в себя три этапа:

1) идентификация эвристическая - к этому этапу относится иссле­дование функциональных структур поведения объекта исследования, содержательное описание и построение эвроритмов, а так­же выбор типа устойчивых законов, применяемых в искомых статисти­ческих закономерностях (во многом сложность выбранной исходной структуры зависит от полноты и достоверности исходной статистиче­ской количественной информации);

  1. идентификация структурная (конструктивная), когда спроек­тированная по концептуальным представлениям математическая модель подвергается изменениям и корректировке по своей конструкции (по­этапно в ходе статистического моделирования);

  2. идентификация параметрическая, то есть привязка элементов и заданной структуры математической модели к реальному объекту на основе сравнений выходных результатов исследуемого объекта и стати­стической модели (ГОСТ 20913-75).

Еще раз напомним, что сама исходная математическая модель может быть сконструирована аналитически по прошлым знаниям, выбрана произвольно для аппроксимации или принята по устойчивому закону распределения. В данной книге почти все примеры относятся к третьему случаю (биотехнический закон и принцип цикличности).

Приводится классификация элементов математических (стати­стических) моделей, которая не претендует на полноту. Все понятия по­лучены на основе обобщения существующей литературы по моделиро­ванию с учетом принципа презумпции абстрактной возможности.

Фактор - отличительная особенность (факт) явления или процесса, которому присвоено понятие. Факторы - это элементы, причины, воз­действующие на один или ряд показателей.

Первичный фактор - приметная отличительная особенность, кото­рую нельзя в конкретных условиях системы и среды ее функционирова­ния выразить через другие, более элементарные факторы, то есть в ус­ловиях исследования практически выразить данный факт через другие факты.

Косвенный фактор - экзогенный фактор, отображающий особенно­сти внешних независимых по отношению к данной схеме «система-среда функционирования» свойств, которые косвенно влияют на пер­вичные факторы. Например, влияние солнечной радиации на произво­дительность труда рабочих, особенно в сельском и лесном хозяйствах, выражаются через природно-климатические факторы.

Производный фактор - искусственно созданное свойство, которое выражается через первичные факторы. Например, себестоимость, удельные энергозатраты, удельная работа резания и т.д.

При построении статистических моделей целесообразно принять первичные факторы, что позволяет упростить их конструкцию. Модель с учетом производных факторов может иметь чрезвычайно сложную функциональную структуру (хотя будет иметь по конструкции простой вид), трудно объяснимую причинно-следственную связь. Такой прием в конструировании моделей аналогичен упрощению математических уравнений путем сокращения одинаковых символов.

Переменная - фактор, учитываемый в конкретной готовой математической модели и отражающий как причинные, так и следственные особенности исследуемого объекта.

Многомерная переменная - переменная, которая сама описывается множеством соподчиненных переменных. В этом случае презумпция возможности допускает иерархическую структуру образования пере­менных.

Константа (постоянная) - знак отношений (+, -, х, / и т.п.) между переменными в математической модели.

Параметр - переменная, которая приближается в ходе идентифика­ции к постоянному (устойчивому) значению, то есть в процессе иден­тификации параметр - это регулируемая, управляемая, оптимизируемая переменная (параметр математической модели).

Параметр объекта - управляемый и изменяемый переменный фак­тор объекта исследования.

Параметр модели - объект параметрической идентификации, отно­сительно которого выходной результат модели приближается к выход­ному результату объекта исследования. При прекращении процесса идентификации параметр превращается в регрессионный коэффициент.

Коэффициент регрессии (регрессионный коэффициент) - конечное числовое значение параметра модели, полученное в процессе парамет­рической идентификации.

Эмпирический коэффициент - коэффициент связи, регрессии, по­лученный чисто интуитивным (умозрительным, умозаключительным) путем. Эмпирический коэффициент - это граница между знанием и не­знанием сущности изучаемого явления или процесса.

Граничная константа - знак, ограничивающий действие знаков отношений, и,как правило, это различные скобки, знаки перехода и зна­ки логических высказывании.

Оперативная константа (символ) - символ процесса, который должен быть выполнен над математическими конструкциями, т.е. от­дельными логическими обособленными частями математической моде­ли (знаки +, -, х, /, ехр , log , sin и др.). Такое выделение из класса кон­стант двух подклассов - граничных и оперативных констант - позволяет переходить к конструированию вначале отдельных математических конструктов (модулей), а затем аналитических и смешанных моделей.

Объясняющая переменная - переменная, которая объясняет при­чинные связи в явлении или процессе (относится к экзогенным факто­рам).

Показатель - оценочная переменная, которая характеризует следст­вие, т.е. оценивает выходной результат функционирования эргатической (то есть объекта исследования с включением человека) системы.

Отсюда следует, что общее число переменных в модели равно сумме параметров модели, объясняющих переменных и показателей. Исследо­ватель превращает некоторые переменные в параметры только вследствие недостаточности априорных и апостериорных знаний. Поэтому параметры модели, соответственно коэффициенты и эмпирические коэффициенты имеют реальный прямой и косвенный (содержательный) смысл Каждое число в математической модели - это не просто «число» как счетная единица, а число со смыслом как «вещь в себе».

Целевой показатель - оценочная переменная, полученная на основе программно-целевых исследований целей и прогнозных сценариев бу­дущих состояний системы.

Плановый показатель - оценочная переменная, по которой для эргатической системы, то есть системы с включением людей (например, технологический комплекс), устанавливают плановые задания.

Директивный показатель - оценочная переменная, значение кото­рой контролируется вышестоящими по иерархии эргатическими систе­мами. Оптимальной является ситуация, когда целевые, плановые и ди­рективные показатели совпадают по номенклатуре и значениям на одинаковый период упреждения. В реальных условиях эти множества взаимно пересекаются.

Собственный показатель - оценочная переменная, используемая для описания поведения только данной конкретной эргатической систе­мы. Для множества однородных эргатических систем общее множество составляется путем объединения (дизъюнкции) конкретных множеств собственных показателей. Собственные показатели характеризуют, как правило, внутреннее функционирование системы и. как правило, не от­носятся к директивным и плановым показателям (частично относятся к целевым показателям).

Значение переменной - количественное или качественное выраже­ние отличительной характеристики.

Критерий - мерило для определения достоверности. Любая оценоч­ная переменная может быть принята как мерило для определения досто­верности решения конкретной части задачи.

Критерий функционирования - обобщенный показатель, отражаю­щий целостные свойства системы и ее функционирования. Такими кри­териями являются: стабильность, устойчивость, активность, интенсив­ность, целенаправленность, организованность, надежность, мощность, инертность, дискретность и др.

Критерий идентификации - обобщенный показатель или показа­тель, принятый для оценки модели.

Критерий оптимальности - показатель, обобщенный показатель или критерий функционирования системы, принятые как эндогенные переменные в математической модели, т.е. как выходной результат.