2. Различия между процессами идентификации и аппроксимации
Главным недостатком всех существующих методов статистического моделирования является применение аппроксимации полиномов. Вначале рассмотрим некоторые определения.
Аппроксимация - это процесс подбора уравнения произвольной конструкции, которая с наименьшей погрешностью описывает статистические данные. При этом смысловое содержание подобранного таким образом уравнения даже не обсуждается. В итоге получаются модели, не имеющие физическою смысла.
Идентификация - это процесс установления сходства конструкции и содержательного смысла модели не только по наименьшей погрешности к статистическим данным, но, прежде всего, по эвристическому соответствию смысла принимаемой формулы как статистической закономерности с содержательным смыслом изучаемого явления или процесса. Идентифицировать - устанавливать совпадение кого-либо, чего-либо, сходство с подобным, однородным ему. В процессе многофакторного эвристического регрессионного анализа (МЭРА) [29 - 43, 73, 85, 86] под идентификацией понимается процесс деятельности исследователя при сравнении реальных или мысленных объектов друг с другом.
В последующих главах мы покажем примеры из книг различных авторов, которые были получены методами аппроксимации и повторно моделированы нами с использованием методологии идентификации.
При этом оказывается, что аппроксимация является частным, причем грубо упрошенным, случаем идентификации.
Для этого рассмотрим все варианты отношений между двумя объектами, учитываемыми в статистическом моделировании - это статистические данные и математическое уравнение. Несомненным фактом является то, что первичным является табличная модель статистических данных. Априори также ясно, что табличная модель имеет все три вида информационного описания - эвристическое, структурное и параметрическое.
Тогда становится понятным, что аппроксимация предполагает подбор произвольного уравнения по какому-то количественному критерию адекватности (как правило, это минимум расхождения между расчетными и фактическими значениями изучаемого показателя по методу наименьших квадратов). Для ПЭВМ существуют математические среды, в которых имеется библиотека из более 2000 подбираемых уравнений. Но почти все они не имеют содержательного смысла.
С позиций методологии идентификации при аппроксимации происходит только параметрическое сравнение без проверки соответствия структуры модели, а тем более без проверки соответствия смысла уравнения содержанию изучаемого явления или процесса. Иначе говоря, получение регрессионных уравнений методом аппроксимации относится с грубой идентификации искомых закономерностей по только одному количественному критерию - минимуму среднеквадратичного отклонения теоретических значений от фактических данных.
Предлагаемая нами методология статистического моделирования предполагает реализацию всех трех этапов информационного описания: эвристический - подбор устойчивых законов и их фрагментов, которые имеют общепринятый в научной среде содержательный смысл и проверены на большом числе практических примеров вне зависимости от отрасли науки; структурный - конструкции принимаемых устойчивых законов и их фрагментов располагаются определенным образом в искомой статистической закономерности, причем каждая составляющая этой искомой статистической закономерности получает эвристический и структурный смысл. В итоге каждый параметр статистической закономерности, идентифицированной по табличной модели статистических данных, получает также содержательный смысл.
Дальнейшее развитие и распространение методов статистического моделирования не может быть плодотворным, пока не будет преодолен психологический барьер привязанности всей классической математики к методам аппроксимации. Поэтому внимательно рассмотрим понятие адаптации всего теоретического к естественным процессам в природе и обществе.
Любой природный объект имеет высокую адаптивность по отношению и к техногенным воздействиям. Однако эта адаптивность чаще всего негативная дли дальнейшей жизни на земле всего человечества. Поэтому и создаваемые технические объекты, и соответствующие способы пользования природными ресурсами должны быть еще более адаптивными к и экологическим изменениям. В этом смысле любая функция и структура деятельности должна стать адаптивной. Поэтому любые технические средства становятся моделями, в той или иной степени адаптирующим к экологическим функциям.
Этот же принцип можно перенести и на полученные статистические модели. Их можно рассматривать также как машины, только не как материальные, а формальные. Тогда статистическая (в общем случае - математическая) модель становится конечной продукцией, которая получается последовательным преобразованием состояний «исследуемый объект - процесс поведения - факторы - переменные и показатели - математическая модель».
При этом по отношению к исследуемому объекту математическая (статистическая) модель получает следующие свойства:
а) адекватность, то есть результаты расчетов по математической модели совмещаются (с некоторой погрешностью) с результатами поведения исследуемого объекта;
б) адаптивность, то есть при изменении (из-за каких-то причин, чаще всего из-за действий людей) поведения объекта происходит соответствующее изменение и математической (статистической) модели, чтобы погрешность расхождения результатов объекта исследования и модели была минимальной.
Свойство адаптивности позволяет по прогнозным расчетам, полученным на основе готовой статистической модели, спроектировать тс или иные экологические, технологические и иные мероприятия, но которым возможно будет оценить смещение тенденций в положительное или отрицательное направление приращений (функциональных, конструктивных, параметрических).
Таким образом, появляется практическая возможность влиять на будущее через «ломку» линий прогнозных графиков, полученных на горизонт прогноза. Причем прогноз не будет отделяться от процесса статистического исследования, последующего статистического моделирования и практического использования полученных статистических моделей в прогнозировании и проектировании.
3. Процесс идентификации закономерности в программной среде CurveExpert
Полная идентификация включает в себя три этапа:
1) идентификация эвристическая - к этому этапу относится исследование функциональных структур поведения объекта исследования, содержательное описание и построение эвроритмов, а также выбор типа устойчивых законов, применяемых в искомых статистических закономерностях (во многом сложность выбранной исходной структуры зависит от полноты и достоверности исходной статистической количественной информации);
идентификация структурная (конструктивная), когда спроектированная по концептуальным представлениям математическая модель подвергается изменениям и корректировке по своей конструкции (поэтапно в ходе статистического моделирования);
идентификация параметрическая, то есть привязка элементов и заданной структуры математической модели к реальному объекту на основе сравнений выходных результатов исследуемого объекта и статистической модели (ГОСТ 20913-75).
Еще раз напомним, что сама исходная математическая модель может быть сконструирована аналитически по прошлым знаниям, выбрана произвольно для аппроксимации или принята по устойчивому закону распределения. В данной книге почти все примеры относятся к третьему случаю (биотехнический закон и принцип цикличности).
Приводится классификация элементов математических (статистических) моделей, которая не претендует на полноту. Все понятия получены на основе обобщения существующей литературы по моделированию с учетом принципа презумпции абстрактной возможности.
Фактор - отличительная особенность (факт) явления или процесса, которому присвоено понятие. Факторы - это элементы, причины, воздействующие на один или ряд показателей.
Первичный фактор - приметная отличительная особенность, которую нельзя в конкретных условиях системы и среды ее функционирования выразить через другие, более элементарные факторы, то есть в условиях исследования практически выразить данный факт через другие факты.
Косвенный фактор - экзогенный фактор, отображающий особенности внешних независимых по отношению к данной схеме «система-среда функционирования» свойств, которые косвенно влияют на первичные факторы. Например, влияние солнечной радиации на производительность труда рабочих, особенно в сельском и лесном хозяйствах, выражаются через природно-климатические факторы.
Производный фактор - искусственно созданное свойство, которое выражается через первичные факторы. Например, себестоимость, удельные энергозатраты, удельная работа резания и т.д.
При построении статистических моделей целесообразно принять первичные факторы, что позволяет упростить их конструкцию. Модель с учетом производных факторов может иметь чрезвычайно сложную функциональную структуру (хотя будет иметь по конструкции простой вид), трудно объяснимую причинно-следственную связь. Такой прием в конструировании моделей аналогичен упрощению математических уравнений путем сокращения одинаковых символов.
Переменная - фактор, учитываемый в конкретной готовой математической модели и отражающий как причинные, так и следственные особенности исследуемого объекта.
Многомерная переменная - переменная, которая сама описывается множеством соподчиненных переменных. В этом случае презумпция возможности допускает иерархическую структуру образования переменных.
Константа (постоянная) - знак отношений (+, -, х, / и т.п.) между переменными в математической модели.
Параметр - переменная, которая приближается в ходе идентификации к постоянному (устойчивому) значению, то есть в процессе идентификации параметр - это регулируемая, управляемая, оптимизируемая переменная (параметр математической модели).
Параметр объекта - управляемый и изменяемый переменный фактор объекта исследования.
Параметр модели - объект параметрической идентификации, относительно которого выходной результат модели приближается к выходному результату объекта исследования. При прекращении процесса идентификации параметр превращается в регрессионный коэффициент.
Коэффициент регрессии (регрессионный коэффициент) - конечное числовое значение параметра модели, полученное в процессе параметрической идентификации.
Эмпирический коэффициент - коэффициент связи, регрессии, полученный чисто интуитивным (умозрительным, умозаключительным) путем. Эмпирический коэффициент - это граница между знанием и незнанием сущности изучаемого явления или процесса.
Граничная константа - знак, ограничивающий действие знаков отношений, и,как правило, это различные скобки, знаки перехода и знаки логических высказывании.
Оперативная константа (символ) - символ процесса, который должен быть выполнен над математическими конструкциями, т.е. отдельными логическими обособленными частями математической модели (знаки +, -, х, /, ехр , log , sin и др.). Такое выделение из класса констант двух подклассов - граничных и оперативных констант - позволяет переходить к конструированию вначале отдельных математических конструктов (модулей), а затем аналитических и смешанных моделей.
Объясняющая переменная - переменная, которая объясняет причинные связи в явлении или процессе (относится к экзогенным факторам).
Показатель - оценочная переменная, которая характеризует следствие, т.е. оценивает выходной результат функционирования эргатической (то есть объекта исследования с включением человека) системы.
Отсюда следует, что общее число переменных в модели равно сумме параметров модели, объясняющих переменных и показателей. Исследователь превращает некоторые переменные в параметры только вследствие недостаточности априорных и апостериорных знаний. Поэтому параметры модели, соответственно коэффициенты и эмпирические коэффициенты имеют реальный прямой и косвенный (содержательный) смысл Каждое число в математической модели - это не просто «число» как счетная единица, а число со смыслом как «вещь в себе».
Целевой показатель - оценочная переменная, полученная на основе программно-целевых исследований целей и прогнозных сценариев будущих состояний системы.
Плановый показатель - оценочная переменная, по которой для эргатической системы, то есть системы с включением людей (например, технологический комплекс), устанавливают плановые задания.
Директивный показатель - оценочная переменная, значение которой контролируется вышестоящими по иерархии эргатическими системами. Оптимальной является ситуация, когда целевые, плановые и директивные показатели совпадают по номенклатуре и значениям на одинаковый период упреждения. В реальных условиях эти множества взаимно пересекаются.
Собственный показатель - оценочная переменная, используемая для описания поведения только данной конкретной эргатической системы. Для множества однородных эргатических систем общее множество составляется путем объединения (дизъюнкции) конкретных множеств собственных показателей. Собственные показатели характеризуют, как правило, внутреннее функционирование системы и. как правило, не относятся к директивным и плановым показателям (частично относятся к целевым показателям).
Значение переменной - количественное или качественное выражение отличительной характеристики.
Критерий - мерило для определения достоверности. Любая оценочная переменная может быть принята как мерило для определения достоверности решения конкретной части задачи.
Критерий функционирования - обобщенный показатель, отражающий целостные свойства системы и ее функционирования. Такими критериями являются: стабильность, устойчивость, активность, интенсивность, целенаправленность, организованность, надежность, мощность, инертность, дискретность и др.
Критерий идентификации - обобщенный показатель или показатель, принятый для оценки модели.
Критерий оптимальности - показатель, обобщенный показатель или критерий функционирования системы, принятые как эндогенные переменные в математической модели, т.е. как выходной результат.