5.Уровни доверия к статистической модели
Для экологических, экономических, технологических и иных исследований, а также для исследования природных и природно-техногенных объектов, допустимая доверительная вероятность [D] найденной статистической модели оценивается по следующей классификации уровня доверия к полученной регрессионной формуле:
50 ≥ D - трудно сказать, может оказаться, что эта точка (наблюдение) резко отличается от других и поэтому её можно все же исключить и снова провести повторную параметрическую идентификацию; если же почти все точки дают отклонение с относительной погрешностью более 50%, то такая статистическая формула далее не рассматривается, и она видоизменяется по конструкции, то есть в дальнейшем повторяется структурная идентификация (в статистическом моделировании заранее предполагается, что исходные статистические данные достоверны);
60 ≥ D ≥ 50% - формула статистической закономерности (закономерностью формула становится тогда, когда множество примеров изменения одного показателя описывается одним и тем же типом конструкции статистической модели) может быть применена только для прикидочных рассуждений и не может быть использована при прогнозировании (если это резко выделяющаяся точка, то она исключается и считается случайно недостоверной, а затем выполняется повторная параметрическая идентификация на ПЭВМ);
70 ≥ D≥60% - формула пригодна для выявления общих тенденций (трендов) изменения значений рассматриваемого показателя, однако недостаточно достоверна для формулировки конкретных выводов и выработки конкретных рекомендаций;
80 ≥ D ≥ 70% - применение формулы возможно для выполнения различных ориентировочных расчетов, в том числе и по ориентировочному прогнозу на горизонт прогноза, меньший трети длины основания прогноза (такая точность считается достаточной в экологических, сельскохозяйственных и иных процессах природопользования, однако при наличии достоверной исходной информации относительно высокой точности следует стремиться создавать более адекватные к исходным данным статистические модели);
90 ≥ D ≥ 80% - формула применима для краткосрочного (1-2 года) и среднесрочного (3-5 лет) прогнозирования, а также для обоснования различных мероприятий по совершенствованию объекта исследования;
95 ≥ D ≥ 90% - формула статистической модели может быть применена для долгосрочного прогнозирования (но не более одной трети основания прогноза), а также в исследованиях технологических систем и частично природно-техногенных объектов;
99≥D≥ 95% - статистическая модель имеет очень высокую достоверность и поэтому может быть применена для сверхдальнего прогнозирования на горизонт прогноза, равный основанию прогноза; эти модели пригодны для интерпретации технических экспериментов, а также для выработки эффективных экологических, экономических, технологических и технических мероприятий;
D = 100% - статистическая закономерность становится однозначно достоверной, т.е она становится функциональной зависимостью. Такой случай может произойти при малых числах наблюдений. Если же число точек значительно (более трех), то статистическая модель может стать устойчивым законом (если было выполнено условие высокой точности измерения наблюдений и высокой точности по полноте статистических выборок).
Сопоставление погрешностей измерения изучаемых показателей с погрешностями моделирования позволяет определить уровень требований к адекватности статистической модели.
Вполне очевидно, что нет практического смысла достичь высокой точности моделирования, если исходные данные сами по себе имеют высокую погрешность.
В связи с этим следует придерживаться следующей рекомендации: точность моделирования должна быть не намного выше (например, в 2-3 раза) точности измеренных значений исследуемого показателя.