Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дрейзин В.Э., Кочура А.В. - Управление качество...doc
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
3.62 Mб
Скачать

9.3.5. Общий алгоритм построения многофакторной регрессионной модели

в условиях неопределённости

При широких диапазонах изменений факторных признаков погрешности аппроксимации моделируемых зависимостей линейным многочленом могут недопустимо возрастать и существенно превысить погрешность стохастичности, включая сюда и инструментальную составляющую. В таких случаях целесообразно исследовать различные нелинейные модели. Если из априорных соображений поверхность отклика во всем допустимом диапазоне факторного пространства характеризуется гладкостью и отсутствием перегибов, то наиболее удобной нелинейной моделью будет полином второго порядка

. (9.38)

Если же последнего предположения сделать нельзя, то помимо полинома второго порядка могут быть исследованы и полиномы более высоких порядков, и другие нелинейные функции.

Использование полиномиальных функций для аппроксимации нелинейных зависимостей базируется на разложении гладких непрерывных функций в ряд Тейлора, представляющий собой степенной ряд с возрастающим порядком членов.

Если же в функции отклика отчетливо просматривается периодичность, то могут быть использованы тригонометрические ряды.

Таким образом, выбор вида аппроксимируюшей нелинейной функции определяется априорными знаниями о свойствах функции отклика. В случае недостатка априорных знаний могут поочередно исследоваться различные виды аппроксимирующих функций и, уже по полученным результатам, выбирается наилучшая из них.

Хотя метод наименьших квадратов рассчитан на построение линейных регрессионных моделей, но, как уже было показано в п. 9.2.4 и 9.3.2, его легко распространить на случай построения нелинейных моделей различного вида. Для этого достаточно все нелинейные члены моделей заменить новыми переменными в первой степени, что приводит модель к линейному виду и позволяет использовать для нахождения неизвестных коэффициентов модели метод наименьших квадратов. В результате этого процедура построения модели остаётся той же самой, и для отбора значимых членов модели, могут быть использованы те же критерии. Остаётся лишь после построения такой «линейной» модели в расширенном факторном пространстве, произвести обратную замену переменных и мы получим оптимальную нелинейную модель принятого вида. При этом все тот же D-критерий позволит выбрать наилучшую нелинейную модель из нескольких конкурирующих видов.

Это позволяет составить общий алгоритм построения оптимальной регрессионной модели с использованием стратегии включения и D-критерия. Он состоит в следующем:

  1. Экспериментальные результаты пассивного многофакторного эксперимента систематизируются по величине результирующего признака Y, после чего вся выборка данных делится на две равные по объёму подвыборки – обучающую и проверочную (нечётные номера систематизированной последовательности данных образуют обучающую подвыборку, чётные – проверочную). Такое разделение обеспечивает равные диапазоны и примерно одинаковое распределение обеих подвыборок по значениям результативного признака.

  2. По каждому измеряемому факторному признаку дополнительно вводится среднеквадратическая погрешность его измерения, которая определяется как инструментальная погрешность средства измерения, используемого в многофакторном эксперименте для измерений каждого факторного признака.

  3. Задаётся вид аппроксимирующей модели (степень полинома или какая-либо другая нелинейная аналитическая функция).

  4. С учётом заданного вида модели (для нелинейных моделей) вводятся правила прямой и обратной замены переменных.

  5. Проводится нормирование исходных данных и вычисление нормированных значений дополнительно введённых факторных признаков (взамен нелинейных членов модели).

  6. Рассчитывается корреляционная матрица для полученного (в результате п.п. 4 и 5) расширенного факторного пространства.

  7. По максимальному парному коэффициенту корреляции с результирующим признаком отбирается первый фактор (первый шаг алгоритма отбора).

  8. По очереди строятся все двухфакторные модели, то есть к отобранному в п. 7 первому фактору по очереди добавляется каждый из оставшихся и по обучающей подвыборке вычисляются значения коэффициентов b0, b1, и b2 и остаточная дисперсия . Затем в найденное уравнение регрессии подставляются значения исходных данных проверочной подвыборки и вычисляется остаточная дисперсия по проверочной подвыборке. Далее по критерию Фишера проверяется незначимость превышения . Если незначимость подтверждается, то вычисляется значение D-критерия и по его минимуму отбирается наилучшая модель данного шага (то есть наилучшая двухфакторная модель), после чего можно переходить к следующему шагу. Если же незначимость превышения над не подтверждается, то происходит выход из алгоритма по неадекватности и наилучшей считается модель, полученная на первом шаге (однофакторная).

  9. Третий шаг состоит в построении наилучшей трёхфакторной модели. Для этого к отобранным в результате выполнения п. 8 двум факторам по очереди добавляются каждый из оставшихся, и строятся соответствующие трёхфакторные модели. Для них вычисляются значения , и D-критерия. По минимуму D-критерия выбирается наилучшая трёхфакторная модель. По критерию Фишера проверяется её адекватность . Если адекватность модели подтверждается, то полученное для нее значение D-критерия сравнивается со значением D-критерия для наилучшей двухфакторной модели. Если значение D-критерия уменьшилось, то осуществляется переход к четвёртому шагу, то есть к построению четырёхфакторных моделей. Если же значение D-критерия возросло, то алгоритм прерывается по глобальному минимуму D-критерия и оптимальной считается модель, полученная на предыдущем шаге.

Примечание: При больших объёмах выборок и высокой точности измерения факторных признаков после нескольких шагов, изменения D-критерия от шага к шагу могут быть незначительными, поэтому прерывать алгоритм по глобальному минимуму D-критерия следует лишь тогда, когда его рост на очередном шаге можно признать значимым. В качестве критерия значимости прироста D-критерия можно сравнивать значение прироста со среднеквадратической инструментальной погрешностью того средства измерений, которое использовалось в эксперименте для измерения результативного признака. Если прирост D-критерия превышает двукратную среднеквадратическую погрешность, то его можно считать значимым и, соответственно, прервать алгоритм.

  1. Все прочие шаги выполняются аналогично п. 9.

  2. Когда алгоритм отбора факторов будет закончен (по неадекватности или по глобальному минимуму D-критерия) и среди отобранных факторов оказались дополнительные, введённые путём замены нелинейных членов модели новыми линейными переменными, производится обратная замена переменных, приводится оптимальная нелинейная модель относительно исходных переменных (то есть непосредственно измеряемых факторов) и выдаются все её характеристики ( , и D-критерий). Оптимальная модель считается построенной. Чтобы легко было проследить динамику улучшения модели целесообразно выводить на печать не только окончательную модель, но и наилучшие модели каждого шага с их характеристиками.