Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дрейзин В.Э., Кочура А.В. - Управление качество...doc
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
3.62 Mб
Скачать

Условие минимизации l по â(tN) выражается системой уравнений, которые в матричной форме имеют вид:

Х TN ФN ŶN Х TN XN ФN Â(tN) = 0 , (9.48)

откуда матрица параметров модели определяется как

Â(tN) = [Х TN XN ФN]-1 Х TN ФN ŶN .

Обозначив обратную матрицу

TN XN ФN]-1 = СN , (9.49)

окончательно получаем

Â(tN) = СN Х TN ФN ŶN . (9.50)

Заметим, что если ФN задать в виде единичной диагональной матрицы (все измерения равноценны), то выражение (9.50) вырождается в обычное выражение для определения коэффициентов регрессионной модели методом наименьших квадратов.

Теперь предположим, что после нахождения оценки коэффициентов Â(tN), появились дополнительные результаты измерений Х(tN+1) и y(tN+1). Эти дополнительные данные можно использовать для уточнения оценок коэффициентов без пересчёта матриц, входящих в выражение (9.50). С учётом новых данных выражение (9.50) примет вид

Â(tN+1) = СN+1 Х TN+1 ФN+1 ŶN+1 . (9.51)

При использовании φ(N,i,γ) вида (9.45) соблюдается равенство:

ФN+1 = γ ФN .

Используемые в данных выражениях произведение матриц будут равны:

XTN+1XN+1 = XTN XN + X(tN+1)XT(tN+1);

XTN+1·YN+1 = XTN YN + X(tN+1)YT(tN+1),

где: X(tN+1), XT(tN+1) – прямой и транспонированный векторы дополнительных измерений факторных признаков, а YT(tN+1) = у(tN+1) – (N+1)-е измерение выходной величины.

С учётом этого получим

Â(tN+1) = [γФN XTN XN + X(tN+1)XT(tN+1)]-1·[ γФN XTN YN + X(tN+1)YT(tN+1)] =

= [γCN-1 + X(tN+1)XT(tN+1)]-1·[ γФN XTN YN + X(tN+1)YT(tN+1)] . (9.52)

Воспользовавшись леммой об обращении матриц:

[P + X·XT]-1 = P-1 – (P-1 X·XT P-1) / (XT P-1X +1) , (9.53)

получаем

Вынося общий множитель , последнее выражение можно преобразовать к следующему виду

. (9.54)

Выражение (9.54) и определяет рекуррентный алгоритм определения наилучшей оценки параметров модели Â(tN+1) в момент времени tN+1 с учётом новых наблюдений Х(tN+1)=[x1(tN+1), x2(tN+1), …, xk(tN+1)], у(tN+1) и оценки Â(tN), найденной для предыдущего момента времени tN . При первом шаге, как видно из (9.54), не требуется пересчитывать обратную матрицу СN . Однако при следующем шаге (для момента времени tN+2 ) уже необходимо использовать матрицу CN+1 . Поэтому необходимо иметь и рекуррентную формулу для вычисления матрицы СN по предыдущей матрице СN-1 . Используя (9.53), можно аналогично выводу (9.54) получить

. (9.55)

Параметр γ в выражения (9.54) и (9.55) определяет скорость изменения от измерения к измерению весовой функции (9.45), определяющей скорость убывания ценности измерений во времени (чем больше скорость старения информации, тем меньше величина γ). Значение γ = 1 соответствует равным весам всех наблюдений в матрице наблюдений, и в этом случае выражения (9.54) и (9.55) определяют рекуррентный алгоритм нахождения оценок коэффициентов модели Â(tN+1) по оценке Â(tN), найденной для предыдущих N измерений, с использованием обычного метода наименьших квадратов. Таким образом, эти формулы позволяют уточнять оценки коэффициентов модели, используя дополнительные измерения, не пересчитывая все матрицы, и при одинаковой ценности всех измерений. Такие рекуррентные алгоритмы для оценок неизвестных параметров модели получили название алгоритмов стохастической аппроксимации.

В случае применения алгоритмов стохастической аппроксимации к статическим объектам, когда истинные значения параметров модели не меняются во времени, а ошибки в их оценке определяются только случайностью выборки данных, по которым они определяются, с ростом числа дополнительных измерений получаемые оценки будут стремиться к своим истинным значениям и, следовательно, с каждым шагом, изменения оцениваемых параметров будут уменьшаться и с ростом числа дополнительных измерений стремиться к нулю. Если же объект является динамическим, то истинные значения этих параметров зависят от времени и тогда, при использовании алгоритмов стохастической аппроксимации при условии равноценности всех измерений, с ростом числа дополнительных измерений оценки параметров модели будут только ухудшаться. Чтобы этого не происходило, необходимо вводить функцию убывания ценности измерений во времени, что и учтено в выражениях (9.54) и (9.55). Тогда алгоритм стохастической аппроксимации будет отслеживать изменения параметров модели во времени. Надо лишь правильно задать значение γ, чтобы, с одной стороны, изменения получаемых оценок не слишком отставали от изменений истинных значений определяемых параметров модели, а с другой стороны, чтобы эффективное окно наблюдений, фактически определяющее объём выборки, по которой производится оценивание параметров, не стало бы слишком узким, что может привести к плохому сглаживанию случайных ошибок наблюдений, а значит, к увеличению случайного разброса этих оценок.

Рассмотренный метод стохастической аппроксимации применительно к идентификации динамических объектов не учитывает наличие в них переходных процессов. Поэтому его можно применять лишь для объектов, динамических для больших времен и статических для малых времен. Реальные объекты всегда характеризуются наличием переходных процессов. Но, если определяемая модель не должна их учитывать, то, как уже отмечалось в п. 9.4.2, устранить влияние переходного процесса на исходную матрицу измерений можно путём введения временного запаздывания ∆t между i-ми измерениями входных величин и соответствующим измерением выходной величины. При этом, интервал времени между i-м и (i+1)-м измерениями должен заведомо превышать длительность переходного процесса с учётом задаваемого временного запаздывания ∆t .

Вопросы для самоконтроля:

  1. Как строится структурная схема технологического процесса?

  2. Что входит в понятие аппаратурно-процессорной единицы (АПЕ)?

  3. Какая контрольно измерительная аппаратура входит в АПЕ и какая – в контрольный пост (КП)?

  4. Каким образом могут распределяться функции между локальными и централизованными средствами контроля и управления технологическим процессом в зависимости от степени его автоматизации?

  5. Чем определяется необходимость оценки информативности и взаимной зависимости всех технологических параметров, влияющих на качество выходного продукта?

  6. Какие методы могут использоваться для исследования технологических параметров с целью отбора их необходимого минимума? Почему для получения исходной информации о технологическом процессе в большинстве случаев приходится использовать пассивный эксперимент?

  7. Как построить диаграмму разброса и какую полезную информацию о характере связи двух исследуемых параметров она может дать?

  8. Как найти уравнение регрессии и коэффициент корреляции при исследовании взаимной зависимости любых двух параметров?

  9. В чём состоят ограничения, присущие парным коэффициентам корреляции, при исследовании взаимных зависимостей технологических параметров?

10. Как можно убедиться в значимости статистической связи между двумя параметрами при небольших значениях коэффициента корреляции?

11. Каким образом можно количественно характеризовать тесноту статистической связи двух параметров при нелинейной зависимости?

12. Какими мерами достигается репрезентативность результатов пассивного эксперимента при исследовании технологических процессов?

13. С какой целью проводят «прореживание» результатов пассивного эксперимента при исследовании технологических процессов и как это делается?

14. На чём базируется метод наименьших квадратов при вычислении коэффициентов линейной модели многомерных зависимостей по данным пассивного эксперимента?

15. С какой целью проводится нормирование исходных данных при вычислении коэффициентов модели методом МНК?

16. Как определяется адекватность построенной модели относительно тех данных, по которым она была построена?

17. Как определяется значимость каждого члена построенной регрессионной модели?

18. Что препятствует применению стратегии исключения при построении оптимальной математической модели в условиях избыточности факторного пространства?

19. Почему не удаётся предварительно отсеять незначимые и тесно коррелирующие между собой факторные признаки с помощью дисперсионного и корреляционного анализов в условиях избыточности факторного пространства?

20. В чём состоит стратегия включения при построении оптимальной регрессионной модели технологического процесса в условиях избыточности факторного пространства?

21. Почему недостаточно критерия минимизации остаточной дисперсии по обучающей выборке при поиске оптимальной регрессионной модели, построенной с использованием стратегии включения?

22. Из-за чего построенная регрессионная модель может оказаться неустойчивой, и каким образом это предотвращается при построении модели с использованием D-критерия?

23. Каким образом можно строить нелинейные модели, сохраняя математический аппарат МНК?

24. Опишите общий порядок построения оптимальной регрессионной модели технологического процесса по данным пассивного эксперимента в условиях избыточности факторного пространства и взаимной коррелированности факторных признаков.

25. Какие различают разновидности динамических объектов, приводимых к условно статическим?

26. Каковы особенности пассивного эксперимента при построении регрессионных моделей объектов, динамических для малых времён и статических для больших?

27. Каковы особенности пассивного эксперимента при построении регрессионных моделей объектов, динамических для больших времён и статических для малых?

28. Каковы особенности пассивного эксперимента при построении регрессионных моделей объектов с временным запаздыванием?

29. За счёт чего в рекуррентном методе построения модели могут отслеживаться изменения параметров модели (её коэффициентов) во времени?

30. Каким образом в рекуррентном методе задаётся уменьшение ценности измерений, полученных в предыдущие моменты времени по сравнению с новыми измерениями?

31. Можно ли применить рекуррентный метод построения модели для статических объектов? Если да, то даст ли он какие-либо преимущества перед обычным регрессионным методом?