
- •2.Факторы
- •2.2.Требования, предъявляемые к факторам при планировании эксперимента
- •3. Выбор модели
- •3.2.Шаговый принцип формирования модели
- •3.3.Выбор модели
- •3.4. Полиномиальные модели
- •3.5. Полный факторный эксперимент
- •3.6. Выбор основного уровня.
- •3.7 Выбор интервалов варьирования.
- •3.8. Полный факторный эксперимент типа 2к
- •3.9. Свойства полного факторного эксперимента 2к
- •3.10. Полный факторный эксперимент и математическая модель
- •4. Дробный факторный эксперимент
- •4.1. Минимизация числа опытов
- •4.2. Дробная реплика
- •4.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты
- •5. Проведение эксперимента
- •5.1. Анкета для сбора априорной информации
- •5. 2. Реализация плана эксперимента
- •5.3. Погрешности параллельных опытов
- •5.4. Элементы математической статистики
- •5.4.1. Выборка и ее характеристики
- •5.4.2. Эмпирическая функция распределения
- •5.4.3. Эмпирические (выборочные) моменты
- •5.5. Теория точечных оценок
- •5.6. Обработка результатов эксперимента
- •5.6.2. Регрессионный анализ
- •5.6.3. Проверка адекватности модели
- •5.7. Матричный подход к регрессионному анализу.
- •5.7.2. Некоторые операции над матрицами
5.6.2. Регрессионный анализ
МНК применяется на практике не только как вычислительный прием. При проверке какой-либо гипотезы о пригодности модели или о значимости коэффициентов, приходится прибегать к статистике. При этом МНК превращается в регрессионный анализ.
А регрессионный анализ, как всякий статистический метод, применим при определенных предположениях, постулатах.
Первый постулат. Параметр оптимизации у есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости, одна из характеристик этого закона распределения.
При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном распределении можно проверить стандартными статистическими тестами(например, χ -критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру. (Кроме тех случаев, когда заведомо известно, что это не так и требуется специальное рассмотрение). В том, что у — случайная величина, обычно сомневаться не приходится.
Второй постулат. Дисперсия у не зависит от абсолютной величины у. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках факторного пространства. Нарушение этого постулата недопустимо. Если однородность дисперсий все же отсутствует, то необходимо такое преобразование у, которое делает дисперсии однородными, которое не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски.
Третий постулат. Значения факторов суть неслучайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем ошибка воспроизводимости.
Нарушение этого постулата приводит к трудностям при реализации матрицы планирования. Поэтому оно обычно легко обнаруживается экспериментатором.
Существует еще четвертый постулат, налагающий ограничения на взаимосвязь между значениями факторов. Он выполняется автоматически при ортогональности матрицы планирования.
Если постулаты выполняются, то можно проверять статистические гипотезы.
5.6.3. Проверка адекватности модели
Основная задача, возникающая после вычисления коэффициентов модели, это проверка ее пригодности, т.е. проверка адекватности модели.
Ниже (рис. 21, а, б) приведены два рисунка с одинаковым расположением экспериментальных точек и, следовательно, одинаковым разбросом относительно линии регрессии, но с различным средним разбросом в точках (с различной дисперсией воспроизводимости).
Рис.21
Разброс в точках показан, отрезками прямых, составляющих доверительный интервал. Модель можно считать адекватной только в первом случае.
В данном случае разброс в точках такого же порядка, что и разброс относительно линии. Поэтому можно предполагать, что построенная модель пригодна. Во втором случае требуется более сложная модель, чтобы точность ее предсказания была сравнима с точностью эксперимента.
Числом степеней свободы в статистике называется разность между числом опытов и числом коэффициентов (констант), которые уже вычислены по результатам этих опытов независимо друг от друга.
Если, например, проведен полный факторный эксперимент 23 и найдено линейное уравнение регрессии, то число степеней свободы f = N- (k + 1) = 8 – (3 +1) = 4. Здесь (3 +1) количество констант в уравнении.
Остаточная
сумма квадратов, деленная на число
степеней свободы,
называется остаточной
дисперсией, или дисперсией адекватности
.