- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
6.6. Рандомизация эксперимента
При выполнении отсеивающих экспериментов и дисперсионного анализа (если он не ведется как обработка «пассивного» эксперимента) сначала составляется план эксперимента, т. е. выбирается, сколько факторов и на каком количестве уровней будет варьироваться и сколько раз будет повторен опыт при каждом сочетании уровней факторов. Чтобы уменьшить влияние неконтролируемых факторов, эксперимент должен быть «рандомизирован», т. е. запланированные опыты должны выполняться в случайном порядке.
Поясним это требование: допустим, что при разработке опытного образца нового типа лампы нужно исследовать влияние сорта кварца на срок службы горелки, для этого решено изготовить 3 серии горелок (по 10 штук в каждой) из трех разных сортов кварца. Если рабочий сначала изготовить все 10 горелок первой серии, потом - второй и т. д., то дисперсионный анализ может обнаружить влияние фактора на параметр (срок службы), но этот результат может быть ошибочным. Наблюдаемый рост срока службы может объясняться не влиянием сорта кварца, а постепенным повышением качества изделия в результате освоения рабочим технологии в ходе изготовления всей опытной партии.
При «рандомизации» мы перенумеровываем все запланированные опыты, а затем определяем порядок их выполнения с помощью таблиц случайных чисел или генераторов случайных чисел на ЭВМ.
Рассмотрим пример плана трехфакторного дисперсионного анализа. Буквами условно обозначены уровни факторов: малые буквы - первый фактор, большие буквы - второй, греческие - третий. Числа в табл. 6.6.1.определяют порядок выполнения опытов (они получены с помощью генератора случайных чисел на ЭВМ).
Таблица 6.6.1
План эксперимента при трехфакторном дисперсионном анализе
-
Фактор
1
Фактор 2
A
B
C
D
a
15
13
7
1
b
10
12
5
11
c
6
9
4
16
D
14
8
2
3
Здесь приведен пример плана, в котором 3 фактора варьируются на 4-х уровнях каждый. Так, например, в опыте 9 (c, B, ) первый фактор взят на третьем уровне, второй фактор - на втором уровне, третий фактор - на четвертом уровне.
6.7. Определение аналитического вида зависимости параметра от факторов.
6.7.1. Матрица планирования
После того, как выявлены основные факторы, влияющие на параметр, и определен диапазон варьирования факторов (так называемая область плана эксперимента), задачу оптимизации (нахождения комбинации факторов, обеспечивающих требуемый экстремум параметра) можно решить, найдя аналитический вида зависимости параметра от факторов, и затем экстремум найденной функции. Если искомая зависимость может быть описана линейной моделью, то ее коэффициенты находятся методом наименьших квадратов, описанным в главе 4.
Выбор числа и расположения экспериментальных точек в области плана эксперимента, обеспечивающий минимизацию погрешности коэффициентов модели при фиксированном числе опытов и погрешности измеряемой величины, составляет предмет математической теории планирования эксперимента.
Значительное упрощение расчетов и одновременно минимизацию погрешности b обеспечивают так называемые «ортогональные планы». В «ортогональном плане» уровни факторов выбираются так, чтобы матрица A удовлетворяла условиям (6.5.1), (6.5.2). В этом случае AТA является диагональной, на диагонали будут стоять суммы квадратов элементов соответствующих столбцов.
«Обращение» диагональной матрицы состоит в замене каждого ее элемента на обратную величину. Вычисление i-го элемента произведения (AТy) осуществляется простым суммированием произведений элементовi-го столбца матрицыAТна соответствующие значенияyj.
Ортогональные планы легко построить, если предполагается линейная зависимость параметра от нескольких факторов, что часто бывает разумно на начальных этапах поиска, или если в модель входят только линейные члены и произведения факторов (как в ранее рассмотренном примере). В этом случае план будет ортогональным, если расположить экспериментальные точки симметрично относительно центра плана, т.е. точки, в которой значения всех факторов хiравныiполуразности максимальногоximaxи минимальногоximinзначения фактора i=(ximax- ximin)/2,а затем перейти к новым переменным.
, (6.7.1)
где hi выбирается произвольно, но так, чтобы значения z были равны одной или нескольким единицам.
При варьировании факторов только на двух уровнях удобно строить матрицу планирования на основе матрицы Адамара (6.5.3) , тогда h i = ximax- i.
Если нет сомнений в линейности зависимости параметра от факторов, то наименьшая погрешность коэффициентов модели получится, если все опыты делать только на границах варьирования факторов. В этом легко убедиться простым сравнением диагональных элементов AТA-1 в двух вариантах плана эксперимента из четырех опытов в моделиy=b1+b2z.
Вариант 1. Два опыта приz = -1Вариант 2:z (1) =-1 , z (2) =-0.5,
и два опыта при z = +1 z (3) =0.5, z (4) =1
Если же предполагается, что зависимость имеет вид полинома степени m, то экспериментальные точки в области отz=-1 до z=+1рекомендуется располагать в точкахzi=cos[i/m], i=0,1…m.Правда, при этом не будет возможности проверить адекватность модели. Если такая проверка нужна, можно строить план для полинома степени большей, чемm, например,m+1 (zi=cos[i/(m+1)], i=0,1…m+1)илиm+2(zi=cos[i/(m+2)], i=0,1…m+2),а модель записать в виде полинома степени m.
В случае зависимости параметра от нескольких (k)переменных область варьирования факторов представляет собойk-мерный куб. Рекомендуется обязательно выполнять эксперименты во всех вершинах куба (все переменные равны+1или–1) и в центре плана ( все переменные равны0). Если этого недостаточно для определения коэффициентов и проверки адекватности, то - в центрах граней куба (одна переменная равна1, остальные0), в центрах ребер куба (одна переменная равна0, остальные1). Если и этого недостаточно, следует располагать экспериментальные точки внутри куба симметрично относительно центра плана.