- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
Рассмотрим пример. Имеются данные о светоотдаче шестнадцати металлогалоидных ламп, причем лампы группируются в четыре серии и различие между сериями состоит в том, что при изготовлении в горелки введены различные количества металлического индия. Выясним с помощью однофакторного анализа, влияет ли концентрация индия (это в нашем случае фактор) на светоотдачу горелок (параметр). В таблице 6.3.1 представлены результаты измерения светоотдачи (в лм/Вт). Уровни фактора: 1, 2, 3, 4 - в данном случае это дозировки индия 0.24; 0.43; 0.75; 1 мг.
Таблица 6.3.1
-
№ опыта
Уровни фактора (v уровней)
ri
j
i
1
2
3
4
о
1
100
97
95
95
п
2
97
95
80
90
ы
3
95
90
85
85
т
4
96
92
88
о
5
93
в
96.2
93.5
87.25
90.0
Введем обозначения:
хji- значение параметра, стоящее в таблице вj-й строке и вi-м столбце
(у нас светоотдача лампы номера j из серии номера i);
- среднее значение всех чисел в столбцеi(у нас - средняя светоотдача при определенной дозировке индия), для удобства дальнейших расчетов вычислим эти величины и занесем в таблицу;
- среднее для всех чисел в таблице (генеральное среднее);
ri– число опытов при каждом уровне фактора.
Гипотеза Н0состоит в том, что фактор - дозировка индия - не влияетна светоотдачу. В этом случае всехjiв таблице - выборка значений одной и той же случайной величиных.
Суть дисперсионного анализа (как однофакторного, так и многофакторного) состоит в том, что строятся различные оценки дисперсии х, и по критерию Фишера проверяется справедливость гипотезы о том, что это - оценки одной и той же дисперсии, т.е. факторне влияетна параметр. Оценки строятся так, чтобы, если влияние фактора есть, то оно бы себя проявило. Еслигипотеза Н0отвергается, то мы признаем, что фактор влияет на параметр.
По данным таблицы 6.3.1 вычисляем величины Q, Q1, Q2по формулам:
(6.3.1)
(6.3.2)
(6.3.3)
Можно показать аналитически и непосредственным вычислением на конкретном примере, что
Q = Q1+ Q2(6.3.4)
Q – это сумма квадратов отклонений всех чисел в таблице от генерального среднего. Если все они принадлежат выборке значений одной нормально распределенной величины с дисперсией 2(иногда говорят: «одной генеральной совокупности»), т. е. фактор не влияет на результат, то, из (5.1.7.) можно показать, что справедливо соотношение
2 n-1~Q/2, (6.3.5)
где n - полное число данных в таблице.
. (6.3.6)
Q2характеризует случайный разброс результатов внутри одного уровня фактора. Каждое слагаемое в Q2/2 распределено по закону ~2 с числом степеней свободы ri-1, следовательно, Q2/2~2 n-v. Q1характеризует, как видно из определения, именно влияние фактора. Но если этого влияния нет, то каждоеимеет дисперсию2/ ri, поэтому Q1/2 распределено по закону2 с числом степеней свободы v-1. Из (6.3.11) следует, что сумма числа степеней свободы для Q2/2 и Q1/2равна числу степеней свободы для Q/2.
Таким образом, проверка гипотезы об отсутствии влияния фактора сводится к проверке гипотезы о равенстве дисперсий, оцененных сначала как
, (6.3.7)
затем как
. (6.3.8)
Гипотеза проверяется по критерию Фишера . Выбрав уровень значимости, находим по таблицеF-распределения границу критической областиFq, такую, что при числе степеней свободыk1= v-1, k2=n-v. P{1/Fq>FилиF>Fq}=.
Если при этом экспериментальное значение F<Fq, то гипотеза принимается, т. е. фактор не влияет на результат.
Если в данном случае окажется, что S12<S22, то, учитывая смысл этих величин, следует сделать вывод, что фактор не влияет, даже если критерий попадет в критическую область, ведь это возможно и при справедливости гипотезы с вероятностью.Выполним расчеты для приведенного примера.
Q = (100-92.125)2+(97-92.125)2+(95-92.125)2. +(96-92.125)2+(93-92.125)2+(97-92.125)2+(95- 92.125)2+(90-92.125)2+(92-92.125)2+(95-92.125)2+(80-92.125)2+(85-92.125)2+(88-92.125)2+(95-92.125)2+(97-92.125)2+(85-92.125)2=439.75
Q1=5(96.2-92.125)2+4(93.5-92.125)2+4(87.25-92.125)2+3(90-92125)2=199.2
Q2=Q-Q1=240.55, здесь:n=16, v=4, соответственно, число степеней свободы дляQ1=3,Q2=12,
Откуда следует, что:
S12= Q1/3=66.4, S22= Q2/12=20.05,Fэ= S12/ S22=3.312,Fq(k1=3,k2=12, =0.05)=3.49, то естьFэ<Fq.
Это означает, что гипотеза Н0принимается:, дозировка индия в указанных пределах не влияет на светоотдачу.
При небольшом числе опытов можно проследить влияние сразу нескольких факторов. Итак, проверим: влияет ли на светоотдачу лампы (параметр) конструктивное исполнение горелки (первый фактор) и тепловой режим работы горелки (второй фактор), задаваемый наличием и конструктивным исполнением внешнего стеклянного баллона, окружающего горелку.
Испытаны семь горелок мощностью 250 Вт. Эти горелки одинаковы по наполнению ртутью и излучающими добавками, но несколько отличаются по межэлектродным расстояниям, диаметрам и точности центровки электродов. Каждая горелка испытана в трех тепловых режимах: режим 1 - открытая горелка,
режим2- в стандартном заводском баллоне,
режим 3 - в баллоне специальной конструкции, обеспечивающей более равномерное распределение температуры вдоль стенок горелки.
Результаты испытаний представлены в таблице 6.3. Числа в таблице - это ток регистрирующего фотоэлемента в микроамперах, т. е. величина, пропорциональная светоотдаче.
Введем обозначения:
- среднее по строке (в нашем случае среднее из трех значений светоотдачи по всем режимам для j-й горелки);
- среднее по столбцу, в нашем случае - среднее значение светоотдачи по всем горелкам для i-го режима.
- генеральное среднее всех чисел в таблице 6.3.1.
Таблица 6.3.1
Светоотдача образцов ламп (в условных единицах)
Горелка |
Режим (v уровней) | |||||
r |
j |
i |
1 |
2 |
3 | |
у |
1 |
|
6.9 |
7.8 |
9.5 |
8.07 |
р |
2 |
|
10.1 |
10.5 |
13.0 |
11.2 |
о |
3 |
|
9.7 |
10.5 |
11.9 |
10.7 |
в |
4 |
|
9.1 |
10.9 |
11.6 |
10.5 |
н |
5 |
|
8.5 |
9.0 |
10.1 |
9.2 |
е |
6 |
|
9.0 |
10.0 |
12.2 |
10.4 |
й |
7 |
|
9.2 |
9.8 |
10.4 |
9.8 |
|
8.9 |
9.78 |
11.24 |
9.98 |
Вычислим значения ивнесем их в последнюю строку и последний столбец таблицы, в нижнем правом углу запишем. Далее вычисляем суммы квадратов по формулам (6.2.8 - 6.2.9):
,.
Q1- характеризует разброс между строками, т. е. влияние первого фактора (у нас - конструкции);
Q2 -характеризует разброс между столбцами, т. е. влияние второго фактора (теплового режима).
В нашем случае:
Q1=3[(8.07-9.98)2 +(11.2-9.98)2 +(10.7-9.98)2 +(10.5-9.98)2+ (9.2-9.98)2+(10.4-9.98)2+ (9.8-9.98)2] = 20.37
Q2=7[(8.9-9.98)2+(9,78-9,98)2+(11.24-9.98)2 ] = 19.17
Теперь вычисляем сумму квадратов Q, которая характеризует отклонение всех значений таблицы от генерального среднего (см. (6.8 – 6.10)):
Q = (6.9-9.98)2+(7.8-9.98)2+(9.5-9.98)2+(10.1-9.98)2+(10.5-9.98)2+(13-9.98)2+ (9.7-9.98)2+
(10.5-9.98)2+(11.9-9.98)2+(9.1-9.98)2+(10.9-9.98)2+(11.6-9.98)2+(8.5-9.98)2+(9.0-9.98)2+
(10.1-9.98)2+(9.0-9.98)2+(10.0-9.98)2+(12.2-9.98)2+(9.2-9.98)2+(9.8-9.98)2+(10.4-9.98)2
= 42.02