Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ практ зан.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.9 Mб
Скачать

7. 2. Двухфакторный дисперсионный анализ

Пусть случайная величина  зависит от двух признаков (факторов)  и Обозначим , , , — уровни факторов  и , соответственно. Результаты измерения случайной величины  представлены в таблице

 

1

2

3

...

1

...

2

...

...

...

...

...

...

...

...

В каждой клетке таблицы –  при каждом сочетании  уровней факторов проведено по одному наблюдению (измерению). Тогда общее число наблюдений .

Обозначим через  математическое ожидание  при уровне , ; через  — математическое ожидание  при уровне , .

Если при изменении фактора  сохраняется равенство , то естественно считать, что величина  не зависит от фактора , принимается  нулевая гипотеза . В противном случае,   зависит от фактора .

Аналогично определяется зависимость от фактора , нулевая гипотеза  

При решении задачи будем предполагать, что выполняются следующие условия: наблюдения при различных сочетаниях уровней факторов независимы и при всех сочетаниях уровней факторов случайная величина  нормально распределена с одной и той же дисперсией . Изменчивость наблюдаемых факторов при переходе от одной клетки таблицы к другой может быть обусловлена как изменением уровней факторов, так и случайными неконтролируемыми факторами. Изменчивость, вызванная случайными неконтролируемыми факторами, называется остаточной.

Вычислим общую среднюю результатов измерений по формуле .

Эту величину можно представить в другой форме, использующей групповые средние  и :

, .

Точка  в индексе величины  означает, что суммирование ведется по i-й строке, а точка в индексе величины  означает, что суммирование ведется по j-му столбцу. В этих обозначениях средняя результатов измерений вычисляется по формуле  или .

Средняя изменчивость, вызванная фактором , вычисляется по формуле .

Аналогично для изменчивости, вызванной фактором : . Для характеристики изменчивости, обусловленной случайными факторами, вычисляем .

Общую изменчивость величины  характеризуют величиной . Доказано, что .

Проверка гипотезы  основывается на сравнении величин  и  . Если гипотеза  верна, то величина  имеет распределение Фишера со степенями свободы  и . Зададимся уровнем значимости  и найдем правостороннюю критическую точку  — решение уравнения . Если  значение , вычисленное по результатам измерений удовлетворяет неравенству , то гипотеза  принимается. В противном случае – отвергается и можно заключить, что изменение фактора  влияет на изменение величины .

Мерой этого влияния является коэффициент детерминации , который показывает, какая доля общей изменчивости величины  обусловлена увеличением фактора . Аналогично проверяется гипотеза  основывается на сравнении величин  и  .

Если гипотеза  верна, то величина    имеет распределение Фишера со степенями свободы  и . При уровне значимости  правосторонняя критическая точка  — решение уравнения .

Если  значение , вычисленное по результатам измерений удовлетворяет неравенству , то гипотеза  принимается.

В противном случае гипотеза  отвергается и можно заключить, что изменение фактора   влияет на изменение величины .

Мерой этого влияния является коэффициент детерминации , который показывает, какая доля общей изменчивости величины  обусловлена увеличением фактора .

В рамках двухфакторного дисперсионного анализа можно получить более конкретное представление о случайной величине .

Ее модель на -м уровне фактора A и на j-м уровне фактора  B имеет вид , ,  , Где a  —  генеральное среднее случайной величины ,  — слагаемое, которое описывает эффект влияния фактора A на случайную величину  на  i-м уровне фактора A,  — слагаемое, которое описывает эффект влияния фактора B на случайную величину  на  j-м уровне фактора  B,  — слагаемое, которое описывает эффект влияния случайных факторов. Величины  — независимые случайные величины, имеющие одинаковое нормальное распределение .

Если гипотезы  и  не отвергаются, то в рассмотренной модели  параметры

 и .

Величина  является оценкой параметра , а величина  — несмещенная оценка параметра . Если гипотезы  и  отвергаются, то: оценка параметра a равна , оценка параметра  равна ,  оценка параметра  равна , а величина  служит несмещенной оценкой параметра .

Пример 6.2:

Проведите двухфакторный дисперсионный анализ таблицы. Запишите уточнённую модель.

 

10.9

11.1

9.9

11.51

13.3

15.2

14.8

14.9

17.3

18.0

19.6

19.3

На приведенном ниже рисунке изображён фрагмент листа Excel c результатами вычислений.

Выборочное значение критерия Фишера для фактора А попадает в критическую область, 89.19 > 5.14. Фактор А является причиной изменчивости случайной величины. Коэффициент детерминации для фактора А равен rA=0.94. Это означает, что более 94% всей изменчивости исследуемой случайной величины обусловлено изменением фактора А. Выборочное значение критерия Фишера для фактора В не попадает в критическую область, 1.56 < 4.76.

Фактор В не является причиной изменчивости случайной величины. На долю фактора В приходится только 2% изменчивости, поскольку rВ=0.02. Для всех уровней фактора случайные величины распределены нормально со стандартным отклонением 0.82 и математическими ожиданиями 10.852, 14.55 и 18.55 соответственно для каждого уровня фактора. Матрица,  описывающая влияние факторов на изучаемое явление – уточнённая матрица.

Так, например, на уровнях А2 и В3 случайная величина имеет нормальное распределение .

Задачи для самостоятельного решения:

Занятие 7

Регрессионный и корреляционный анализ.

Корреляция и причинная зависимость, коэффициент корреляции, корреляционное отношение. Регрессионные модели.