- •Лабораторный практикум по приложениям математической статистики
- •Первичная обработка результатов наблюдений Цель и содержание лабораторной работы № 1
- •Краткие теоретические сведения и план выполнения работы
- •Образец выполнения работы
- •Этап 1. Группировка данных в вариационный ряд
- •Этап 2. Графические изображения эмпирического закона распределения
- •В условных вариантах в исходных вариантах
- •Контрольные вопросы
- •Лабораторная работа № 2
- •Цель и содержание работы
- •2.1. Краткие теоретические сведения
- •1.Критерий согласия Пирсона
- •4. Критерий согласия Колмогорова
- •2.2. План выполнения работы и алгоритм расчетов
- •Критерий Романовского
- •Критерий Колмогорова
- •Графическая проверка
- •2.3 Образец выполнения работы
- •Приближенная проверка с использованием и
- •24. Вычислим с.К.О. И
- •Этап 4. Построение графиков эмпирических и теоретических распределений
- •2.4. Контрольные вопросы
- •Лабораторная работа № 3 Установление линейной корреляционной связи между двумя случайными величинами (факторами).
- •3.1. Краткие теоретические сведения
- •3.2. План выполнения работы и алгоритм расчетов
- •3.3. Образец выполнения работы
- •Двухфактроный дисперсионный анализ
Двухфактроный дисперсионный анализ
Однофакторный дисперсионный анализ легко обобщается на случай двух факторов. Пусть случайная величина зависит от двух признаков (факторов): А и В. Обозначим уровни факторов А и В соответственно. Результаты измерения случайной величины представлены в таблице.
|
1 |
2 |
3 |
…. |
|
1 |
|
|
|
… |
|
2 |
|
|
|
…. |
|
… |
… |
…. |
… |
… |
… |
|
|
|
|
… |
|
Для простоты полагаем, что в каждой клетке таблицы, т.е. при каждом сочетании уровней факторов, приведен результат только одного наблюдения (измерения). Тогда общее число наблюдений
Обозначим через математическое ожидание при уровне А , через математическое ожидание при уровне Если при измерении фактора А сохраняется равенство то естественно считать, что величина не зависит от фактора А; в противном случае зависит от фактора А; Аналогично определяется зависимость от фактора В.
Однако в априори (первоначально) значения и не известны. Таким образом, проблема сводится к задаче проверки гипотез: : и : (влияние факторов отсутствует т.е. средние значения факторов на всех уровнях одинаковы). При решении задачи будем предполагать, что выполняются следующие условия:
- ошибки наблюдений имеют нулевую среднюю;
наблюдения при различных сочетаниях уровней факторов независимы;
при всех сочетаниях уровней факторов случайная величина нормально распределена с одной и той же дисперсией
Изменчивость наблюдаемых факторов при переходе от одной клетки таблицы к другой может быть обусловлена как изменением уровней факторов, так и случайными неконтролируемыми факторами. Изменчивость, вызванная случайными неконтролируемыми факторами, называется остаточной.
Вычислим общую среднюю результатов измерений по формуле
Эту величину можно представить в другой форме, использующей групповые (факторные) средние и :
Точка в индексе величины означает, что суммирование ведется по ой строке, а точка в индексе величины - что суммирование ведется по ому столбцу. В этих обозначениях среднее результатов измерений вычисляется по любому из формул:
Средняя изменчивость, вызванная фактором А, вычисляется по формуле
Аналогично для изменчивости, вызванный фактором В:
Общая изменчивость, обусловленная случайными факторами, вычисляется как - остаточная дисперсия.
Общая изменчивость величины вычисляется как
Доказано, что .
Понятно, что по соотношению между , и можно судить о степени влияния факторов на случайную величину .
Проверка гипотезы о не влиянии (влиянии) фактора А основывается на сравнении величин и . Величина
имеет распределение Фишера-Снедекора со степенями свободы (числителя) и (знаменателя).
Зададимся уровнем значимости и найдем правостороннюю критическую точку решением уравнения Если значение вычисленное по результатам измерений, удовлетворяет неравенству то гипотеза о не влиянии фактора А принимается . В противном случае гипотеза отвергается, и можно заключить, что изменение фактора А влияет на изменение величины Мерой этого влияния является коэффициент детерминации
который показывает, какая доля общей изменчивости величины обусловлена изменением фактора А.
Аналогично проверяется гипотеза о не влиянии (влиянии) фактора В, которая основывается на сравнении величин и . Величина
имеет распределение Фишера-Снедекора со степенями свободы (числителя) и (знаменателя).
При уровне значимости правосторонняя критическая точка решение уравнения Если значение вычисленное по результатам измерений, удовлетворяет неравенству то гипотеза принимается. В противном случае гипотеза отвергается, и можно заключить, что изменение фактора В влияет на изменение величины .
Мерой этого влияния является коэффициент детерминации
который показывает, какая доля общей изменчивости величины обусловлена изменением фактора В.
В рамках двухфакторного дисперсионного анализа случайная величина может быть представлена в виде модели
(1)
где генеральное среднее значение величины ;
слагаемое, которое описывает эффект влияния фактора А на случайную величину на ом уровне фактора А;
слагаемое, которое описывает эффект влияния фактора В на случайную величину на ом уровне фактора В;
слагаемое, которое описывает эффект влияния случайных факторов, полагают, что
В модели (1) эффектом взаимодействия факторов пренебрегается.
Если гипотезы и не отвергаются (нет влияние факторов), то в рассматриваемой модели параметры и Величина представляет собой оценку параметра , а величина - несмещенную оценку параметра - остаточной дисперсии.
Если гипотезы и отвергаются (есть влияние факторов), то:
оцнека параметра равна ;
оцнека параметра равна ;
оцнека параметра равна ;
несмещенная оценка параметра равна .
Пример. Провести двухфакторный анализ таблицы.
|
|
|
|
|
|
||||
|
10,9 |
11,1 |
9,9 |
11,51 |
10,8525 |
||||
|
13,3 |
15,2 |
14,8 |
14,9 |
14,55 |
||||
|
17,3 |
18 |
19,6 |
19,3 |
18,55 |
||||
|
13,83333 |
14,76666667 |
14,76667 |
15,23667 |
|
В примере
- общая средняя.
= - средние знчения по фактору А.
= -средние значения по фактору В.
- дисперсия по фактору А.
- дисперсия по фактору В.
-остаточная дисперсия.
- общая дисперсия.
- наблюдаемое значение критерия Фишера по фактору А.
- критическое значение критерия Фишера (берется из таблицы Приложения), где уровень доверия; - степень свободы факторной дисперсии по А; степень свободы остаточной дисперсии.
Гипотеза о том, что величина не зависит от фактора А отвергается, т.к. , т.е. 29,73>5,143.
Коэффициент детерминации фактора А
- наблюдаемое значение критерия Фишера по фактору В.
- критическое значение критерия Фишера (берется из таблицы Приложения), где уровень доверия; - степень свободы факторной дисперсии по фактору В; степень свободы остаточной дисперсии.
Гипотеза о том, что величина не зависит от фактора В принимается , т.к. , т.е. 0,781<4,757. Коэффициент детерминации фактора В
Генеральная средняя
Несмещенная оценка параметра
Обсуждение результатов. Коэффициент детерминации для фактора А равен Это означает, что более 94% изменчивости исследуемой случайной величины обусловлено изменением этого фактора. На долю фактора В приходится только 2,5 % изменчивости, поскольку
Независимость от фактора позволяет построить уточненную модель исследуемой случайной величины в виде
где независимые случайные величины, распределенные нормально с нулевыми математическими ожиданиями и дисперсией
С учетом изложенного, матрица, описывающая влияние факторов на изучаемое явление, имеет вид:
|
|
|
|
|
|
10.852 |
10.852 |
10.852 |
10.852 |
|
14.55 |
14.55 |
14.55 |
14.55 |
|
18.55 |
18.55 |
18.55 |
18.55 |
Остальная часть элементов исходной матрицы обусловлена случайными факторами. Например, на уровнях и случайная величина имеет нормальное распределение
Контрольные вопросы
В терминах проверки статистической проверки гипотез сформулировать математическую постановку задачи двухфакторного дисперсионного анализа.
Записать и пояснить математическую модель двухфакторного дисперсионного анализа.
Записать и пояснить предпосылки применения модели двухфакторного дисперсионного анализа.
Записать формулы для вычисления групповых (факторных) и общих средних.
Записать и пояснить формулу для вычисления общей дисперсии и формулы ее раложения на факторные (А и В) и остатоточную дисперсии.
Записать критериальные формулы для проверки нулевых гипотез по А и В (распределения Фишера-Снедекора).
Записать формулы для вычисления степеней свободы дисперсий по фактору А, фактору В и остаточной дисперсии.
Записать уравнения для определения критических значений , критериев и . Дать интерпретацию полученных численных результатов.
Записать и пояснить формулы для вычисления коэффициентов детерминации по факторам А и В и пояснить полученные численные результаты.
Записать формулы оценки параметров распределения исследуемой случайной величины.