- •Содержание
- •Введение
- •§ 1. Математическая статистика. Выборочная совокупность. Точечные оценки параметров генеральной совокупности
- •§ 2. Интервальные оценки. Доверительная вероятность
- •§ 3. Проверка статистических гипотез. Проверка гипотез о значении математического ожидания
- •§ 4. Проверка статистических гипотез. Проверка гипотез о значении дисперсии
- •§ 5. Критерии согласия для корреляционных показателей. Критерии согласия относительно долей
- •Расчет коэффициента корреляции Пирсона производится по следующей формуле:
- •Пример 4.1
- •§ 6. Критерий согласия Пирсона . Критерий Вилкоксона однородности выборок
- •§ 7. Дисперсионный анализ. Однофакторный и двухфакторный дисперсионный анализ Однофакторный и двухфакторный дисперсионный анализ
- •7. 1. Однофакторный дисперсионный анализ
- •7. 2. Двухфакторный дисперсионный анализ
- •§ 8. Корреляционный и регрессионный анализ. Элементы теории корреляции
- •§ 9. Метод наименьших квадратов
- •§ 10. Множественная линейная регрессия
- •§ 11. Дискриминантный анализ
- •§ 12. Методы кластерного анализа
- •§ 13. Факторный анализ и анализ главных компонент
- •§ 13. Векторный анализ и теория поля. Основные понятия теории поля. Скалярное поле. Векторное поле. Оператор Гамильтона
- •§ 14. Функции комплексного переменного. Основные понятия. Аналитическая функция. Конформное отображение. Интегрирование функции комплексного переменного. Ряд Лорана
- •Литература
7. 2. Двухфакторный дисперсионный анализ
Пусть
случайная величина
зависит
от двух признаков (факторов)
и
Обозначим
,
,
,
—
уровни факторов
и
,
соответственно.
Результаты измерения
случайной величины
представлены
в таблице
|
1 |
2 |
3 |
... |
|
1 |
|
|
|
... |
|
2 |
|
|
|
... |
|
... |
... |
... |
... |
... |
... |
|
|
|
|
... |
|
В
каждой клетке таблицы – при каждом
сочетании уровней факторов проведено
по одному наблюдению (измерению). Тогда
общее число наблюдений
.
Обозначим
через
математическое
ожидание
при
уровне
,
;
через
—
математическое ожидание
при
уровне
,
.
Если
при изменении фактора
сохраняется
равенство
,
то естественно считать, что величина
не
зависит от фактора
,
принимается нулевая гипотеза
.
В противном случае,
зависит
от фактора
.
Аналогично
определяется зависимость от фактора
,
нулевая гипотеза
При
решении задачи будем предполагать, что
выполняются следующие условия:
наблюдения
при различных сочетаниях уровней
факторов независимы и
при всех
сочетаниях уровней факторов случайная
величина
нормально
распределена с одной и той же дисперсией
.
Изменчивость
наблюдаемых факторов при переходе от
одной клетки таблицы к другой может
быть обусловлена как изменением уровней
факторов, так и случайными неконтролируемыми
факторами.
Изменчивость, вызванная
случайными неконтролируемыми факторами,
называется остаточной.
Вычислим
общую среднюю результатов измерений
по формуле
.
Эту
величину можно представить в другой
форме, использующей групповые средние
и
:
,
.
Точка
в индексе величины
означает,
что суммирование ведется по i-й
строке, а точка в индексе величины
означает,
что суммирование ведется по j-му
столбцу.
В этих обозначениях средняя
результатов измерений вычисляется по
формуле
или
.
Средняя
изменчивость, вызванная фактором
,
вычисляется по формуле
.
Аналогично
для изменчивости, вызванной фактором
:
.
Для
характеристики изменчивости, обусловленной
случайными факторами, вычисляем
.
Общую
изменчивость величины
характеризуют
величиной
.
Доказано,
что
.
Проверка
гипотезы
основывается
на сравнении величин
и
.
Если
гипотеза
верна,
то величина
имеет
распределение Фишера со степенями
свободы
и
.
Зададимся
уровнем значимости
и
найдем правостороннюю
критическую точку
—
решение уравнения
.
Если
значение
,
вычисленное по результатам измерений
удовлетворяет неравенству
,
то гипотеза
принимается.
В противном случае – отвергается и
можно заключить, что изменение фактора
влияет
на изменение величины
.
Мерой
этого влияния является коэффициент
детерминации
,
который показывает, какая доля общей
изменчивости величины
обусловлена
увеличением фактора
.
Аналогично
проверяется гипотеза
основывается
на сравнении величин
и
.
Если
гипотеза
верна,
то величина
имеет
распределение Фишера со степенями
свободы
и
.
При
уровне значимости
правосторонняя
критическая точка
—
решение уравнения
.
Если
значение
,
вычисленное по результатам измерений
удовлетворяет неравенству
,
то
гипотеза
принимается.
В противном случае гипотеза отвергается и можно заключить, что изменение фактора влияет на изменение величины .
Мерой
этого влияния является коэффициент
детерминации
,
который показывает, какая доля общей
изменчивости величины
обусловлена
увеличением фактора
.
В рамках двухфакторного дисперсионного анализа можно получить более конкретное представление о случайной величине .
Ее
модель на
-м
уровне фактора A
и на j-м
уровне фактора B
имеет вид
,
,
,
Где
a
— генеральное среднее случайной
величины
,
—
слагаемое, которое описывает эффект
влияния фактора A
на случайную величину
на
i-м
уровне фактора A,
—
слагаемое, которое описывает эффект
влияния фактора B
на случайную величину
на
j-м
уровне фактора B,
—
слагаемое, которое описывает эффект
влияния случайных факторов.
Величины
—
независимые случайные величины, имеющие
одинаковое нормальное распределение
.
Если гипотезы и не отвергаются, то в рассмотренной модели параметры
и
.
Величина
является
оценкой параметра
,
а величина
—
несмещенная оценка параметра
.
Если
гипотезы
и
отвергаются,
то: оценка параметра a
равна
,
оценка параметра
равна
,
оценка параметра
равна
,
а величина
служит
несмещенной оценкой параметра
.
Пример 6.2:
Проведите двухфакторный дисперсионный анализ таблицы. Запишите уточнённую модель.
|
|
|
|
|
|
10.9 |
11.1 |
9.9 |
11.51 |
|
13.3 |
15.2 |
14.8 |
14.9 |
|
17.3 |
18.0 |
19.6 |
19.3 |
На приведенном ниже рисунке изображён фрагмент листа Excel c результатами вычислений.
Выборочное значение критерия Фишера для фактора А попадает в критическую область, 89.19 > 5.14. Фактор А является причиной изменчивости случайной величины. Коэффициент детерминации для фактора А равен rA=0.94. Это означает, что более 94% всей изменчивости исследуемой случайной величины обусловлено изменением фактора А. Выборочное значение критерия Фишера для фактора В не попадает в критическую область, 1.56 < 4.76.
Фактор В не является причиной изменчивости случайной величины. На долю фактора В приходится только 2% изменчивости, поскольку rВ=0.02. Для всех уровней фактора случайные величины распределены нормально со стандартным отклонением 0.82 и математическими ожиданиями 10.852, 14.55 и 18.55 соответственно для каждого уровня фактора. Матрица, описывающая влияние факторов на изучаемое явление – уточнённая матрица.
Так,
например, на уровнях А2
и
В3
случайная
величина имеет нормальное распределение
.
Задачи для самостоятельного решения:
Занятие 7 |
Регрессионный и корреляционный анализ. Корреляция и причинная зависимость, коэффициент корреляции, корреляционное отношение. Регрессионные модели. |
