- •6.1.4. Статистические оценки параметров распределения
- •6.1.4.1. Точечные оценки основных числовых характеристик генеральной совокупности
- •6.1.4.2. Интервальные оценки основных числовых характеристик генеральной совокупности
- •6.1.4.3. Оценка вероятности (биномиального распределения) по относительной частоте
- •6.2. Проверка статистических гипотез
- •6.2.1. Статистическая гипотеза и общая схема ее проверки
- •6.2.2. Сравнение двух дисперсий нормальных генеральных совокупностей
- •6.2.3. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- •6.2.4. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- •6.2.5. Проверка гипотезы о законе распределения. Критерий 2 Пирсона
- •6.2.6. Критерий Вилкоксона и проверка гипотезы об однородности двух выборок
- •6.2.6.1. Проверка нулевой гипотезы в случае, когда объем обеих выборок не превосходит 25.
- •6.2.6.2. Проверка нулевой гипотезы в случае, когда объем хотя бы одной из выборок превосходит 25.
- •Глава 7. Элементы корреляционного, регрессионного и дисперсионного анализа
- •7.1. Элементы корреляционного и регрессионного анализа
- •7.1.1. Уравнение регрессии. Коэффициент корреляции
- •7.1.2. Ранговая корреляция.
- •7.1.2.1. Выборочный коэффициент ранговой корреляции Спирмена
- •7.1.2.2. Проверка гипотезы о значимости выборочного коэффициента ранговой корреляции Спирмена
- •7.2. Элементы дисперсионного анализа
7.1.2. Ранговая корреляция.
7.1.2.1. Выборочный коэффициент ранговой корреляции Спирмена
Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками: А и В. Под качественным подразумевают признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Для определенности условимся располагать объекты в порядке ухудшения качества.
Расположим сначала объекты в порядке ухудшения качества по признаку А. Припишем объекту, стоящему на i-ом месте, число – ранг xi, равный порядковому номеру объекта: xi=i. Затем расположим объекты в порядке убывания качества по признаку В и припишем каждому из них ранг (порядковый номер) yi, причем (для удобства сравнения рангов) индекс i при y по-прежнему равен порядковому номеру объекта по признаку А.
В итоге получим две последовательности рангов:
по признаку А: x1 x2 … xn,
по признаку В: y1 y2 … yn.
Для оценки степени связи признаков А и В служит, в частности, коэффициент ранговой корреляции Спирмена.
Выборочный коэффициент ранговой корреляции Спирмена находится по формуле
,
где
,
n
– объем выборки.
Абсолютная
величина коэффициента ранговой корреляции
Спирмена не превышает единицы:
.
Для обоснованного суждения о наличии связи между качественными признаками следует проверить, значим ли выборочный коэффициент ранговой корреляции Спирмена.
7.1.2.2. Проверка гипотезы о значимости выборочного коэффициента ранговой корреляции Спирмена
Пусть
генеральная совокупность состоит из
объектов, которые обладают двумя
качественными признаками: А и В. Из этой
совокупности извлечена выборка объема
n
и по ней найден выборочный коэффициент
ранговой корреляции Спирмена
.
Требуется проверить нулевую гипотезу
Н0:
г=0
о равенстве нулю генерального коэффициента
ранговой корреляции Спирмена.
Если
нулевая гипотеза принимается, то это
означает, что между признаками А и В нет
значимой ранговой корреляционной связи
(выборочный коэффициент
не значим); в противном случае между
признаками имеется значимая корреляционная
связь (выборочный коэффициент
значим).
Для того, чтобы при уровне значимости проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции г Спирмена при конкурирующей гипотезе Н1: г0, надо вычислить критическую точку
,
где
n
– объем выборки;
–
выборочный коэффициент ранговой
корреляции Спирмена;
– критическая точка двусторонней
критической области, которую находят
по таблице критических точек распределения
Стьюдента (см. приложение 7) с уровнем
значимости
и числом степеней свободы k=n–2.
Если
– нет оснований отвергнуть нулевую
гипотезу. Ранговая корреляционная связь
между качественными признаками не
значима.
Если
– нулевую гипотезу отвергают. Между
качественными признаками существует
значимая ранговая корреляционная связь.
7.2. Элементы дисперсионного анализа
Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.
Мы будем рассматривать однофакторный дисперсионный анализ.
На практике дисперсионный анализ применяют, чтобы установить, оказывает ли на изучаемую величину Х существенное влияние некоторый качественный фактор F, который имеет m уровней F1, F1, …, Fm. Число испытаний одинаково и равно n.
Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на Х; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются значимо. Другими словами, проверяется нулевая гипотеза Н0 о равенстве математических ожиданий.
Для этого находятся:
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
Межгрупповая (факторная)сумма квадратов отклонений
Внутригрупповая (остаточная) сумма квадратов отклонений
Общая (полная) сумма квадратов отклонений |
|
k1=m–1
k2=m(n –1)
k=mn–1 |
|
В
случае однофакторного комплекса условий
средние квадраты
и
являются несмещенными выборочными
оценками одной и той же дисперсии 2.
Таким образом, проверка нулевой гипотезы Н0 сводится к проверке существенности различия и .
Гипотеза
Н0
отвергается, если фактически вычисленное
значение статистики
больше критического F,
k1,
k2,
определенного на уровне значимости
по таблице критических точек распределения
F
Фишера-Снедекора (приложение 8), и
принимается, если F
F,
k1,
k2.
Пример 7.2.1. Произведено 3 испытания на каждом из четырех уровней. Результаты испытаний приведены в таблице:
Номер испытания |
Уровни фактора Fj |
|||
i Fj |
F1 |
F2 |
F3 |
F4 |
1 2 3 |
1 5 6 |
3 4 1 |
6 5 2 |
2 2 4 |
Методом дисперсионного анализа при уровне значимости 0,01 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.
○ В нашем случае имеем m=3, n=4. Заполним таблицу, для этого найдем:
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
Межгрупповая (факторная)сумма квадратов отклонений
Внутригрупповая (остаточная) сумма квадратов отклонений
Общая (полная) сумма квадратов отклонений |
|
k1=2
k2=9
k=11 |
|
Тогда
.
По таблице критических точек распределения F Фишера-Снедекора (Приложение 8) F0,01, 2, 9=8,02.
Поскольку F0,01, 2, 9>F, то H0 принимаем. Следовательно, влияние фактора незначительно.●
1
В таком случае говорят, что
сходится к Θ
по вероятности.
