
3.2. Статистическая оценка параметров распределения
Состоятельные и
несмещенные оценки основных параметров
распределения случайной величины Х
(илиY) математического
ожидания mх (или mY)
и дисперсии
(или
)
могут быть получены по формулам:
; (3.1)
,
(3.2)
где n — число, определяющее размер выборки.
Оценку коэффициента корреляции между величинами Х и Y определяют по формуле:
(3.3)
Коэффициент корреляции показывает степень связи между переменными величинами. Если r=0, то переменные не коррелируют, а при r=±1 между переменными имеется связь.
Значения
и
рассчитываются
по формуле (3.1), а
и
—
по формуле (3.2).
Так как оценки (3.1) — (3.3) определяют по выборке конечного размера, возникает вопрос об их статистической достоверности и точности.
Обозначим через
оценку интересующего нас параметра.
Тогда задача определения достоверности
и точности оценки сводится к определению
такого интервала (q1,
2),
включающего параметр кр,
что с вероятностью 1-p (р
– уровень значимости, достаточно малая
величина, равная 0,1; 0,05; 0,01) можно
утверждать, что неизвестное истинное
значение параметра находится в этом
интервале. Интервал (1,
2)
называют доверительным интервалом,
а вероятность 1-р — доверительной
вероятностью.
Рассмотрим случай, когда величина Х (и Y) имеет нормальный закон распределения с плотностью вероятности
.
Здесь и далее во всех формулах величины Х можно заменить на Y.
Доверительный интервал для математического ожидания ( -ep, +ep), включающий mх с вероятностью 1-р, находят из условия
P[ -ep<mx< +ep]=1-p,
которое можно представить в виде
P[| -mx|<ep]=1-p. (3.4)
Введем параметр
t=[(
-mx)/
]×
,
имеющий t-распределение
Стьюдента с f = n-1 степенями свободы.
Тогда равенство (3.4) перепишется в виде:
P[
|
-mx|<t(p,f)
]=1-p,
где t(p,f) определяют по таблице распределения Стьюдента (табл. 3.1) при вероятности р и числе степеней свободы f = n-1. Доверительный интервал для mx, соответствующий доверительной вероятности 1-р, есть
[ -t(p,f) , +t(p,f) ]. (3.5)
Чтобы определить
доверительный интервал для генеральной
дисперсии, необходимо найти границы
интервала
и
,
удовлетворяющие равенству
P[
1-p. (3.6)
Для нормально распределенного Х известен закон распределения величины
(3.7)
который называют χ2-распределением Пирсона с f = n-1 степенями свободы. После подстановки соотношения (3.7) в (3.6) при условии, что
P[
<
]=P[
>
]=p/2,
Получим
[χ2
(p/2,f)≤
≤χ2(1-p/2,f)]=1-p.
Величину
χ2(1-p/2,f)=(n-1)
/
находят по таблице 3.2 χ2 распределения
при вероятности 1-р/2 и числе степеней
свободы f = n-1, а χ2(p/2,f)=(n-1)
/
определяют по таблице 3.2 при вероятности
р/2 и числе степеней свободы f
= n-1. Следовательно,
доверительный интервал для дисперсии
,
соответствующий доверительной
вероятности, есть
.
(3.8)
Величина
находится аналогично
.
3.3. Проверка статистических гипотез
Статистической гипотезой называют любое предположение о свойствах генеральной совокупности значений случайной величины. Выдвигаемые гипотезы можно подразделить на исходную или нуль-гипотезу Н0 и конкурирующие (альтернативные) Н1 и Н2. Понятие статистической гипотезы означает предположение о виде распределения случайной величины или о некотором параметре ее распределения. Проверка гипотезы заключается в сопоставлении определенного статистического показателя (уровня значимости), вычисленного по данной выборке, с уровнем значимости, найденным теоретически при условии, что проверяемая гипотеза верна.
Этот уровень соответствует вероятности попадания значения статистического показателя в так называемую критическую область, ограниченную критическими значениями определяемых параметров. Если значение параметра, вычисленное по данной выборке, попадает в критическую область, гипотеза отвергается. Если значение параметра не попадает в критическую область, данная выборка не дает оснований для того, чтобы проверяемая гипотеза была отвергнута.
При проверке гипотезы о том, что mx=C, в качестве критерия используют величину
t=|
-C|
. (3.9)
Для my=C в (3.9) все величины Х надо заменить на величины Y:
t=
,
(3.9a)
Эта величина при
условии, что гипотеза верна, имеет
t-распределение Стьюдента с f=n-1 степенями
свободы, где n — объем выборки при
определении
(или
),
(или
).
Если вычисленное по соотношению (3.9;
3.9a) значение t по абсолютной
величине не превышает критического
значения tкр = t (p,f), найденного по
таблице t-распределения при уровне
значимости р и числе степеней свободы
f=n-1 (т. е. | t
| < tкр), то гипотеза о том, что
mx=C (или my=C),
принимается; в противном случае она
отвергается.
Проверку гипотезы о равенстве двух математических ожиданий mx = mу, вычисленных по двум выборкам случайных величин Х и Y объемами n1 и n2, проводят по критерию
t=|
-
|/
, (3.10)
где
Критерий t имеет
t-распределение Стьюдента с числом
степеней свободы f=n1+n2-2
(табл. 3.1). Значения
и
определяют
по выборкам n1 и n2. Проверку
гипотезы выполняют также, как в
предыдущем случае, т. е.
при | t | < tкр гипотеза принимается,
а при | t | > tкр отвергается.
Проверку гипотезы о равенстве дисперсий
двух случайных величин Х и Y, оценки
которых
и
определены по двум выборкам объема n1
и n2, соответственно, проводят
с использованием критерия
, (3.11)
который
имеет распределение Фишера со степенями
свободы f1=n1-1 для числителя
и f2=n2-1 для знаменателя.
Полученное по критерию (3.11) значение
сравнивают с критическим значением
Fкр= F(р, f1, f2), определяемым
по таблице F-распределения (табл. 3.3) при
уровне значимости р и степенях свободы
f1 для числителя и f2 для
знаменателя. Если F<Fкр, нет
оснований для того, чтобы нулевая
гипотеза была отвергнута; в противном
случае принимаем, что на генеральной
совокупности
.
При проверке гипотезы об отсутствии корреляции между двумя случайными величинами Х и Y используют отношение:
(3.12)
где
—
оценка коэффициента корреляции, найденная
по выборке объемом n;
=(1-
)/(n-2).
Величина t имеет
t-распределение Стьюдента с f=n-2 степенями
свободы. Полученное по соотношению
(3.12) значение t сравнивают с критическим
tкр= t(p,f), которое находят по таблице
t-распределения (табл. 3.1) при уровне
значимости р и степени свободы f. Если
| t | < tкр, нет оснований для
того, чтобы гипотеза об отсутствии
корреляции на генеральной совокупности
была отвергнута. В случае
принимаем, что между величинами Х и Y
существует корреляция.
КОМПЬЮТЕРНЫЙ ЛАБОРАТОРНЫЙ ПРАКТИКУМ
Цель работы: изучение методов оценки параметров распределения (математического ожидания, дисперсии, коэффициентов корреляции) и овладение методикой использования статистических критериев при проверке статистических гипотез.
Задание: Ознакомиться с методикой проведения эксперимента по получению двух выборок случайных величин на условном химико-технологическом объекте. Выбрать свой вариант двух выборок из базы данных ПК (VarLD213. Документ MS WORD), провести статистическую оценку параметров распределения и проверить правильность гипотез. Затем уточнить результаты расчетов с помощью ПК по программам HYPOT. BAS или Проверка гипотез. Mcd — «Статистическая оценка параметров и проверка гипотез».
Порядок выполнения задания
1. Вычислить оценки математических ожиданий и по формуле (3.1), дисперсии и по формуле (3.2) и коэффициент корреляции по формуле (3.3).
2. Для заданной доверительной вероятности 1– р определить по таблице t-распределение Стьюдента (табл. 3.1), значение (p,f) и найти доверительные интервалы для mx и mу по формуле (3.5).
3. По
таблице χ2-распределения
(табл. 3.2) определить значения χ2(p/2,f),
χ2(1- p/2,f)
и найти доверительные интервалы для
4. Для заданных значений Сx и Су проверить гипотезы о равенстве mx=Cx, mу=Cу по формулам (3.9; 3.9a).
Рассчитать значение критерия t по формуле (3.10) и проверить гипотезу о равенстве двух математических ожиданий mx = mу, вычисленных по двум выборкам случайных величин Х и Y объемами n1 и n2,
5. Рассчитать
значение критерия F по формуле (3.11) и
проверить гипотезу о равенстве дисперсий
.
6. Рассчитать значение критерия t по формуле (3.12) и проверить гипотезу об отсутствии корреляции между Х и Y.
Таблица 3.1