- •Курсовая работа
- •2. Теоретическая часть.
- •1.Основные задачи математической статистики.
- •1.1. 3Адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным.
- •1.2. Задача проверки правдоподобия гипотез.
- •1.3. Задача нахождения неизвестных параметров распределения
- •2. Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •3. Однофакторный дисперсионный анализ.
- •Границы доверительного интервала для Lk имеют вид
- •3. Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2. Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3.Доверительные интервалы.
- •4. Вычисление s21 s22 с помощью однофакторного дисперсионного анализа и проверка гипотезы h0
3. Однофакторный дисперсионный анализ.
Пусть результаты наблюдений составляют l независимых выборок (групп), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m1 , m2 , ..... , ml и равные дисперсии 2. Проверяется гипотеза о равенстве средних H0 m1= m2 = ..... =ml. На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку (гипотеза H0) . При l = 2 для проверки гипотезы H0 используется известные критерии значимости. Если l > 2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.
Пусть
xik
обозначает i–й
элемент k–й
выборки , i
= 1,2,......,n
, k
= 1,2,......,l
,
k-выборочное
среднее k–й
выборки, т.е.
k=(1/nk)
xik
=
(1/n) x ..k
,
k*- общее выборочное среднее, т.е.
=(1/n)
xik
= (1/n)
x
. . ,
где n – общее число наблюдений, n= nk
Общая сумма квадратов отклонений наблюдений от общего среднего x* может быть представлена так :
(
xik
–
)2=
nk
(
k
–
)2+
( xik
–
k)2
(17)
Это основное тождество дисперсионного анализа. Запишем его в виде
Q=Q1+Q2 (18)
Где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q1 – сумма квадратов отклонений выборочных средних x*k от общего среднего x* (между группами), Q2-сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).
Тождество (1) легко проверяется , если воспользоваться очевидным равенством
(
xik
–
)=
[(
k
–
)+
( xik
–
k)]
и учесть, что
(
xik
–
k)
(
k
–
)=0
в
силу определения средних
k
и
![]()
Если верна гипотеза H0:m1=m2= .....=ml, то статистикиQ1/2иQ2/2независимы и имеют распределение2сl-1 иn-lстепенями свободы. Следовательно, статистикиS21=Q1/(l-1) иS22=Q2/(n-l) являются несмещенными оценками неизвестной дисперсии2. ОценкаS21 характеризует рассеяние групповых средних, а оценкаS22–рассеяние внутри групп, которое обусловлено случайными вариациями результатов наблюдений. Значительное превышение величиныS21 над значением величиныS22 можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с l-1 иn-l степенями свободы, т.е.
S21/S22= Q1(n-l)/(l-1)Q2 = F(l-1,n-l) (19)
Статистика
используется для проверки гипотезы H0:m1=
m2
= .....=
ml.
Гипотеза H0
не противоречит результатам наблюдений,
если выборочное значение Fв
статистики меньше квантили F1-(l-1,n-l)
, т.е. если Fв<
F1-(l-1,n-l).
В этом случае
иQ2/(n-l)
являются несмещенными оценками параметров
m
и 2.Если Fв<
F1-(l-1,n-l),
то гипотеза H0
отклоняется и следует считать, что среди
средних m1,
m2
, .....,
ml
имеется хотя бы два не равных друг другу.
Линейные контрасты
Если гипотеза о равенстве средних отклоняется, то требуется определить, какие именно группы имеют значимое различие средних. Для этих целей используется метод линейных контрастов. Линейный контраст Lk определяется как линейная комбинация
Lk=ckmk
где ck k = 1,2,......,l- константы, однозначно определяемые из формулировки проверяемых гипотез, причем ck = 0 . Оценка Lk равна Lk* =ckx*k, а оценка дисперсии Lk* равна
S2LK = D[Lk*] = *2 (c2k/nk) = Q2/(n-l) (c2k/nk)
