- •Глава 1 Случайные события
- •1.1. Вводные понятия
- •1.2. Алгебра событий
- •1.4. Схема геометрической вероятности
- •1.5. Условные вероятности. Независимость событий
- •1.6. Правила вычисления вероятностей сложных событий
- •1.8. Обобщения схемы Бернулли
- •Глава 2 Случайные величины
- •2.1. Основные понятия, связанные со случайной величиной
- •2.3. Закон распределения случайной величины дискретного типа
- •2.5. Случайные величины непрерывного типа и их законы распределения
- •2.7. Нормальное распределение
- •Глава 3Случайные векторы
- •3.1. Основные понятия. Свойства функции распределения
- •3.2. Случайные векторы дискретного типа и их законы распределения
- •3.4. Числовые характеристики случайного вектора дискретного типа
- •3.5. Случайные векторы непрерывного типа и их законы распределения
- •Глава 4. Функции от случайных величин
- •4.1. Теоремы о математическом ожидании функций
- •4.3. Характеристическая функция и ее свойства
- •4.4. Законы распределения функций
- •Глава 5 Законы больших чисел и предельные теоремы теории вероятностей
- •5.1. Законы больших чисел
- •5.2. Центральная предельная теорема
- •5.3. Следствия ЦПТ для схемы Бернулли
- •Глава 6. Статистическое оценивание
- •6.1. Первичная обработка выборки
- •6.2. Точечное оценивание неизвестных характеристик генерального
- •6.4. Интервальное оценивание
- •Глава 7.Проверка статистических гипотез
- •7.1. Общие понятия. Методика проверки
- •7.2. Выбор критической области
- •7.4. Проверка гипотез о законе распределения
- •Глава 8.Корреляционный анализ
- •Глава 9Регрессионный анализ
- •Глава 10.Однофакторный дисперсионный анализ
- •Литература
|
|
n |
∑ |
|
где α*r |
,s = |
1 |
n |
xkr yks |
|
k =1 |
|||
|
|
|
|
a α* |
+ b x = α* |
; |
|
|
|
2,0 |
1,1 |
|
(9.2) |
|
|
|
|
|
a x + b = y, |
|
|
||
|
|
|
|
|
- начальный выборочный момент порядка r + s;
xи y - средние значения соответствующих переменных. Решение системы (9.2), как нетрудно убедиться, имеет вид
~ |
|
SX ,Y |
* |
S |
|
~ |
* |
S |
|
|
|
Y |
|
|
Y |
|
|||
a |
= |
|
= ρ |
|
, |
b |
= y − x ρ |
|
, |
SX |
SX |
SX |
где ρ* - выборочный коэффициент корреляции, SX и SY - выборочные
среднеквадратические отклонения, определенные в главе 8. Уравнение линейной регрессии приобретает вид
y(x) = y + ρ* SY (x − x).
S X
Заметим, что полученное уравнение аналогично теоретическому уравнению регрессии, если заменить все входящие в него вероятностные моменты соответствующими выборочными оценками в соответствии с методом подстановки. 
Глава 10.Однофакторный дисперсионный анализ
Пусть имеется l независимых нормальных совокупностей X1, X2,...Xl с
одной и той же, хотя и неизвестной дисперсией σ2 . Математические ожидания mi = M[Xi ] также неизвестны, но имеются основания предполагать, что они равны. Требуется проверить основную гипотезу H0 : m1 = m2 = ... = ml против альтернативы H1 = H0 . Для этого из каждой совокупности (подпопуляции) Xi берется выборка объемом ni :
xi1, xi2 ,..., xini , i =1,2,..., l.
Формулируетсяследующаялинейнаямодельдисперсионногоанализа:
xij = mi +εij |
- j-е наблюдение из i-й подпопуляции, |
mi = m0 + αi |
- среднее i-й подпопуляции, |
150
|
n |
∑ |
|
|
m = |
1 |
l |
n |
m - генеральное(тотальное) среднеевсейпопуляцииX, |
|
|
|||
0 |
|
i=1 |
i |
i |
|
|
|
|
|
αi |
|
|
|
- дифференциальный эффект, определяющий |
различие средних.
При интерпретации модели дисперсионного анализа считается, что существует некоторый фактор A, имеющий l уровней, воздействие которого приводит к расщеплению всей популяции X на l подпопуляций Xi , i =1,2,...,l . Например, если измерения проводятся на l различных
приборах, то можно исследовать влияние фактора "прибор" на результаты измерений. Термин "дисперсионный анализ" был первоначально предложен Р.Фишером (1925) для обработки результатов агрономических опытов, целью которых было выявление условий, позволяющих максимизировать урожай. Современные приложения дисперсионного анализа охватывают широкий круг задач техники, экономики, социологии, биологии, медицины и трактуются в терминах статистической теории проверки гипотез.
Заметим, что если дифференциальные эффекты αi малы, то от-
клонение средних значений отдельных подпопуляций от тотального среднего можно рассматривать как случайное отклонение и гипотеза H0 с большой вероятностью будет принята. Если l = 2 , то получается
уже известная нам задача проверки гипотезы о равенстве средних двух независимыхнормальных совокупностей, рассмотреннаяв§ 7.3.
Напомним, что для проверки этой гипотезы использовалась стъюдентова статистика W, основанная на нормированной разности выборочных средних. Фишером доказано, что при l > 2 подходящей статистикой для проверки указанной гипотезы является фишеровское отношение дисперсий, сконструированных специальным образом.
Обозначим выборочную среднюю i-й выборки как
|
1 |
n |
|
|
|
xi• = |
∑i |
xik , |
(10.1) |
||
n |
|||||
|
i k =1 |
|
|
||
общее среднее объединенной выборки
|
1 |
|
l ni |
|
|
x = |
|
∑∑ |
x ; |
||
n |
|||||
|
|
ik |
|||
|
|
|
i=1 k =1 |
||
|
|
|
|
объем объединенной выборки
151
l
n= ∑ni .
i=1
Легко видеть, что
|
1 |
l |
1 |
ni |
1 |
l |
|
|
x = |
∑ni ( |
∑xij ) = |
∑ni xi• , |
(10.2) |
||||
n |
n |
n |
||||||
|
|
i=1 |
i |
j=1 |
|
i=1 |
|
т.е. тотальное среднее равно среднему арифметическому внутригрупповых средних.
l |
ni |
|
|
|
|
|
|
|
Положим Q = ∑∑(xik − x)2 - сумма квадратов отклонений резуль- |
||||||||
i=1 k =1 |
|
|
|
|
|
|
|
|
|
~ |
2 |
|
|
Q |
|
||
татов наблюдений от общего среднего. Очевидно, что σ |
|
= |
|
|
|
|
- несме- |
|
|
n −1 |
|||||||
щенная оценка неизвестной дисперсии σ2 и, кроме того, |
|
|
|
являются |
||||
|
x |
|||||||
|
|
|
|
|
i• |
|
||
несмещенными и состоятельными оценками математических ожиданий mi .
Если гипотеза H0 верна, то xi• не должны сильно отличаться от
общего среднего x , но для точного решения задачи нужна подходящая статистика. Идеяеепостроенияосновананаразбиениисуммыквадратов:
Q = QB +QW ,
где
QB = ∑l |
ni (xi• − x2 )2 |
- |
(10.3) |
i=1 |
|
|
|
сумма квадратов отклонений "между группами"; |
|
||
l |
ni |
|
|
QW = ∑∑(xik − xi•)2 |
- |
(10.4) |
|
i=1 k =1
сумма квадратов отклонений "внутри групп".
Покажем, как получается это разбиение. Преобразуем разность
xik − x = (xik − xi• )+ (xi• − x ). Возведем в квадрат (xik − x)2 = (xi• − x)2 + + (xik − xi• )2 + 2(xik − xi•)(xi• − x ). Далее обе части равенства суммиру-
ем сначала по k от 1 до ni , затем по i от 1 до l. Учтем, что
152
n |
|
|
n |
|
∑i |
(xik − xi•)= ∑i |
xik −ni xi• = 0 |
||
k =1 |
|
k =1 |
|
|
согласно (10.1). |
|
|
|
|
Поэтому |
|
|
|
|
l |
|
l |
ni |
|
Q = ∑ni |
(xi• − x)2 +∑∑(xik − xi•)2 = QB +QW . |
|||
i=1 |
|
i=1 k =1 |
||
Выражения для сумм (10.3) и (10.4) можно преобразовать к виду, более удобному для вычислений, используя определения (10.1) и (10.2):
|
|
|
l |
|
l |
|
|
|
|
|
QB = ∑ni (xi• − x)2 = ∑ni xi2• −n x2 , |
|
|||||
|
|
|
i=1 |
i=1 |
|
|
|
|
|
|
l |
ni |
l |
ni |
l |
|
|
|
|
QW = ∑∑(xik − xi•)2 = |
∑∑xik2 − |
∑ni xi2• . |
||||
|
|
i=1 k =1 |
i=1 k =1 |
i=1 |
|
|
||
Теорема 10.1. |
Если X1, X 2 ,..., X l |
независимы |
в |
совокупности, |
||||
Xi ~ N (mi ,σ2 ) и справедлива гипотеза |
H0 , то QB и |
QW |
независимы, |
|||||
причем Q |
B |
распределенапозакону χ2 |
(l −1) , а Q |
- позакону χ2(n −l) . |
||||
|
|
|
|
W |
|
|
|
|
Так как QB и QW - квадратичные формы, составленные из не-
зависимых нормальных величин, то результат получается на основании теоремы Пирсона (см. также [5], с. 106, теоремы 6, 7). 
Из этой теоремы и теоремы Фишера следует, что статистика
F = lQ−B1 : nQ−Wl = SB2 SW2
распределена по закону Фишера Fi(l −1, n −l).
Нетрудно убедиться, что F является подходящей статистикой для проверки гипотезы H0 . Действительно, если гипотеза H0 верна, то
величины
SB2 = lQ−B1 и SW2 = nQ−Wl
являются независимыми несмещенными оценками одного и того же
параметра σ2 , поэтому SB2 ≈ SW2 , что приводит к событию {Fвыб G1−α}. Если же верна гипотеза H1 , то разброс между группами
153
