Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы и модели - Костин В.Н., Тишина Н.А

..pdf
Скачиваний:
61
Добавлен:
24.05.2014
Размер:
995.16 Кб
Скачать

Вследствие того, что

n m

(y

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

n

(y

 

 

 

 

)=0 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

∑ ∑

ji

y ) y

i

y

= ∑

y

i

y

ji

j=1 i=1

 

 

 

i

 

 

 

i=1

 

 

 

j=1

 

 

 

i

 

поскольку

(y ji yi

)= y ji n yi

= y ji n

1 y ji = 0.

n

 

 

n

 

 

n

 

n

 

 

 

 

j=1

j=1

j=1

n

j=1

Суммы SSобщ , SSx , SSε , входящие в выражение (4.10), означают следующее:

SSобщ = n

m (y ji

 

)2

;

(4.11)

 

y

j=1

i=1

 

 

– это общая сумма квадратов отклонений отдельных наблюдений y ji от

общего среднего y . Она характеризует рассеяние наблюдений в результате действия, как фактора случайности ε , так и исследуемого входного фактора х;

SSx = nm (y

i

 

)2

;

(4.12)

 

y

i=1

это сумма квадратов отклонений между средними по уровням yi и

общей средней y . Сумма SSx/n рассеяние средних yi уровней за счет случайных причин (с дисперсией σε2 / n для средних уровней) и исследуемого входного фактора х (с дисперсией σx2 );

SSε = n

m (y ji

 

i )2

;

(4.13)

y

j=1

i=1

 

 

– это сумма квадратов отклонений внутри уровней, то есть сумма квад-

ратов разностей между отдельными наблюдениями y ji и средним yi соответ-

ствующего уровня. Она характеризует остаточное рассеяние случайных погрешностей опытов, то есть их воспроизводимость.

Таким образом, общую сумму квадратов отклонений наблюдаемых

значений выходного параметра от общей средней y мы разложили на две составляющие: SSx – факторную сумму квадратов отклонений и SSε – остаточную сумму квадратов отклонений.

91

ние Fрасч

Зная суммы квадратов SSобщ, SSx , SSε , можно определить соответст-

вующие оценки дисперсий: общую, межуровневую и внутриуровневую

S2общ, S2x , S2ε :

S2общ =

SSобщ

=

SSобщ

 

;

(4.14)

 

 

 

mn 1

 

 

 

N 1

 

 

S 2 x =

SS x

 

 

;

 

 

 

(4.15)

m 1

 

 

 

 

 

 

 

 

 

 

 

 

S

2

ε

=

 

SSε

 

 

 

.

 

(4.16)

 

m(n 1)

 

Оценки S 2 x и S 2ε в литературе достаточно часто называют факторной и остаточной дисперсиями.

Математически строго можно показать, что если влияние входного исследуемого фактора х на выходной параметр Y несущественно, то полученные нами дисперсии (4.14)-(4.16) являются несмещенными оценками генеральной

дисперсии наблюдений σ02 , то есть:

M [S y2 ]= σ02 ; M [Sx2 ]= σ02 ;

M [Sε2 ]=σ02 .

(4.17)

Следовательно, для выяснения влияния фактора Х на выходной пара-

метр Y необходимо сравнить дисперсии S 2 x

и S 2ε . Для того, чтобы влия-

ние фактора было признано значимым, необходимо и достаточно, чтобы оценка дисперсии S 2 x значимо отличалась от S 2 ε . Проверку нуль-гипотезы об однородности этих оценок можно осуществить по критерию Фишера:

Fрасч =

S 2 x

.

(4.18)

S

2

ε

 

 

 

 

Если вычисленное по результатам наблюдений дисперсионное отношепревосходит критическое табличное Fтабл(α, f1, f2 ), найденное по

распределению Фишера для выбранного уровня значимости α и степеней свободы f1 = m 1 числителя и f2 = m(n 1) знаменателя (2.18),

Fрасч. > Fтабл(α, f1, f2 ),

(4.19)

92

то влияние фактора Х следует признать значимым. Если условие (4.19) не выполняется, то есть

Fрасч. Fтабл(α, f1, f2 ),

(4.20)

то влияние фактора Х следует признать незначимым. Так как в рассматриваемых условиях проверяется нулевая гипотеза

H 0 : M [Sx2 ]= M [Sε2 ]=σ02 .

при конкурирующей гипотезе вида

H1 : M [Sx2 ]>σ02 ,

то при расчетах следует пользоваться односторонним F-критерием (приложение Б).

Таким

образом, если выполняется условие (4.19), то дисперсии

S 2 x и S 2ε

значимо отличаются друг от друга, нулевая гипотеза равенства

средних

 

 

H0 : M [y1 ]= M [y2 ]= ... = M [yi ]=... = M [ym ]

должна быть отвергнута и влияние фактора Х признано значимым. В этих условиях по результатам наблюдений (смотреть таблицу 4.1) можно оценить:

– дисперсию воспроизводимости σε2

-

выборочной остаточной дис-

персией

 

 

 

 

 

 

 

 

S

2

 

 

SSε

2

,

 

 

ε

=

 

σε

 

 

m(n 1)

 

то есть

 

 

М[Sε2 ]=σε2

 

 

 

 

 

 

 

 

(4.21)

и определить доверительный интервал для

σε2

по х2-распределению с m(n-1)

степенями свободы;

– дисперсию исследуемого фактора Х по формуле

 

σx2

1

(Sx2

Sε2 ),

(4.22)

n

 

 

 

 

93

– расхождение σ x2 генеральных центров серий, обусловленное влиянием фактора Х. Так как

S 2 = SS x

x m 1 ,

то можно показать, что

 

 

 

 

 

М[S 2 ]=σ 2 +

 

n

m (c

 

 

)2

,

 

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

ε

m

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

1 i=1

 

 

 

 

1

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

ci

 

 

 

 

 

 

 

где

c

среднее значение из генеральных центров распре-

 

 

 

 

m i=1

деления сi,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)2

 

 

 

 

 

М

m 1

 

(Sx2

Sε2 )

=

1

 

m (ci

 

=δc2 .

 

 

 

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

 

mn

 

 

 

 

 

 

m i=1

 

Оценкой величины δc2 служит выборочная характеристика

 

 

 

 

 

 

 

dc2

=

m 1

(Sx2

Sε2 );

(4.23)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

– расхождение Ci i Cg между генеральными центрами любых двух се-

рий.

Так как статистика

 

 

 

 

 

 

 

 

 

t =

n

=

(yi

yg

)

(Ci Cg )

,

(4.24)

2

 

 

Sε

 

 

 

 

 

 

 

 

 

 

следует распределению Стьюдента с числом степеней свободы f2 = m(n 1), то интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sε

 

 

 

 

 

 

 

 

Sε

 

 

 

 

 

 

 

 

 

t

 

 

;

y

 

y

 

t

 

 

 

(4.25)

y

i

y

g

p; m(n1)

i

g

p; m(n1)

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

служит доверительным (1)100 % интервалом для Ci Cg ;

94

– сравнение всех средних при помощи множественного рангового критерия Дункана, попарное сравнение по t-критерию и другие.

При интерпретации результатов ДА необходимо иметь в виду, что очень низкое значение дисперсионного отношения может быть связано с тем, что влияние какого-то важного неконтролируемого в ходе эксперимента не было рандомизировано.

Это может увеличить дисперсию внутри уровней, а дисперсию между уровнями оставить неизменной, что уменьшает дисперсионное отношение. В данном случае результаты проведенных экспериментов уже не будут подчиняться модели (4.8).

При интерпретации результатов ДА для математической модели со случайными уровнями факторов обычно интересуются не проверкой гипотез относительно средних, а оценкой компонент дисперсий. В отличие от модели с фиксированными уровнями выводы по случайной модели распространяются на генеральную совокупность уровней.

4.3 Алгоритм расчета однофакторного дисперсионного анализа

Проведение ДА связано с большими вычислениями, поэтому желательно применение вычислительной техники и упрощающих приемов. Так, перед началом «ручного» счета все исходные данные можно уменьшить (увеличить) на одну и ту же величину – на дисперсиях это не отразится.

Оформив все данные в виде таблицы 4.1 и, используя зависимости (4.6)

– (4.18), алгоритм однофакторного ДА можно представить в виде следующей последовательности вычислений

1 Подсчитывают итоги по столбцам – суммы наблюдений по каждому уровню фактора Х:

 

n

 

 

Yi = y ji .

 

(4.26)

 

j=1

 

 

2 Вычисляют сумму квадратов всех наблюдений:

 

n

m

 

 

Q1 = ∑ ∑y ji

2 .

(4.27)

j=1

i=1

 

 

3 Вычисляют сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

 

 

1

m

 

 

Q2

=

Yi

2 .

(4.28)

 

 

 

n i=1

 

 

95

4 Рассчитывают квадрат общего итога, деленный на число всех наблюдений (корректирующий член):

 

 

1

m

 

2

 

Q3

=

 

Yi

.

(4.29)

 

 

 

m n i=1

 

 

 

5 Определяют сумму квадратов для столбца:

SSx = Q2 Q3 .

(2.30)

6 Определяют общую сумму квадратов:

SSобщ. = Q1 Q3 .

(4.31)

7 Определяют остаточную сумму квадратов для оценки ошибки эксперимента:

SSε = Q1 Q2 .

(4.32)

8 Рассчитывают оценку дисперсии S 2 x :

S

2

x =

SS x

 

 

 

.

(4.33)

 

m 1

9 Рассчитывают оценку дисперсии S 2 ε :

S

2

ε =

SSε

 

 

 

.

(4.34)

 

m(n 1)

10 Оценивается влияние фактора Х по зависимости (4.18) - (4.25). Результаты расчета, как правило, представляются в виде следующей

таблицы дисперсионного анализа.

96

Таблица 4.2 – Однофакторный дисперсионный анализ с равным числом повторений опытов

Компоненты

Число

Сумма

 

 

 

Средний

Математиче-

дисперсии

степеней

квадратов

 

 

 

квадрат

ское ожида-

 

свободы

 

 

 

 

(оценка

ние среднего

 

 

 

 

дисперсии)

квадрата

Междууров-

 

SS x = Q2 Q3

 

 

 

2

 

 

 

SS x

2

2

невая

m-1

S

 

x =

 

 

 

 

 

nσx

+σε

 

 

m 1

 

 

 

 

 

 

 

 

 

 

 

Внутриуров-

m(n-1)

SSε = Q1 Q2

S

2

ε

=

 

 

SSε

σε2

 

 

m(n 1)

 

невая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая

mn-1

SSобщ. = Q1 Q3

S

2

 

 

 

SSобщ

 

 

(полная)

 

y =

 

 

 

 

 

 

mn 1

 

 

 

 

 

 

 

 

 

 

В случае, когда на различных уровнях фактора проводится разное число параллельных опытов, можно, ориентируясь на уровень с меньшим числом, отбросить лишние наблюдения в остальных уровнях. Однако такое отбрасывание нежелательно, так как существенно снизит точность проводимого анализа. Тем более что новая схема вычислений лишь не многим будет отличаться от случая равных столбцов. Пусть на уровне хi проведено ni параллельных наблюдений. Общее число всех наблюдений будет равно

 

m

 

 

N = ni .

 

(4.35)

 

i=1

 

 

Определим:

 

 

 

1 Итоги по столбцам – суммы наблюдений

по каждому уровню фак-

тора хi:

n

 

 

 

 

 

Yi = y ji .

 

(4.36)

 

j=1

 

 

2 Суммы квадратов всех наблюдений:

 

n

m

 

 

Q1 = ∑ ∑y ji

2 .

(4.37)

j=1

i=1

 

 

3 Сумму квадратов итогов по столбцам, деленных на число наблюдений в соответствующем столбце:

m

Y

2

 

 

Q2 =

i

 

.

(4.38)

n

 

i=1

i

 

97

4 Квадрат общего итога, деленный на число всех наблюдений:

 

 

1 m

 

2

 

Q

=

 

Y

.

(4.39)

 

3

 

N i=1

i

 

 

Дальнейшие расчеты проводятся по формулам (4.30) - (4.34). Если оценки дисперсий S 2 x :и S 2 ε : значимо отличаются друг от друга, то диспер-

сию фактора Х можно вычислить по формуле:

 

σ x2

(m 1)N

(S x2 Sε2 ).

(4.40)

m

 

N 2 − ∑ ni

 

 

i =1

 

При этом соотношение для чисел степеней свободы следующее:

 

fSобщ2 . = N 1 = (N m)+ (m 1)= fSε2. + fSx2. .

(4.41)

Задача 4.1.

Пороховой завод изготовил заряды к артиллерийским боеприпасам на четырех однотипных поточных линиях. С каждой поточной линии случайным образом было выбрано и отстрелено в одинаковых условиях по пять боеприпасов. Результаты замеров начальных скоростей полета снарядов V0, м/с, для каждой группы приведены в таблице 4.3.

Таблица 4.3 – Результаты испытаний

Номер опыта

Уровни фактора Х (поточные линии), i=1,m

j=1,n

x1

x2

x3

x4

1

600

570

690

450

2

420

450

570

510

3

510

630

600

450

4

435

450

570

510

5

495

450

600

540

 

 

 

 

 

Стоит задача: выяснить, существенно ли влияние данных поточных линий на величину начальной скорости полета снарядов V0.

Решение.

1 Проверяем предпосылки ДА.

Пусть из априорных данных известно, что результаты наблюдений являются независимыми случайными величинами, имеющие нормальный закон распределения; опыты, проведенные нами, равноточны, а случайные ошибки наблюдений подчиняются нормальному закону. Однородность выборочных дисперсий проверим по критерию Кохрена.

98

– определяем средние по столбцам:

y1

=

1 y j1 = 600 + 420 +510 + 435 + 495 = 492 ;

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

j=1

 

5

 

 

 

 

 

 

 

 

 

2 = 510 ;

 

3 = 606 ;

 

4 = 492 ;

 

 

 

 

 

y

y

y

– определяем оценки дисперсий для каждого столбца:

 

 

 

 

 

 

 

n

(y j

 

)2

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

S y2 =

j=1

 

 

 

=

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

1

 

(600

492)2

+ (420

492)2 + (510 492)2 +

=5107 ;

 

 

 

 

 

 

 

492)2

 

5

1

 

 

 

 

+(435 492)2 + (495

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

= 7200 ;

2

= 2430 ;

2

S y2

S y3

S y 4

=1620 ;

– определяем расчетное значение критерия Кохрена:

 

2

max

 

7200

 

Gрасч =

S yi

=

= 0.4402 ;

m

 

5107 + 7200 + 2430 +1620

 

S y2i

 

 

 

i=1

 

 

 

 

– определяем табличное значение G-критерия по таблице приложения

4:

Gтабл. (α = 0,05; n = 4; f = 5 1 = 4)= 0,6287.

Так как Gрасч<Gтабл., то оценки дисперсий однородны и можно приступить к проведению ДА.

2 Подсчитываем итоги по столбцам:

n

Yi = y ji , j=1

Y1 = 600 +420 +510 +435 +495 = 2460 ;

Y2 = 2550;

Y3 = 3030 ;

99

Y4 = 2460.

3 Вычисляем сумму квадратов всех наблюдений:

n

m

 

Q1 = ∑ ∑y ji

2 ;

j=1

i=1

 

Q1 = 6002 + 4202 +... + 5402 = 5622750.

4 Вычисляем сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

Q2 = 1 m Yi 2 ; n i=1

Q2 = 15 (24602 + 25502 +30302 + 24602 )= 5557320.

5 Рассчитаем квадрат общего итога, деленный на число всех наблю-

дений:

 

 

1

m

 

2

Q3

=

 

Yi

;

 

 

 

mn i=1

 

 

Q3 = 415 (2460 + 2550 + 3030 + 2460)2 = 5512500.

6Определяем сумму квадратов для столбца:

SSx = Q2 Q3 ;

SSx = 5557320 5512500 = 44820.

7Определяем общую сумму квадратов:

SSобщ. = Q1 Q3 ;

SSобщ. = 5622750 5512500 =110250 .

8 Определяем остаточную сумму квадратов для оценки ошибки эксперимента:

SSε = Q1 Q2 ;

100

Соседние файлы в предмете Экономика