Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект_АКОБМИ.pdf
Скачиваний:
201
Добавлен:
17.05.2015
Размер:
1.95 Mб
Скачать

1.6Основы дисперсионного анализа

1.6.1Общие положения

Впредыдущей главе была показана методика оценки различий средних арифметических двух выборочных групп наблюдений путем вычисления средней ошибки разности средних и критерия t. Применение этого критерия позволяет выяснить, значима ли статистически разность средних величин, велика ли вероятность проявления такой разности случайным образом. При этом подразумевается, что группы исследуемых признаков совершенно однородны и отличаются только по одному какому-либо признаку или методу воздействия на них. Между тем на практике это условие соблюдается далеко не всегда. На размерах явлений и, следовательно, их средних сказывается влияние многочисленных факторов, как постоянных (планируемых или сознательно выделяемых для исследования), так и случайных (многообразных и неопределенных). Например, больные гипертонической болезнью (однородные по полу, возрасту, стадии и длительности заболевания), помимо болезни, подвергаются воздействию других различных факторов, в результате чего у разных больных наблюдается разная высота кровяного давления.

При изучении явлений, сравнении их друг с другом в поисках сходства и различий необходимо обращать внимание не только на размеры средних величин, но и на разнообразие вариант, на варьирование изучаемых признаков. Исследователь может встретить ряды величин не отличающиеся по центральной тенденции (размер средней арифметической), но различные по степени варьирования, одинаковые по величине разброса вариант, но различные по размерам средней арифметической. Установление значимости различий средних арифметических величин, измерение степени влияния факторов и их градаций на варьирующий (результативный) признак наиболее эффективно достигаются путем применения дисперсионного анализа. Таким образом сущность дисперсионного анализа заключается в определении значимости влияния отдельных факторов и их относительной роли в общей вариации изучаемого признака.

При решении указанных задач методом дисперсионного анализа исполь-

зуются вариация (S) и дисперсия (σ2). Под вариацией понимают величину, представляющую собой сумму квадратов отклонений вариант от средней

S = (x x)2

(1.19)

Под дисперсией понимают величину

S

 

 

σ 2 =

(1.20)

ν

 

 

Знаменатель определяет число степеней свободы. Степени свободы обозначают число вариант, которые могут принимать любые значения без измене-

39

ния их общей суммы. Например, имеются варианты (x): 3, 6, 7, 9, 10; n=5; Σx=35. Какое число вариант может свободно изменить свои значения без изменения общей их суммы? Очевидно, что только 4 т.е. (n-1) варианты могут быть свободно изменены. Значение пятой варианты свободно варьировать не может, так как связано необходимостью обеспечить неизменной сумму Σx=35.

Различают несколько видов вариации и соответствующим им дисперсий. Рассмотрим принципиальную схему вычисления вариации и дисперсий при применении дисперсионного анализа.

Пусть проведены 3 группы исследований. В каждой из них использована одна градация какого-либо фактора, например разный уровень содержания кислорода, неодинаковая доза лекарства и т. п.

_

_

и

_

Обозначим буквами: а, b и с—варианты каждой группы; a,

b

c – их

средние арифметические величины: nа,,пb,nc числа наблюдений в каждой груп-

_

пе; x — среднюю арифметическую для всех вариант (а, b и с) и n—общее число наблюдений.

Общая вариация (S) вариация — сумма квадратов отклонений всех значе-

_

ний и вариант (а, b и с) от их общей средней ( x). На ней сказываются влияния как постоянных так и случайных факторов.

Остаточная (внутригрупповая) вариация Sz представляет собой сумму групповых вариаций:

 

 

S z = ((a a)2

+ (b

 

)2 + (c c)2 )

(1.21)

 

 

b

Эта часть общей вариации отражает влияние случайных факторов.

 

Факториальная (межгрупповая) вариация (Sф) квадрат отклонения группо-

_

_

_

 

 

_

 

 

 

вых средних ( a, b

и c ) от общей средней ( x):

(1.22)

 

 

SФ =(a x)2 + (

 

x)2 + (c x)2

 

 

b

Именно на её размере сказывается влияние изучаемого фактора.

 

Общая (σ2), факториальная (σф2 ) и остаточная (σZ2) дисперсии представляют собой отношение общей, факториальной и остаточной вариации к соответствующему числу степеней свободы ν. Для общей дисперсии v =n 1, где n- число наблюдений. Для факториальной дисперсии vФ = r 1, где r – число

групп. Для остаточной дисперсии vZ =n r .

Общая сумма квадратов отклонений, или полная вариация, равна сумме

отдельных вариаций, т. е. вариации факториальной и остаточной

 

S = Sф +Sz

(1.23)

Общее число степеней свободы, используемых при расчете факториальной

и остаточной дисперсии:

 

v=vф +vZ =nr+r1=n1

(1.24)

Для оценки значимости влияния изучаемого фактора определяется отношение факториальной дисперсии к остаточной дисперсии. Размеры полученно-

40

σ 2

го критерияF = ( Ф ) оцениваются по специальным таблицам. Если эмпириче-

σZ2

ское значение F превышает табличное, то это свидетельствует о существенности влияния изучаемого фактора. Если же критерий F меньше табличного, то вывод о значимости влияния изучаемого фактора не может считаться доказанным. В зависимости от числа учитываемых организованных факторов различают одно-, двух-, трех- и т. д. факторный дисперсионный анализ. Ниже на примерах показана техника расчетов, необходимых при дисперсионном анализе.

1.6.2Методика однофакторного дисперсионного анализа

Втабл. 1.16 представлены результаты определения противоопухолевого действия креатининсульфата серотонина на прививаемую беспородным мышам опухоль (саркома 180). Изучаемый фактор применен в трех разных дозах. Критерием противоопухолевого эффекта являлось снижение среднего веса опухоли (результативный признак) под влиянием различных доз серотонина.

Таблица 1.16 - Результаты определения противоопухолевого действия креатининсульфата серотонина

В таблице представлены необходимые промежуточные данные для последующих расчетов по формулам:

1. Полной вариации

41

2.Факториальной вариации

3.Остаточной вариации

SZ =S SФ =3,982,62=1,36

4.Факториальной дисперсии

5.Остаточной дисперсии

6.Критерия F

Табличные значения F находим по таблице, учитывая, что число степеней свободы для большей дисперсии указано в графах, а для меньшей дисперсии - в

строках: F05 = 3,68 и F01 = 6,36.

Итоговые данные удобно представлять в следующем виде (табл. 1.17).

Таблица 1.17 Сводная таблица однофакторного дисперсионного анализа

Поскольку вычисленное значение критерия F превышает табличные значения, следует заключить, что случайность различий средних значений веса опухолей маловероятна (р<1%). Можно утверждать, что воздействие креатининсульфата серотонина замедляет рост прививаемой опухоли.

Удобство и ценность дисперсионного анализа очевидны. Так, можно оценивать различия в средних величинах и при большем количестве исследуемых групп.

С его помощью можно также определить силу влияния (η2 ) изучаемого фактора, его долю в сумме всех влияний на результативный признак. Эта вели-

42