ivanter2000_vved_v_kolich_biol
.pdf152
результативного признака (табл. 7.7).
Таблица 7.7 Дисперсионный комплекс для трех градаций без повторений
|
А1 |
А2 |
А3 |
В1 |
x11 |
x12 |
x13 |
В2 |
x21 |
x22 |
x23 |
В3 |
x31 |
x32 |
x33 |
Комплексы без повторений в градациях упрощают не только алгоритм обработки, но, к сожалению, и результаты. Сумма квадратов разлагается только на следующие компоненты:
Собщ. = СA + СB + Состат.,
эффект сочетанного действия становится неотличим от случайного
варьирования (Состат. = СAB + Сслуч.).
Техника расчетов
Рассмотрим конкретный пример – испытания стимулятора многоплодия при разной полноценности рационов. Полноценность рациона (первый фактор) представлена двумя градациями: A1– рацион с недостатком минеральных веществ, А2 – рацион, полностью сбалансированный по всем питательным веществам, включая и минеральные. Стимулятор (второй фактор) был испытан в трех дозах: В1 – одинарная, В2 – двойная, В3 – тройная. Результативный признак – плодовитость самок, измерявшаяся числом детенышей в помете. Для каждого сочетания градаций рациона и стимулятора были подобраны три одновозрастные самки.
Комбинативная таблица двухфакторного равномерного дисперсионного комплекса с трехкратной повторностью (ni = 3) включает две градации по фактору А и три градации по фактору В (табл. 7.8). Варианты размещаются по градациям, определяется объем градации, вычисляются суммы вариант, частные средние, затем вспомогательные величины (Н1, Н2, Н3, НА, НВ) и суммы квадратов отклонений (дисперсий) по рабочим формулам. В завершение всего заполняют таблицу дисперсионного анализа (табл. 7.9), находят показатель достоверности влияния Фишера и, сопоставляя его с табличным для соответствующих степеней свободы и принятого
|
|
|
|
|
|
|
|
|
|
153 |
|
уровня значимости, делают статистический вывод. |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
Таблица 7.8 |
||
|
|
|
A1 |
|
А2 |
|
|
|
Для |
B |
|
|
|
|
x |
x2 |
x |
x2 |
Σ |
MB |
ΣΣx²/n |
Σ(Σx²/n) |
|
|
В1 |
|
5 |
25 |
1 |
1 |
|
|
|
|
|
|
|
|
6 |
36 |
4 |
16 |
|
|
|
|
|
|
|
|
7 |
49 |
1 |
1 |
|
|
|
|
|
|
|
Σx² |
|
110 |
|
18 |
ΣΣx² = 128 |
|
|
|
|
|
|
Σx |
18 |
|
6 |
|
ΣΣx = 24 |
4 |
96 |
|
|
|
|
n |
3 |
|
3 |
|
nB1 = 6 |
|
|
|
|
|
|
Σx²/n |
108 |
|
12 |
|
Σ(Σx²/n)= 120 |
|
|
|
|
|
В2 |
|
4 |
16 |
10 |
100 |
|
|
|
|
|
|
|
|
3 |
9 |
9 |
81 |
|
|
|
|
|
|
|
|
5 |
25 |
11 |
121 |
|
|
|
HB = |
|
|
|
Σx² |
|
50 |
|
302 |
ΣΣx² = 352 |
|
|
Σ(Σx²/n) |
|
|
|
Σx |
12 |
|
30 |
|
ΣΣx = 42 |
7 |
294 |
= 486 |
|
|
|
n |
3 |
|
3 |
|
nB2 = 6 |
|
|
|
|
|
|
Σx²/n |
48 |
|
300 |
|
Σ(Σx²/n)= 348 |
|
|
|
|
|
В3 |
|
2 |
4 |
7 |
49 |
|
|
|
|
|
|
|
|
3 |
9 |
4 |
16 |
|
|
|
|
|
|
|
|
1 |
1 |
7 |
49 |
|
|
|
|
|
|
|
Σx² |
|
14 |
|
114 |
ΣΣx² = 128 |
|
|
|
|
|
|
Σx |
6 |
|
18 |
|
ΣΣx = 24 |
4 |
96 |
|
|
|
|
n |
3 |
|
3 |
|
nB3 = 6 |
|
|
|
|
|
|
Σx²/n |
12 |
|
108 |
|
Σ(Σx²/n)=120 |
|
|
|
|
|
|
ΣΣx² |
|
174 |
|
434 |
H1 = ΣΣΣx² = 608 |
|
|
|
|
|
ΣΣ |
ΣΣx |
36 |
|
54 |
|
ΣΣΣx = 90 |
H2 = (ΣΣΣx)²/N = 450 |
|
||
|
|
nA = Σn |
9 |
|
9 |
|
N = ΣΣn = 18 |
|
|
|
|
|
|
Σx²/n |
168 |
|
420 |
|
H3 = ΣΣ(Σx²/n) = 588 |
|
|
||
|
|
MA = |
2 |
|
6 |
|
c – число градаций фактора А |
|
|||
|
|
ΣΣx/n |
|
|
|
|
(столбцы) |
|
|
||
|
Для |
Σx²/n |
144 |
|
324 |
|
r – число градаций фактора В |
|
|||
|
|
|
|
|
|
|
|
(ряды) |
|
|
|
|
A |
HA = Σ(Σx²/n) = 468 |
|
|
|
|
|
|
|
154
Собщ. = H1–H2 = 608–450 = 158
Сслуч. = H1–H3 = 608–588 = 20
Cфакт. = СA+B+AB = H3–H2 = 588–450 = 138
СA = HA–H2 = 468–450 = 18
СB = HB–H2 = 486–450 = 36
СAB = Cфакт.–СA–СB = 138–18–36 = 84
В нашем примере все факториальные влияния оказались достоверными с доверительной вероятностью Р>0.95. Это позволяет сделать определенные выводы относительно действия стимулятора на плодовитость самок. Влияние каждого фактора в отдельности (качества рациона и дозы стимулятора) и их суммарного эффекта достаточно существенно, но особенно результативно действие стимулятора в сочетании с полноценным рационом (величина η²АВ выше, чем η²А и η²В). Более того, при недостатке в корме минеральных веществ двукратные и трехкратные дозы стимулятора могут даже снизить плодовитость животных.
|
|
|
|
|
Таблица 7.9 |
|
|
Суммы |
Сила |
Степени |
Дис- |
Критерий, |
|
Составляющ |
квадра |
влиян |
пер- |
|
||
свободы, |
F |
|
||||
ие дисперсии |
тов, |
ия, |
сии, |
|
||
df |
(F(α,dfi,dfсл.)) |
|
||||
|
С |
η² (%) |
S² |
|
||
|
|
|
|
|||
Фактор А |
18 |
11 |
c–1 = 1 |
18 |
10.8 (4.7) |
|
Фактор В |
36 |
23 |
r–1 = 2 |
18 |
10.8 (3.9) |
|
Взаимодейст |
84 |
53 |
dfA∙ dfB = 2 |
42 |
25.2 (3.9) |
|
вие АВ |
|
|||||
|
|
|
|
|
|
|
Факториальн |
138 |
87 |
c∙r–1 = 5 |
27.6 |
16.5 (3.1) |
|
ая (всего) |
|
|||||
|
|
|
|
|
|
|
Случайная |
20 |
13 |
N–c∙r = 12 |
1.67 |
|
|
Общая |
158 |
100 |
N–1 = 17 |
|
|
|
Таблица двухфакторного дисперсионного анализа имеет ту же структуру, что и таблица для однофакторного анализа, только факториальная дисперсия разложена на три компоненты (для факторов А, В и их взаимодействия). Для каждой из них требуется вычислить число степеней свободы с учетом числа градаций фактора А (c, количество столбцов) и числа градаций фактора В (r, количество
155
рядов), значения дисперсий, а также критерий Фишера. Поскольку каждому из расчетных значений критерия соответствует свое число степеней свободы, табличные значения окажутся разными.
Дисперсионный анализ в среде Excel
Алгоритм двухфакторного дисперсионного анализа, естественно, требует более сложных вычислительных операций, чем однофакторный, но все они заложены в программе Excel "Двухфакторный дисперсионный анализ с повторениями" (только для равномерных комплексов!), который вызывается командой меню Сервис/ Анализ данных …. Исходные данные следует расположить на листе Excel по схеме 1 (табл. 7.6).
В пункте макроса "Число строк для выборки" следует поставить объем выборки в одной градации, n; для нашего примера n = 3. Результаты расчетов (рис. 7.3) помимо общей статистической обработки для каждой градации содержат дисперсионную таблицу, почти идентичную приведенной выше (табл. 7.9). Отличие касается отсутствия строки для учета общей факториальной суммы квадратов (Cфакт.) и дисперсии (S²факт.), а также добавления новых столбцов – табличного значения уровня значимости для рассчитанного критерия F Фишера; табличное значение критерия также приведено для уровня значимости α = 0.05.
В среде пакета Excel есть возможность провести и
156
"Двухфакторный дисперсионный анализ без повторений", который вызывается командой меню Сервис/ Анализ данных …. Как отмечалось выше, эта схема организации данных не позволяет разделить случайное варьирование и взаимодействие факторов. Например, если в качестве исходных данных взять только первые значения из предыдущего набора (табл. 7.8), дисперсионный анализ без повторений даст следующие результаты (рис. 7.4).
Рис. 7.3. Двухфакторный дисперсионный анализ на листе Excel
Как видно из таблицы анализа, изменчивость, обусловленная взаимодействием факторов, объединена со случайной в строке "Погрешность".
Рассмотренные схемы дисперсионного анализа принципиально соответствуют и более сложным задачам, в частности, многофакторному дисперсионному анализу. Поскольку статистическая обработка многофакторных (особенно неравномерных) комплексов требует значительного увеличения расчетных работ, для таких задач мы рекомендуем использовать не возможности Excel, но специализированные пакеты программ ЭВМ, например, StatGraphics.
157
Рис. 7.4. Двухфакторный дисперсионный анализ данных без повторений на листе Excel
Дисперсионный анализ в среде StatGraphics
Рассмотрим использование пакета StatGraphics для проведения двухфакторного дисперсионного анализа по тем же данным. Исходные данные для обработки с помощью пакета StatGraphics лучше всего подготавливать на листе Excel, а затем импортировать в StatGraphics. Среда Excel более "дружелюбна" и "гибка", допускает операции автозаполнения и к тому же при импорте названия переменных назначаются автоматически (см. ниже). Пакет StatGraphics (версия 2.1) разработан для ранних версий Windows, поэтому импорт данных возможен только в старых форматах файлов типа *.dbf (для dBase II, III) или *.xls. (для MS Excel 4.0). Общий порядок операций по
158
обработке данных таков:
–подготовка данных в среде Excel,
–экспорт данных в файле типа *.xls. для MS Excel 4.0,
–импорт данных в среду StatGraphics,
–проведение расчетов.
Подготовим данные из табл. 7.8 для двухфакторного дисперсионного анализа в среде Excel.
Чтобы |
StatGraphics |
мог |
||
распознать градации факторов, при |
||||
которых |
получены |
значения |
||
результативного |
признака |
Е |
||
(плодовитость), нужно ввести коды |
||||
для доз обоих факторов, причем в |
||||
форме числовых переменных. Так, |
||||
первые 9 |
значений |
плодовитости |
||
получены при действии дозы 1 |
||||
фактора А, следующие 9 значений – |
||||
при дозе 2; вводим для этих |
||||
значений |
признака Е |
коды |
доз 1 |
|
(ячейки A2:A10) и 2 (ячейки |
||||
A11:A19). Каждая из этих градаций |
||||
включает в себя по три градации |
||||
фактора В, введем их коды в столбец |
||||
В. Третий столбец образуют |
||||
собственно |
|
значения |
||
результативного |
|
признака |
плодовитости (Е), полученные в Так, значение Е = 11 (ячейка C7) получено при дозах А = 1, В =
2. Если проводится изучение действия более чем двух факторов, на листе организуются все новые и новые столбцы с кодами градаций факторов. При этом важно следить, чтобы были представлены все сочетания градаций. В нашем случае, например, и градация А1, и градация А2 должны содержать по три градации второго фактора: В1, В2, В3. При этом StatGraphics не требует равного объема выборок для
всех градаций. |
|
|
|
|
|
Экспорт |
подготовленных |
данных |
из |
среды |
Excel |
159
осуществляется командой меню Файл\ Сохранить как …. В окне Тип файла: следует выбрать Файл Microsoft Excel 4.0. В окне Имя файла: задать новое имя, чтобы не утратить информацию, содержащуюся на других листах текущей книги, ОК. Далее, на запрос о сохранении только текущего листа ответить ОК.
Импорт данных в среду StatGraphics осуществляется третьей слева кнопкой панели Toolbar или командой меню File\ Open Data File... . В окне Тип файлов (Files type:) появившегося фрейма выделить Excel Files (*.xls), затем следует указать директорию, содержащую искомый файл, щелкнуть на его имя и Открыть.
160
В появившемся окошке Read Excel File указать, что имена переменных Variable Names нужно брать из первого ряда (from first row), ОК.
Информация из файла попадет в блок данных, чья свернутая панель расположена слева внизу. Развернуть окно данных можно двойным кликом на "шапке".
Расчеты по схеме двухфакторного дисперсионного анализа запускаем командой меню Compare\ Analysis of Variance\ Multifactor ANOVA.
Впоявившемся окне Multifactor ANOVA результативный признак
Езаносим в графу "зависимая переменная" (Dependent Variable:), т. е. выделяем имя мышкой и нажимаем на кнопку стандартного отклонения стрелкой. Оба фактора заносим в графу Factors:, ОК. Сразу же все расчеты будут выполнены, но отобразится только одна панель с
161
общим описанием переменной и факторов. Для отображения главных результатов, в первую очередь таблицы дисперсионного анализа, нужно нажать на вторую слева желтую кнопку (Tabular options), в новом окне отметить галочкой ANOVA Table или нажать кнопку All,
ОК.
|
Чтобы раскрыть новое окно Analysis |
of variance for |
E, |
следует на нем дважды кликнуть. |
Раскроется таблица |
дисперсионного анализа, рассчитанная по схеме "без повторений" и не содержащая оценку взаимодействия факторов. Рассчитать этот эффект можно, изменив установки анализа. Правой кнопкой мыши нужно щелкнуть на поле дисперсионной таблицы и выбрать из контекстного меню пункт Analysis options, после чего в окошке Multifactor ANOVA options указать, что число взаимодействующих факторов равно 2, ОК.