Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Nasledov 7-13.doc
Скачиваний:
14
Добавлен:
01.05.2025
Размер:
2.67 Mб
Скачать

Глава 13. Дисперсионный анализ (anova)

Нарушение предположения о равенстве (однородности, гомогенности) дис­персий имеет существенное значение для ANOVA в том случае, если сравнива­емые выборки отличаются по численности. Таким образом, если выборки, со­ответствующие разным градациям фактора, отличаются по численности, то необходима предварительная проверка гомогенности (однородности) диспер­сий. В компьютерных программах это осуществляется при помощи критерия Ливена (Levene's Test of Homogeneity of Variances). Если выборки заметно раз­личаются по численности и дисперсии по критерию Ливена различаются ста­тистически достоверно, то ANOVA к таким данным не применим, следует вос­пользоваться непараметрической альтернативой.

В основе современных программных реализаций дисперсионного анализа ле­жит представление о родственности дисперсионного и множественного регрес­сионного анализа: оба метода исходят из одной и той же линейной модели. В связи с этим, а также в связи с применением в дисперсионном анализе процедур и по­казателей, характерных для множественной регрессии, в последнее время все варианты дисперсионного анализа объединяются (например, в программе SPSS) под названием: Общая линейная модель (GLM General Linear Model).

Параметрическими аналогами ANOVA являются такие многомерные мето­ды, как множественный регрессионный анализ (глава 15) и дискриминант-ный анализ (глава 17). Отличие модели множественного регрессионного ана­лиза заключается в том, что все переменные в ней, в том числе и независимые, представлены в метрической шкале. В модели дискриминантного анализа, в отличие от ANOVA, зависимая переменная является классифицирующей (но­минативной), а независимые переменные — метрическими.

Непараметрическими аналогами ANOVA, как отмечалось, являются крите­рии //-Краскала-Уоллеса (для независимых выборок) и %2-Фридмана (для по­вторных измерений).

Вычислительные сложности, связанные с проведением ANOVA, представ­ляли проблему до появления компьютеров и специальных статистических программ. Современные статистические программы (SPSS, STATISTICA) из­бавляют пользователя от утомительных расчетов. Однако понимание и пра­вильная интерпретация получаемых показателей обязательно требуют нали­чия общего представления о том, как они вычисляются. Поэтому изложение основных методов ANOVA будет сопровождаться демонстрацией расчетов на упрощенных примерах, которые будущему пользователю компьютерных про­грамм желательно внимательно изучить.

Однофакторный anova

Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (сред­ние значения, соответствующие разным градациям фактора, различаются).

189

Часть II. Методы статистического вывода: проверка гипотез

Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгруп­повая (факторная) составляющая изменчивости обусловлена различием сред­них значений под влиянием фактора. Внутригрупповая (случайная) составля­ющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (раз­личия средних значений групп, соответствующих уровням фактора).

Нулевая статистическая гипотеза содержит утверждение о равенстве сред­них значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.

Исходные предположения: распределение зависимой переменной в сравни­ваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимы­ми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из нескольких сравни­ваемых выборок.

ПРИМЕР

Исследовалось влияние на продуктивность воспроизведения (Y) вербального ма­териала интервала между 5 повторениями г3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).

Структура данных:

Хх (интервал)

У (эффективность воспроизведения)

I

1

8

2

3

9

3

2

4

4

1

5

N

2

6

Ограничения: если дисперсии выборок различаются статистически досто­верно, то метод неприменим. Для проверки однородности дисперсии приме­няется критерий Ливена (Levene's Test of Homogeneity of Variances). Формаль­но численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).

Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.

Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням

190

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]