Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по курсу Мн_ст_анализ.doc
Скачиваний:
68
Добавлен:
01.02.2015
Размер:
366.59 Кб
Скачать

2.5. Проверка значимости.

В однофакторном дисперсионном анализе проверяют нулевую гипотезу, утверждающую, что групповые средние в рассматриваемой совокупности равны. Т.е. H0 :1 = 2 = 3 =………= с

В соответствии с нулевой гипотезой значение SSx и SSошибкм зависят от одного источника вариации. В этом случае оценка дисперсии совокупности Y может определяться межгрупповой или внутригрупповой вариации, т.е.

SSx

Sy2 = ;

(с-1)

что представляет собой средний квадрат, обусловленный действием Х, который можно записать по другому МSx.

В то же время оценка дисперсии совокупности Y

SSошибкм

Sy2 = ;

(N-c)

что представляет собой средний квадрат, обусловленный действием всех факторов кроме Х, что можно записать как МSошибкм.

Нулевую гипотезу H0 можно проверить с помощью F-статистики, рассчитываемой как отношение между этими двумя оценками дисперсий:

SSx / (с-1) МSx

F =  = 

SSошибкм / (N-c) МSошибкм

Эта статистика подчиняется F-распределению с числом степеней свободы равным (с-1) и (N-c). Напомним, что F-распределение представляет собой распределение вероятностей отношений выборочных дисперсий. Значение F зависит от числа степеней свободы в числителе и знаменателе.

Интерпретация результатов.

Если нулевую гипотезу о равенстве групповых средних не отклоняют, то независимая переменная не оказывает статистически значимого влияния на зависимую переменную.

Понятно, что если нулевую гипотезу отклонить, то эффект независимой переменной на зависимую трактуется как статистически значимый, т.е. среднее значение зависимой переменной различно для различных групп независимой переменной.

Необходимо отметить, что сравнение значений групповых средних показывает характер влияния независимой переменной.

Лекция 3

Вопросы лекции:

3.1. Допущения в дисперсионном анализе

3.2. Многофакторный дисперсионный анализ

3.3. Ковариационный анализ

3.4. Парная корреляция

3.5. Частная корреляция

3.1. Допущения в дисперсионном анализе.

Все допущения дисперсионного анализа можно обобщить в следующем виде.

  1. Обычно считается, что уровни независимой переменной фиксированные. Статистический вывод касается только рассматриваемых конкретных уровней. Такой подход называется моделью с фиксированным влиянием уровней фактора. Однако существуют и другие модели. Так, например, для модели со случайным влиянием уровней фактора считают, что факторы представляют собой случайные выборки из генеральной совокупности факторного эксперимента. Модель со смешанными уровнями получают, если некоторые факторы (условия эксперимента) фиксированные, а некоторые – случайные.

  2. Предварительно отметим, что однофакторная дисперсионная модель имеет вид

xij =  + Fi + ij ,

где xij – значение исследуемой переменной, полученной на i-м уровне фактора (i = 1, 2,…,m) с j-м порядковым номером (j = 1, 2,…, n);

 - общее среднее;

Fi- эффект, обусловленный влиянием i-го уровня фактора;

ij – остаточный член, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменной внутри отдельного уровня.

Так вот, остаточный член в дисперсионной модели, определяющей значение зависимой переменной Y, имеет нормальное распределение, при этом, математическое ожидание равно нулю, а дисперсия является постоянной. Остаточный член не связан ни с одним уровнем переменной Х. Умеренное отклонение от этих допущений серьезно не влияет на достоверность анализа. Более того, данные можно преобразовать таким образом, чтобы они удовлетворяли допущению о нормальности распределения или постоянству дисперсий.

  1. Остаточные члены не коррелируют. Если остаточные члены взаимосвязаны (т.е. наблюдения зависимые), то отношение дисперсий F может быть сильно искажено.

Очень часто при анализе ситуаций данные соответствуют описанным выше трем допущениям. Поэтому дисперсионный анализ достаточно распространен на практике.