Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по курсу Мн_ст_анализ.doc
Скачиваний:
68
Добавлен:
01.02.2015
Размер:
366.59 Кб
Скачать

2.3. Определение зависимых и независимых переменных

Пусть Y – зависимая переменная, X – независимая переменная или категориальная переменная, имеющая с категорий (уровней групп). Для каждой группы Х существует n наблюдений Y.

Группы Полная

выборка

X1 X2 X3 Xc

Y1 Y1 Y1 Y1 Y1

Y2 Y2 Y2 Y2 Y2

Внутригрупповая вариация . . Полная вариация

=SSвнутри . . = SSy

. .

Yn Yn Yn Yn YN

Групповые средние Y1 Y2 Y3……..Yc Y

Межгрупповая вариация = SSмежду

Из таблицы видно, что размер выборки в каждой группе Х равен n , а размер общей выборки N = n x c. Для упрощений допускают, что размеры выборок в группах переменной Х (так называемые групповые размеры) равны, но это допущение необязательно.

С целью изучения различий между средними однофакторный дисперсионный анализ использует разложение полной вариации, наблюдаемой в зависимой переменной. По сути это:

разделение вариации зависимой переменной на вариацию, обусловленную различием средних внутри групп плюс вариацию, обусловленную внутригрупповой изменчивостью.

Полную вариацию зависимой переменной Y обозначаемую SS , можно разложить на два компонента

SSy = SSмежду + SSвнутри

где нижние индексы (между и внутри) относятся к группам переменной Х.

SSмежду – это вариация переменной Y, связанная с различием средних между группами переменной Х. Она представляет вариацию между категориями переменной Х (межгрупповая изменчивость). Другими словами,

SSмежду – это доля в сумме квадратов переменной Y, обусловленная действием независимой переменной (фактором Х). Поэтому SSмежду также обозначают как SSx.

SSвнутри – это вариация зависимой переменной Y, связанная с вариацией внутри каждой группы переменной Х, а вычисляют ее, не учитывая фактор Х. Поэтому SSвнутри также называют дисперсией ошибки, т.е. SSошибки.

SSy = SSx + SSошибкм

где SSy = 2

SSx = 2

SSошибкм = 2

- отдельное наблюдение

- среднее для группы j

- среднее для всей выборки или общая средняя

- i-наблюдение в j-группе

Смысл разложения полной вариации в переменной Y, SSy на компоненты SSмежду и SSвнутри в том, чтобы наглядно представить, а затем изучить различия в групповых средних.

2.4. Измерение эффекта.

Сила влияния переменной Х на Y измеряется с помощью SSx. Поскольку SSx связано с вариацией средних значений групп Х, то относительное значение SSx растет с увеличением различий между средними значениями Y в группах Х. Относительное значение SSx также увеличивается при уменьшении вариаций Y внутри групп Х. Эффект влияния переменной Х на Y вычисляют по формуле

SSx (SSy - SSошибкм)

2 =  = 

SSy SSy

Значение 2 равно нулю, когда все групповые средние равны, т.е. переменная Х не влияет на Y. Значение 2 равно единице, когда внутри каждой из групп переменной Х изменчивость отсутствует, но имеется некоторая изменчивость между группами. Вывод:

2 представляет собой меру вариации Y, которая объясняется влиянием независимой переменной Х.

В то же время мы в состоянии не только измерять влияние Х на Y, но и проверить его значимость.