
- •Лекция 1
- •1.1. Принципы измерений и шкалирования
- •1.2. Сопоставаление методов шкалирования
- •1.3. Методы сравнительного шкалирования
- •Лекция 2
- •2.1. Понятие дисперсионного анализа
- •2.2. Однофакторный дисперсионный анализ
- •2.3. Определение зависимых и независимых переменных
- •2.4. Измерение эффекта.
- •2.5. Проверка значимости.
- •Лекция 3
- •3.1. Допущения в дисперсионном анализе.
- •3.2. Многофакторный дисперсионный анализ
- •3.3. Ковариационный анализ
- •3.4. Парная корреляция
- •3.5. Частная корреляция
- •Лекция 4
- •4.1. Условия, которые допускают использование регрессионного анализа
- •4.2. Парная регрессия
- •4.3. Стадии парного регрессионного анализа
- •4.4. Поле корреляции
- •4.5. Определение параметров уравнения регрессии.
- •4.6. Нормированный коэффициент регрессии и проверка значимости.
- •Лекция 5
- •5.1. Теснота и значимость связи
- •5.2. Точность предсказаний
- •5.3. Допущения модели регрессионного анализа
- •5.4. Факторный анализ
- •Лекция 6
- •6.1. Факторная модель при нормированных переменных
- •6.2. Статистики факторного анализа
- •6.3. Этапы выполнения факторного анализа
- •Лекция 7
- •7.1. Формулировка проблемы и построение корреляционной матрицы.
- •7.2. Определение метода факторного анализа и числа факторов
- •7.3. Вращение и интерпретация факторов.
- •7.4. Вычисление значений факторов, отбор переменных-имитаторов и определение подгонки модели.
- •Лекция 8
- •8.1. Сущность кластерного анализа.
- •8.2. Статистики кластерного анализа
- •8.3. Этапы выполнения кластерного анализа.
2.3. Определение зависимых и независимых переменных
Пусть Y – зависимая переменная, X – независимая переменная или категориальная переменная, имеющая с категорий (уровней групп). Для каждой группы Х существует n наблюдений Y.
Группы Полная
выборка
X1 X2 X3 Xc
Y1 Y1 Y1 Y1 Y1
Y2 Y2 Y2 Y2 Y2
Внутригрупповая вариация . . Полная вариация
=SSвнутри . . = SSy
. .
Yn Yn Yn Yn YN
Групповые средние Y1 Y2 Y3……..Yc Y
Межгрупповая вариация = SSмежду
Из таблицы видно, что размер выборки в каждой группе Х равен n , а размер общей выборки N = n x c. Для упрощений допускают, что размеры выборок в группах переменной Х (так называемые групповые размеры) равны, но это допущение необязательно.
С целью изучения различий между средними однофакторный дисперсионный анализ использует разложение полной вариации, наблюдаемой в зависимой переменной. По сути это:
разделение вариации зависимой переменной на вариацию, обусловленную различием средних внутри групп плюс вариацию, обусловленную внутригрупповой изменчивостью.
Полную вариацию зависимой переменной Y обозначаемую SS , можно разложить на два компонента
SSy = SSмежду + SSвнутри
где нижние индексы (между и внутри) относятся к группам переменной Х.
SSмежду – это вариация переменной Y, связанная с различием средних между группами переменной Х. Она представляет вариацию между категориями переменной Х (межгрупповая изменчивость). Другими словами,
SSмежду – это доля в сумме квадратов переменной Y, обусловленная действием независимой переменной (фактором Х). Поэтому SSмежду также обозначают как SSx.
SSвнутри – это вариация зависимой переменной Y, связанная с вариацией внутри каждой группы переменной Х, а вычисляют ее, не учитывая фактор Х. Поэтому SSвнутри также называют дисперсией ошибки, т.е. SSошибки.
SSy = SSx + SSошибкм
где SSy
=
2
SSx
=
2
SSошибкм
=
2
- отдельное
наблюдение
- среднее для группы
j
- среднее для всей
выборки или общая средняя
- i-наблюдение
в j-группе
Смысл разложения полной вариации в переменной Y, SSy на компоненты SSмежду и SSвнутри в том, чтобы наглядно представить, а затем изучить различия в групповых средних.
2.4. Измерение эффекта.
Сила влияния переменной Х на Y измеряется с помощью SSx. Поскольку SSx связано с вариацией средних значений групп Х, то относительное значение SSx растет с увеличением различий между средними значениями Y в группах Х. Относительное значение SSx также увеличивается при уменьшении вариаций Y внутри групп Х. Эффект влияния переменной Х на Y вычисляют по формуле
SSx (SSy - SSошибкм)
2 = =
SSy SSy
Значение 2 равно нулю, когда все групповые средние равны, т.е. переменная Х не влияет на Y. Значение 2 равно единице, когда внутри каждой из групп переменной Х изменчивость отсутствует, но имеется некоторая изменчивость между группами. Вывод:
2 представляет собой меру вариации Y, которая объясняется влиянием независимой переменной Х.
В то же время мы в состоянии не только измерять влияние Х на Y, но и проверить его значимость.