
- •Лекция 1
- •1.1. Принципы измерений и шкалирования
- •1.2. Сопоставаление методов шкалирования
- •1.3. Методы сравнительного шкалирования
- •Лекция 2
- •2.1. Понятие дисперсионного анализа
- •2.2. Однофакторный дисперсионный анализ
- •2.3. Определение зависимых и независимых переменных
- •2.4. Измерение эффекта.
- •2.5. Проверка значимости.
- •Лекция 3
- •3.1. Допущения в дисперсионном анализе.
- •3.2. Многофакторный дисперсионный анализ
- •3.3. Ковариационный анализ
- •3.4. Парная корреляция
- •3.5. Частная корреляция
- •Лекция 4
- •4.1. Условия, которые допускают использование регрессионного анализа
- •4.2. Парная регрессия
- •4.3. Стадии парного регрессионного анализа
- •4.4. Поле корреляции
- •4.5. Определение параметров уравнения регрессии.
- •4.6. Нормированный коэффициент регрессии и проверка значимости.
- •Лекция 5
- •5.1. Теснота и значимость связи
- •5.2. Точность предсказаний
- •5.3. Допущения модели регрессионного анализа
- •5.4. Факторный анализ
- •Лекция 6
- •6.1. Факторная модель при нормированных переменных
- •6.2. Статистики факторного анализа
- •6.3. Этапы выполнения факторного анализа
- •Лекция 7
- •7.1. Формулировка проблемы и построение корреляционной матрицы.
- •7.2. Определение метода факторного анализа и числа факторов
- •7.3. Вращение и интерпретация факторов.
- •7.4. Вычисление значений факторов, отбор переменных-имитаторов и определение подгонки модели.
- •Лекция 8
- •8.1. Сущность кластерного анализа.
- •8.2. Статистики кластерного анализа
- •8.3. Этапы выполнения кластерного анализа.
4.6. Нормированный коэффициент регрессии и проверка значимости.
Нормированный коэффициент регрессии
Нормирование представляет собой процедуру, посредством которой исходные данные преобразуют в новые переменные со значением средней, равным нулю и дисперсией, равной единице. После нормирования данных, отрезок, отсекаемый на оси OY, принимает значение 0. Нормированный коэффициент регрессии обозначают как «бета»-коэффициент или взвешенный «бета»-коэффициент. В этом случае угловой коэффициент регрессии Y по Х, обозначаемый Bxy, тот же, что и угловой коэффициент регрессии Х по Y, обозначаемый Byx. Более того, каждый из этих коэффициентов регрессии равен простому (линейному) коэффициенту корреляции между Х и Y.
Byx = Bxy = rxy
Существует простая связь между нормированным и ненормированным коэффициентами регрессии:
Sx
Byx = byx
Sy
Проверка значимости
Статистическую значимость линейной связи между Х и Y можно проверить, исследовав гипотезы:
H0 : 1 = 0
H1 : i 0
Нулевая гипотеза предполагает, что между Х и Y не существует линейной зависимости. Альтернативная гипотеза утверждает, что между Х и Y существует зависимость, либо положительная, либо отрицательная. Обычно проводят двустороннюю проверку. Можно использовать t-статистику с n-2 степенями свободы, где
b
t =
SEb
SEb обозначает стандартное отклонение b, и этот показатель называют стандартной ошибкой коэффициента регрессии b.
Лекция 5
Вопросы лекции:
5.1. Теснота и значимость связи.
5.2. Точность предсказаний.
5.3. Допущения модели регрессионного анализа.
5.4. Факторный анализ.
5.1. Теснота и значимость связи
Соответствующий статистический вывод включает определение тесноты и значимости связи между Х и Y. Тесноту связи измеряют коэффициентом детерминации r2 . В парной регрессии r2 представляет собой квадрат линейного коэффициента корреляции. Коэффициент r2 изменяется от нуля до единицы. Он показывает долю от полной вариации переменной Y, которая обусловлена вариацией переменной Х. Разложение полной вариации переменной Y аналогично разложению полной вариации в дисперсионном анализе. Как показано на рис.1, полная вариация SSy раскладывается на вариацию, которую можно объяснить, исходя из линии регрессии SSрегрессии и вариацию ошибки или остаточную вариацию, SSошибки или SSостаточная
Y
Остаточная вариация
YSSres
Полная вариация
Объяснимая вариация
SSy SSreg
Х
Рис.1 Разложение полной вариации в парной регрессии
SSy = SSрегрессии + SSостаточная
где
SSy
=
SSрегрессии
=
SSостаточная
=
Тесноту связи вычислим следующим образом
SSрегрессии
r2 =
SSy
SSy - SSостаточная
r2 =
SSy
Другой равноценной проверкой значимости линейной зависимости между Х и Y (значимости b) является проверка значимости коэффициента детерминации. В этом случае гипотезы имеют следующий вид:
H0:R2совокупности = 0
H1:R2совокупности > 0
Соответствующей статистикой, лежащей в основе критерия, является F-статистика
SSрегрессии
F = ,
SSостаточная /(n-2)
которая подчиняется F-распределению с 1 и n-2 степенями свободы. F-критерий представляет собой обобщенную форму t-критерия. При этом, если случайная переменная подчиняется t-распределению с n степенями свободы, то значения r2 подчиняются F-распределению с 1 и n степенями свободы. Отсюда следует, что F-критерий для проверки значимости коэффициента детерминации эквивалентен проверке следующих гипотез:
H0 : 1 = 0
H1 : 1 0
или
H0: = 0
H1: 0
Если зависимость между Х и Y статистически значима, то имеет смысл вычислить значение Y, исходя из значений Х, и оценить точность предсказания.