- •Регрессионный анализ
- •Регрессионный анализ
- •Цели регрессионного анализа
- •Последовательность
- •а) положительная линейная регрессия б) положительная равноускоренно возрастающая регрессия;
- •Уравнения регрессии
- •Метод наименьших квадратов
- •Регрессионные
- •Пример
- •Остаток
- •Остаточная дисперсия и коэффициент детерминации
- •Коэффициент
Регрессионный анализ
Y=a+b*X
Регрессионный анализ
Впервые термин употреблен в работе Pearson (1908)
Анализ связи между несколькими независимыми переменными (регрессорами или предикторами) и зависимой переменной
Цели регрессионного анализа
Определение наличия и характера (математического уравнения, описывающего зависимость) связи между переменными
Определение степени детерминированности вариации критеральной переменной предикторами
Предсказать значение зависимой переменной с помощью независимой
Определить вклад независимых переменных в вариацию зависимой
Последовательность
этапов регрессионного
анализаРассмотрим кратко этапы регрессионного анализа.
Формулировка задачи. На этом этапе формируются предварительные гипотезы о зависимости исследуемых явлений.
Определение зависимых и независимых (объясняющих) переменных.
Сбор статистических данных. Данные должны быть собраны для каждой из переменных, включенных в регрессионную модель.
Формулировка гипотезы о форме связи (простая или множественная, линейная или нелинейная).
Определение функции регрессии (заключается в расчете численных значений параметров уравнения регрессии)
Оценка точности регрессионного анализа.
Интерпретация полученных результатов. Полученные результаты регрессионного анализа сравниваются с предварительными гипотезами. Оценивается корректность и правдоподобие полученных результатов.
Предсказание неизвестных значений зависимой переменной.
а) положительная линейная регрессия б) положительная равноускоренно возрастающая регрессия;
в) положительная равнозамедленно возрастающая регрессия; г) отрицательная линейная регрессия д) отрицательная равноускоренно убывающая регрессия;
e) отрицательная равнозамедленно убывающая регрессия.
Уравнения регрессии
Линейная: y a bx , a bx f x . Нелинейные по объясняющим параметрам:
ya b1x b2 x2 bk xk ,
ya bx
Регрессии, нелинейные по оцениваемым параметрам:
Степенная: y axb Показательная: y ab x Экспоненциальная: y ea bx Логарифмическая: ln y a b ln x Полулогарифмическая: y a b ln x
y a bxc
Обратная: |
|
1 |
|
|
y a bx |
|
|||
|
||||
Метод наименьших квадратов
Цель - минимизировать квадраты отклонений линии регрессии от наблюдаемых точек.
По этим данным строим диаграмму рассеяния
Регрессионные
коэффициенты (B-
коэффициенты)
Это независимые вклады каждой независимой переменной в предсказание зависимой переменной:
переменная X1 коррелирует с переменной Y после учета влияния всех других независимых переменных (частная корреляция)
Пример
Успеваемость = 1+.02*IQ, где:а = 1
b = 0,02
IQ – независимая переменная
При IQ=130:
Успеваемость = 1+.02*130 = 3,6
Остаток
Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.
Чем меньше разброс значений (дисперсия) остатков около линии регрессии по отношению к общему разбросу значений, тем лучше прогноз
