- •Введение
- •1. Корреляционный анализ
- •1.1 Понятие корреляционной связи
- •1.2 Общая классификация корреляционных связей
- •1.3 Корреляционные поля и цель их построения
- •1.4 Этапы корреляционного анализа
- •1.5 Коэффициенты корреляции
- •1.6 Нормированный коэффициент корреляции Браве-Пирсона
- •1.7 Коэффициент ранговой корреляции Спирмена
- •1.8 Основные свойства коэффициентов корреляции
- •1.9 Проверка значимости коэффициентов корреляции
- •1.10 Критические значения коэффициента парной корреляции
- •2. Регрессия и регрессионный анализ
- •2.1. Регрессия и ее виды.
- •2.2 Регрессионный анализ и уравнение регрессии
- •2.3. Линейная и нелинейная регрессионная модель
2.3. Линейная и нелинейная регрессионная модель
Рассмотрим парную линейную регрессионную модель взаимосвязи двух переменных, для которой функция регрессии φ(х) линейна. Обозначим через yx условную среднюю признака Y в генеральной совокупности при фиксированном значении x переменной Х. Тогда уравнение регрессии будет иметь вид:
yx = ax + b, где a – коэффициент регрессии (показатель наклона линии линейной регрессии). Коэффициент регрессии показывает, на сколько единиц в среднем изменяется переменная Y при изменении переменной Х на одну единицу. С помощью метода наименьших квадратов получают формулы, по которым можно вычислять параметры линейной регрессии (Табл. 2):
Таблица 2. Формулы для расчета параметров линейной регрессии
Свободный член b |
Коэффициент регрессии a |
Коэффициент детерминации |
|
|
|
Направление связи между переменными определяется на основании знака коэффициента регрессии. Если знак при коэффициенте регрессии положительный, связь зависимой переменной с независимой будет положительной. Если знак при коэффициенте регрессии отрицательный, связь зависимой переменной с независимой является отрицательной (обратной).
|
|
Для анализа общего качества уравнения регрессии используют коэффициент детерминации R2, называемый также квадратом коэффициента множественной корреляции. Коэффициент детерминации (мера определенности) всегда находится в пределах интервала [0;1]. Если значение R2 близко к единице, это означает, что построенная модель объясняет почти всю изменчивость соответствующих переменных. И наоборот, значение R2 близкое к нулю, означает плохое качество построенной модели.
Коэффициент
детерминации R2
показывает, на сколько процентов
найденная функция регрессии описывает
связь между исходными значениями Y
и Х.
На рис. 3 показана
– объясненная регрессионной моделью
вариация и
- общая вариация. Соответственно, величина
показывает, сколько процентов вариации
параметра Y
обусловлены факторами, не включенными
в регрессионную модель.
При
высоком значении коэффициента детерминации
75%)
можно делать прогноз
для конкретного значения
в пределах диапазона исходных данных.
При прогнозах значений, не входящих в
диапазон исходных данных, справедливость
полученной модели гарантировать нельзя.
Это объясняется тем, что может проявиться
влияние новых факторов, которые модель
не учитывает.
Оценка значимости уравнения регрессии осуществляется с помощью критерия Фишера.
Нелинейные уравнения регрессии предварительно приводят к линейному виду с помощью преобразования переменных, а затем к преобразованным переменным применяют метод наименьших квадратов.
Вывод
