Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по стат.Подлипенская РУС.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
3.72 Mб
Скачать

5 Элементы корреляционного и регрессионного анализа

Зависимость между переменными случайными величинами Х и У, при которой каждому значению одной из них соответствует определенное среднее значение другой величины, называется корреляционной. Функция, описывающая такую зависимость, называется регрессией. По виду функции различают линейную и нелинейную регрессии, по количеству зависимых переменных – одномерную и множественную регрессии. Признак Х, соответствующий независимой переменной, будем называть факторным, признак У, соответствующий зависимой переменной, будем называть результативным.

5.1 Корреляционное поле

Пусть статистические данные представляют собой ряд пар связанных значений числовых признаков Х и У:

1 ;y1), (х2 ;y2), ..., (хi ;yi), …, (хn ;yn) .

К орреляционное поле – это графическое представление статистических данных в прямоугольной системе координат ХОУ, где каждой паре на плоскости соответствует точка. Построенное корреляционное поле позволяет на начальном этапе исследования сделать предварительный вывод как о наличии зависимости между признаками Х и У, так о виде этой зависимости.

5.2 Эмпирическая ломаная регрессии

Эмпирическая ломаная регрессии строится по точка , где хj – середины интервалов разбиения признака Х; – средние групповые значения признака У в каждом интервале признака Х: = (Σ yi)/nj . Здесь суммирование ведется только по тем значениям yi , для которых значение хi попало в j-тый интервал; nj – берется из интервального статистического ряда признака Х для j-го интервала.

5.3 Эмпирический коэффициент детерминации и эмпирическое корреляционное отношение

Для измерения тесноты связи между признаками Х и У применяются эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.

Эмпирический коэффициент детерминации находится по формуле:

, где Dмежгр – межгрупповая дисперсия результативного признака У; Dобщ – общая дисперсия результативного признака У ( можно использовать выборочную дисперсию признака У, найденную при одномерном анализе).

Можно также дисперсии определять по формулам:

(1)

(2)

где k – число групп по факторному признаку Х;

n – объем выборки;

yi – индивидуальные значения результативного признака У;

– его средние групповые значения;

– среднее значение признака У;

nj – частота в j – той группе (берется из статистического рядя признака Х).

Эмпирическое корреляционное отношение равно корню квадратному из коэффициента детерминации

5.4 Линейная регрессия

а) Уравнение линейной регрессии с угловым коэффициентом

Уравнение линейной регрессии У на Х имеет вид:

, (3)

где k – коэффициент регрессии, b – свободный член уравнения регрессии. Параметры уравнения регрессии определяются по фактическим данным, которые представляют собой набор n пар

i ;yi), при помощи метода наименьших квадратов (МНК).

Расчетные формулы имеют вид:

,

. (4)

Если учесть формулы средних и дисперсии признаков Х и У, то расчет можно вести по следующим формулам:

, (5)

где

Замечание 1. Для проверки правильности расчетов можно использовать тождество:

Замечание 2. В формулах (5) можно использовать выборочные средние и дисперсии, найденные ранее на этапе одномерного анализа признаков, хотя с учетом группировки может получиться менее точный результат (хотя и более быстрый).

Расчет сумм, представленных в формулах, удобно производить при помощи табличного процессора Excel, который является электронной версией таблиц. Для расчета в Excel необходимо организовать расчетную таблицу. Ее вид в компьютере будет следующий (для примера взята выборка объемом n = 5):

б) Выборочное линейное уравнение регрессии

Выборочное линейное уравнение регрессии У на Х имеет вид:

(6)

Выборочное линейное уравнение регрессии Х на У имеет вид:

(7)

В этих уравнениях используются следующие формулы:

дисперсия признака Х;

дисперсия признака У;

rв – выборочный коэффициент корреляции, вычисляемый по формуле:

. (6)

Если параметры уравнения были рассчитаны по уравнению регрессии с угловым коэффициентом, то выборочный коэффициент корреляции вычисляется по формуле: (7)