- •3.1. Простая линейная регрессия.
- •Пример построения линейной регрессии.
- •3.1.1. Определение параметров уравнения регрессии с помощью метода наименьших квадратов.
- •3.1.2. Критерии значимости коэффициентов и в уравнении регрессии.
- •Коэффициент детерминации .
- •Гетероскедастичность.
- •Автокорреляция.
- •Мультиколлинеарность.
- •Фиктивные переменные.
- •Исходные данные
- •Результаты вычислений.
- •3.4. Использование регрессии для прогнозирования.
- •Матрица коэффициентов парной корреляции
- •Множественный коэффициент корреляции
- •Частный коэффициент корреляции
- •Исходные данные.
- •Результаты расчета.
- •Проверка точности.
- •Проверка адекватности и оценка точности модели парной линейной регрессии.
- •Проверка адекватности.
- •Курс доллара сша и предположительно влияющие на него факторы.
- •Корреляционная матрица системы показателей.
- •Параметры модели зависимости курса доллара от цены золота и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота и dj-индекса и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота, dj-индекса и тn-индекса и ее статистические характеристики.
- •Результаты моделирования зависимости курса доллара от цены золота и dj-индекса.
- •Исходные данные.
- •Коэффициенты корреляции.
- •Исходные данные.
- •Исходные данные.
Матрица коэффициентов парной корреляции
Коэффициенты парной корреляции, используются для измерения силы линейных связей различных пар признаков из их множества. Для множества признаков получают матрицу коэффициентов парной корреляции.
Пусть вся совокупность
данных состоит из переменной Y=
(у
,
у
,
..., у
)
и m переменных
(факторов) X, каждая
из которых содержит п наблюдений.
Значения переменных Y
и X, содержащиеся
в наблюдаемой совокупности, записываются
в нижеприведенную таблицу.
Номер наблюдения |
Y |
X1 |
X2 |
…. |
Xm |
1 |
Y1 |
X11 |
X21 |
…. |
Xm1 |
…. |
… |
…. |
…. |
…. |
…. |
n |
Yn |
X1n |
X2n |
…. |
Xmn |
На основании данных, содержащихся в этой таблице, вычисляют матрицу коэффициентов парной корреляции R, она симметрична относительно главной диагонали:
(3.20).
Анализ матрицы коэффициентов парной корреляции используют при построении моделей множественной регрессии. Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим в многомерном корреляционном анализе рассматривается две задачи:
Определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ.
Определение тесноты связи между двумя величинами при фиксировании или исключении влияния остальных величин.
Эти задачи решаются соответственно с помощью коэффициентов множественной и частной корреляции.
Множественный коэффициент корреляции
Решение первой задачи (определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ) осуществляется с помощью выборочного коэффициента множественной корреляции по формуле
(3.21),
где |R|
- определитель корреляционной матрицы
R
(3.20);
- алгебраическое дополнение элемента
той же матрицы R.
Квадрат
коэффициента множественной корреляции
принято называть выборочным множественным
коэффициентом
детерминации; он
показывает, какую долю вариации
(случайного разброса) исследуемой
величины X
объясняет вариация остальных случайных
величин Х1,
Х2,...,
Хm.
Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении. Коэффициент множественной корреляции может только увеличиваться, если в модель включать дополнительные переменные, и не увеличится, если исключать какие-либо из имеющихся признаков.
Проверка значимости
коэффициента детерминации осуществляется
путем сравнения расчетного значения
F-критерия
Фишера (см. уравнение 3.9) с
табличным Fтабл.
Коэффициент
значимо отличается от нуля, если
выполняется неравенство
.
Частный коэффициент корреляции
Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния других случайных величин (одной или нескольких).
Выборочный частный коэффициент корреляции определяется по формуле:
(3.22),
где
R
– алгебраические дополнения к
соответствующим элементам матрицы R.
Частный
коэффициент корреляции, так же как и
парный коэффициент
корреляции, изменяется от -1 до +1.
Выражение (3.22) при условии m = 3 будет иметь вид
(3.23).
Коэффициент
называется коэффициентом
корреляции между
х1,
и х2 при фиксированном
х3.
Он
симметричен относительно первичных
индексов 1, 2. Его вторичный индекс 3
относится к фиксированной
переменной.
Пример. Вычисление коэффициентов парной, множественной и частной корреляции. В табл. 3.5 представлена информация об объемах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов за ряд текущих лет.
Построить диаграмму рассеяния (корреляционное поле) для переменных «объем продаж» и «индекс потребительских расходов».
Определить степень влияния индекса потребительских расходов на объем продаж (вычислить коэффициент парной корреляции).
Оценить значимость вычисленного коэффициента парной корреляции.
Построить матрицу коэффициентов парной корреляции по трем переменным.
Найти оценку множественного коэффициента корреляции.
Найти оценки коэффициентов частной корреляции.
Таблица 3.5.
