- •3.1. Простая линейная регрессия.
- •Пример построения линейной регрессии.
- •3.1.1. Определение параметров уравнения регрессии с помощью метода наименьших квадратов.
- •3.1.2. Критерии значимости коэффициентов и в уравнении регрессии.
- •Коэффициент детерминации .
- •Гетероскедастичность.
- •Автокорреляция.
- •Мультиколлинеарность.
- •Фиктивные переменные.
- •Исходные данные
- •Результаты вычислений.
- •3.4. Использование регрессии для прогнозирования.
- •Матрица коэффициентов парной корреляции
- •Множественный коэффициент корреляции
- •Частный коэффициент корреляции
- •Исходные данные.
- •Результаты расчета.
- •Проверка точности.
- •Проверка адекватности и оценка точности модели парной линейной регрессии.
- •Проверка адекватности.
- •Курс доллара сша и предположительно влияющие на него факторы.
- •Корреляционная матрица системы показателей.
- •Параметры модели зависимости курса доллара от цены золота и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота и dj-индекса и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота, dj-индекса и тn-индекса и ее статистические характеристики.
- •Результаты моделирования зависимости курса доллара от цены золота и dj-индекса.
- •Исходные данные.
- •Коэффициенты корреляции.
- •Исходные данные.
- •Исходные данные.
Лекция 3. Методы корреляционно-регрессионного анализа фондового рынка.
С помощью регрессионного анализа строится и проверяется модель связи между одной зависимой (т.е. эндогенной) и одной или более независимыми (экзогенными) переменными. Зависимая переменная обычно обозначается Y, а независимая (ые), также называемая регрессором, - X.
Направление причинной связи между переменными определяется через предварительное обоснование и включается в модель как гипотеза. Регрессионный анализ проверяет статистическую состоятельность модели при данной гипотезе.
Например, предположим, выдвинута гипотеза о том, что уровень фондового индекса FТSЕ (FТSЕ 100) линейно зависит от уровня фондового индекса S&Р 500, т.е., когда растет S&Р 500, растет и FТSЕ 100, а когда S&Р 500 падает, падает и FТSЕ 100. Можно проверить эту гипотезу, используя простую линейную регрессию с включением только двух переменных.
Альтернативной гипотезой может быть то, что индекс FТSЕ 100 находится под влиянием не одного фактора, а нескольких. Например, на текущий уровень FТSЕ 100 могут влиять индекс S&Р 500, уровень рынка облигаций Великобритании и обменный курс $/£. Эта гипотеза может быть проверена с помощью множественной регрессии.
3.1. Простая линейная регрессия.
Применим регрессионный анализ для простой линейной зависимости между зависимой переменной (Y) и одной независимой переменной (X).
Под линейностью мы имеем в виду, что переменная Y предположительно находится под влиянием переменной X в следующей зависимости:
,
(3.1)
где
- постоянная, т.е.
если бы даже X
была равна нулю, Y
имела бы какое-либо положительное или
отрицательное значение. Можно ли дать
разумное объяснение значению Y
даже при X
равном нулю? Все зависит от гипотезы,
для которой применяется регрессионный
анализ.
- коэффициент
регрессии, отражает наклон линии, вдоль
которой рассеяны данные наблюдений. Он
может быть истолкован как показатель,
характеризующий процентное изменение
переменной Y,
которое вызвано изменением значения
X
на единицу. Таким образом, если Y
и X
- это соответственно индексы FТSЕ
100 и S&Р500,
то
будет указывать, на какое количество
пунктов изменится FТSЕ
100 при изменении индекса S&Р
500 на один пункт. Если знак
положителен, то переменные положительно
коррелированы. При отрицательном знаке
переменные отрицательно коррелированны;
- ошибка или значение
помехи, также называемая остатком.
Она отражает тот факт, что обычно движение
Y
будет, по крайней мере, неточно
описываться лишь движением X.
Присутствуют другие факторы, не включенные
в данную модель. Однако если исследуемая
гипотеза реалистична, то эти другие
переменные должны быть относительно
неважными.
Обращаясь снова к взаимосвязи между FТSЕ 100 и S&Р 500, отметим, что индекс FТSЕ 100 - зависимая переменная Y, так как мы выдвинули гипотезу о том, что движение этого индекса находится под влиянием, т.е. зависит от изменения индекса S&Р 500, который представлен переменной X. В данной гипотезе мы предполагаем, что множество других незначительных и неучтенных влияний представлены в модели величиной .
Если экономические аргументы достаточно сильны, мы можем развить гипотезу о том, что уровень индекса S&Р 500 находится под влиянием индекса FТSЕ 100. При таком допущении величина индекса S&Р 500 стала бы переменной Y, а индекса FТSЕ 100 - переменой X.
Расположив данные из табл. 3.1 на приведенной ниже точечной диаграмме рассеяния (рис. 3.1), мы действительно видим, что высокие (низкие) значения S&Р 500 соответствуют высоким (низким) значениям РТ8Е 100. Таким образом, создается впечатление, что данные по двум индексам растут и падают вместе.
Таблица 3.1
Пример построения линейной регрессии.
FТSЕ 100
(Y)
|
S&Р 500 (X) |
|
|
|
|
2851,6 |
442,52 |
-114,545 |
-10,726 |
115,0471 |
1228,61 |
2882,6 |
442,01 |
-83,545 |
-11,236 |
126,2477 |
938,7116 |
2878,4 |
450,3 |
-87,745 |
-2,946 |
8,678916 |
258,4968 |
2813,4 |
442,46 |
-152,745 |
-10,786 |
116,3378 |
1647,508 |
2849,2 |
453,83 |
-116,945 |
0,584 |
0,341056 |
-68,2959 |
2888,8 |
449,02 |
-77,345 |
-4,226 |
17,85908 |
326,86 |
2941,7 |
450,15 |
-24,445 |
-3,096 |
9,585216 |
75,68172 |
3085 |
463,15 |
118,855 |
9,904 |
98,08922 |
1177,14 |
3039,3 |
461,28 |
73,155 |
8,034 |
64,54516 |
587,7273 |
3164,4 |
469,1 |
198,255 |
15,854 |
251,3493 |
3143,135 |
3233,2 |
461,89 |
267,055 |
8,644 |
74,71874 |
2308,423 |
|
|
|
|
|
|
Сумма: |
|
|
|
882,7993
|
11624
|
Однако фактические данные не говорят нам ничего о причинной связи. Наше понимание причинной связи исходит из предварительно выдвинутой гипотезы. Как мы заметили в одном из предыдущих абзацев, указание на причину и следствие, т.е. на то, что является зависимой, а что независимой переменной, определяется выдвинутой гипотезой.
Для иллюстрации этого вернемся снова к гипотезе о том, что уровень FТSЕ 100 находится под влиянием уровня S&Р 500. Фактические данные подтверждают эту идею, но поддержит ли ее наше понимание экономики финансов? S&Р 500 может влиять на FТSЕ 100 из-за огромного масштаба экономики США и международного оборота капитала. Однако альтернативное предположение заключается в том, что, так как оба рынка открыты для международных инвесторов, они оба могут находиться под влиянием третьего фактора, может быть, ожидания японских или европейских инвесторов.
Рис.
3.1. Динамика индексов FТSЕ
100 и S&Р 500.
Ясно, что независимо от регрессионной модели необходимо развивать гипотезу для того, чтобы регрессионный анализ смог обоснованно подтвердить или не подтвердить ее. Регрессионный анализ не в состоянии "доказать" гипотезу, он может лишь подтвердить ее статистически или отвергнуть.
Обращаясь к диаграмме рассеяния (рис. 3.1), отметим, что через точки на графике можно провести несколько прямых линий, удовлетворяющих выражению (3.1), хотя в действительности невозможно построить одну прямую линию, которая пройдет через все точки корреляционного поля. Отсюда очевидно, что нужно выбрать лишь одну линию.
