Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otvety_po_OMM (1).docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
1.99 Mб
Скачать

Проверка истинности моделей множественной регрессии:

- Расчет параметров

- Выбор фактора, оказывающего большее влияние

- Построение парных моделей регрессии

- Определение лучшей модели

-Проверка предпосылок МНК (1.Первую предпосылку проверим путём вычисления суммы значений остатков

2.Случайный характер остатков. Проверим графически)

  1. Проверка истинности параметров уравнения парной линейной регрессии. Определение стандартных отклонений и t-статистики коэффициентов парной линейной регрессии.

Стандартное отклонение

Стандартное отклонение (термин был впервые введен Пирсоном, 1894) - это широко используемая мера разброса или вариабельности (изменчивости) данных. Стандартное отклонение популяции определяется формулой:

s = [S(xi-m)2/N]1/2

где

среднее популяции

N  

размер популяции

Выборочное стандартное отклонение или оценка стандартного отклонения вычисляется по формуле:

s = [S(xi-x-bar)2/n-1]1/2

где

x-bar  

выборочное среднее

число наблюдений в выборке

Стандартное отклонение, среднеквадратичное отклонение, СКО, выборочное стандартное отклонение (англ. standard deviation, STD, STDev) — очень распространенный показатель рассеяния в описательной статистике. Но, т.к. технический анализ сродни статистике, данный показатель можно (и нужно) использовать в техническом анализе для обнаружения степени рассеяния цены анализируемого инструмента во времени. Обозначается греческим символом Сигма «σ».

Спасибо Карлу Гауссу и Пирсону за то, что мы имеем возможность пользоваться стандартным отклонением.

Используя стандартное отклонение в техническом анализе, мы превращаем этот«показатель рассеяния» в «индикатор волатильности«, сохраняя смысл, но меняя термины.

Что представляет собой стандартное отклонение

Понимание сути стандартного отклонения возможно с пониманием азов описательной статистики. К примеру, мы имеем 2 выборки, у которых среднее арифметическое одинаково и равно 3. Казалось бы, одинаковое среднее делает эти две выборки одинаковыми. А нет! Давайте рассмотрим возможные варианты данных для этих двух выборок:

  1. 1, 2, 3, 4, 5

  2. -235, -103,  3, 100, 250

Очевидно, что разброс (или рассеяние, или, в нашем случае, волатильность) гораздо больше во второй выборке. Следовательно, несмотря на то, что у этих двух выборок одинаковое среднее (равное 3), они совершенно разные в силу того, что у второй выборки данные беспорядочно и сильно рассеяны вокруг центра, а у первой — сконцентрированы около центра и упорядочены.

Но если нам надо быстро дать понять о таком явлении, мы не будем объяснять, как в абзаце выше, а просто скажем, что у второй выборки очень большое стандартное отклонение, а у первой — очень маленькое. Так, у второй выборки стандартное отклонение равно 186, а у первой оно равно 1,6. Разница существенная.

Стандартное отклонение в техническом анализе

Стандартное отклонение используется в техническом анализе не так часто, но оно служит отличным индикатором волатильности (изменчивости). Стандартное отклонение используется для промежуточных вычислений различных индикаторов, таких как, например, Полосы Боллинджера или Ширина Полос Боллинджера.

Но помимо промежуточных вспомогательных вычислений, стандартное отклонение вполне приемлемо для самостоятельного вычисления и применения в техническом анализе. Как отметил активный читатель нашего журнала burdock, «до сих пор не пойму, почему СКО не входит в набор стандартных индикаторов отечественных диллинговых центров«.

Действительно, стандартное отклонение может классическим и «чистым» способом измерить изменчивость инструмента. Но к сожалению, этот индикатор не так распространен в анализе ценных бумаг.

Применение стандартного отклонения

Для любого индикатора нам понадобиться переменная, т.е. параметр. В данном случае нам нужен только период n, который указывает, какое количество периодовмы будем включать в вычисление стандартного отклонения.

Для вычисления, мы берем данные закрытия из n периодов назад от последней доступной цены. Т.е. если мы установили период индикатора 20 (достаточно часто используемый период),то мы берем 20 последних данных и оперируем ими для вычисления стандартного отклонения сегодня. Следовательно, для вычисления стандартного отклонения в любой момент времени k, надо взять цены закрытия всех n периодов назад от k.

Вычисление стандартного отклонения

Предупреждаю, что самостоятельное вычисление вам врядли понадобиться, т.к. основные программы обработки данных имеют встроенную функцию вычисления стандартного отклонения. Например, в Microsoft Excel эта функция называется СТАНДОТКЛОН.

Вручную вычислить стандартное отклонение не очень интересно, но полезно для опыта. Стандартное отклонение можно выразить формулой STD=√[(∑(x-x)2)/n], что звучит как корень из суммы квадратов разниц между элементами выборки и средним, деленной на количество элементов в выборке.

Если количество элементов в выборке превышает 30, то знаменатель дроби под корнем принимает значение n-1. Иначе используется n.

Пошагово вычисление стандартного отклонения:

  1. вычисляем среднее арифметическое выборки данных

  2. отнимаем это среднее от каждого элемента выборки

  3. все полученные разницы возводим в квадрат

  4. суммируем все полученные квадраты

  5. делим полученную сумму на количество элементов в выборке (или на n-1, если n>30)

  1. вычисляем квадратный корень из полученного частного (именуемого дисперсией)

Модели линейной регрессии являются вероятностными – только лишь оценками истинных параметров зависимости эндогенной переменной от некоторых экзогенных. Таким образом, нужно проверить, насколько данные оценки верны относительно истинных коэффициентов. Это осуществляется путем проверки: · статистической значимости коэффициентов регрессии;  · близости расположения фактических данных к рассчитанной линии регрессии. Оценки коэффициентов регрессии так же, как и ошибка (стохастическая компонента уравнения регрессии), предположительно нормально распределены. Статистическая значимость коэффициентов измеряется степенью вариации вокруг оценочного значения. Для измерения величины вариации нормально распределенных ошибок, остатков используется среднее квадратическое отклонение этих остатков – стандартные ошибки коэффициентов. Для определения степени значимости коэффициентов используется t-критерий. Для того чтобы иметь возможность их определить, нужно узнать оценки их дисперсий и, таким образом, средних квадратических отклонений. После можно проверить гипотезу относительно коэффициентов либо определить для них доверительные интервалы.

Оценки параметров уравнения парной линейной регрессии. Надежность полученных оценок коэффициентов, очевидно, зависит от дисперсии стохастической компоненты уравнения регрессии . Однако по данным выборки значений переменных модели дисперсия не может быть оценена, то при анализе надежности оценок коэффициентов регрессии используется дисперсия отклонений эмпирических значений переменной Y от рассчитанных на основе полученного уравнения: еi = Yi – a – bxi.

Для t-статистики проверяется гипотеза о равенстве ее нулю. t = 0 будет означать b = 0. При оценке коэффициента линейной регрессии можно использовать следующее грубое правило. Если стандартная ошибка коэффициента больше его модуля, то он не может быть признан «хорошим», значимым, поскольку доверительная вероятность при двусторонней альтернативной гипотезе составляет менее приблизительно 0,7. Если стандартная ошибка меньше модуля коэффициента, но больше его половины, то данная оценка коэффициента может рассматриваться как более или менее значимая Несомненно, определенную роль играет количество наблюдений: чем их больше, тем надежнее при прочих равных условиях выводы о наличии связи и тем меньше граница доверительного интервала для данного числа степеней свободы и уровня значимости.

Для осуществления проверки значимости оценок коэффициентов регрессии нужно решить, будет ли она односторонней или двусторонней. Выбор определяется теоретическим обоснованием модели связи зависимой и независимой переменных. При этом односторонняя проверка предполагает, что характер связи между X и Y однозначен: либо связь отрицательна, либо положительна, но не одновременно. При двусторонней проверке исходят из предположения, что связь между X и Y может быть как положительной, так и отрицательной.

С помощью рассчитанных стандартных отклонений и значений t-статистики можно определить доверительный интервал значений с заданной доверительной вероятностью. Предполагаемые значения будут находиться в рамках этого интервала, если же нет, то придется отвергнуть предположение, выдвинутое относительно величины: b – Sb• tкрит < b + Sb• tкрит, a – S• tкрит < a + S• tкрит

Как уже упоминалось ранее, коэффициенты a и b являются лишь оценками коэффициентов, представляют собой параметры линии регрессии для генеральной совокупности значений переменных X и Y, включающей все возможные их значения, а a и b являются параметрами регрессии для выборочной совокупности значений X и Y, которые непосредственно известны нам на основе некоторого числа наблюдений. Для другой выборки значений X и Y, возможно, будут найдены другие оценки, однако предполагается, что их значения будут варьироваться в пределах стандартных отклонений величин a и b. Если учесть, что не все выборочные значения Y лежат на линии регрессии Yi = a + bxi, то в это уравнение надо добавить выборочные случайные отклонения еi = Yi – a – bxi, аналогичные стохастической компоненте в генеральной совокупности: Yi = a + bxi + еi

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]