- •Тезисы лекций
- •Тема 1 Статистический и регрессионный анализ
- •1. Прогнозирование в экономике и его информационное обеспечение.
- •3.Доверительные области. Доверительные интервалы для зависимой переменной.
- •4. Теория моментов.
- •5. Корреляционно-регрессионный анализ
- •6.Использование модели множественной линейной регрессии для прогнозирования экономических показателей.
- •Тема 2 Анализ временных рядов
- •3. Моделирование сезонных и циклических колебаний
- •Тема 3 Прогнозирование временных рядов.
- •Меры и модели волатильности
- •Визуализация Волатильности в Логарифмической шкале
- •Дефляция (понижение) ожидаемой доходности
- •Скрытые предположения
- •Восходящая волатильность против нисходящей
- •Тема 4 Многомерный статистический анализ.
Тезисы лекций
Тема 1 Статистический и регрессионный анализ
Цель: Сформировать знания о сущности, роли, значении и области применения статистического и корреляционно-регрессионного анализа.
План:
1. Прогнозирование в экономике и его информационное обеспечение.
2.Предварительный анализ данных. Теория статистического оценивания. Теория статистической проверки гипотез.
3. Доверительные области. Доверительные интервалы для зависимой переменной.
4. Теория моментов.
5. Корреляционно-регрессионный анализ.
6.Использование модели множественной линейной регрессии для прогнозирования экономических показателей.
1. Прогнозирование в экономике и его информационное обеспечение.
Прогнозирование в экономике это вид управленческой деятельности. Целью прогнозирования является описание будущего состояния экономической системы в целом или отдельных ее частей в соответствии со стоящими задачами. В строгом понимании прогноз – это научный анализ возможного будущего, построение, исследование и оценка вариантов развития экономической системы. Он предполагает внесение строгого порядка в имеющуюся информацию об экономической системе в соответствии с достаточно ясно сформулированными целями прогнозирования.
Для уяснения сущности прогнозирования необходимо сравнение с планированием. Если планирование конкретно, т.е. выполняет нормативные (предписывающие) функции, то прогнозирование – дескриптивно (описательно).
Прогноз также как и планирование может быть краткосрочным (до 3 лет), среднесрочным (5-7 лет) и долгосрочным (свыше 10 лет). Следовательно, прогноз может составляться и сопутствовать соответствующему плану. В таком случае он может оценивать вероятность выполнения плана.
Результаты такого прогнозирования служит основой для разработки перспективных планов на следующий будущий период времени.
Особенностью прогнозов на длительную перспективу является формирование возможных вариантов развития экономических систем, снабженных содержательным описанием и набором количественных показателей. Систему содержательных предпосылок, на основе которых формируются варианты прогнозов, называются сценариями.
Для разработки прогноза необходима информация. Информация может быть детерминированной и вероятностной. Причемб она может быть получена в результате планирования и прогнозирования.
Естественно, что качество информации является одним из важных факторов в разработке прогноза. Качество информации непосредственно связано с достоверностью, оперативностью получения информации и научной обоснованностью. В современных условиях это достигается за счет использования информационных и компьютерных технологий и математико-статистических методов и моделей. В свою очередь последнее возможно при наличии современной компьютерной и организационной техники, наличии вычислительных сетей и возможностей использования Интернета, технических и программных средств накопления, обработки, хранения, использования и передачи информации, телекоммуникационных связей. Большое значение имеют базы и банки данных. Понятно, что качество прогноза тем выше, чем более качественнее и больше массивы необходимой информации, чем больше возможности по оперативному поиску, получению, передаче, обработке, анализу и использованию научно-обоснованной информации.
Особое место среди факторов, повышающих качество прогнозов, занимают математико-статистические методы и модели.
2. Теория статистического оценивания. Теория статистической проверки гипотез.
Теория статистического оценивания неизвестных значений параметров или функций разрабатывает математические методы и приемы, с помощью которых на основании исходных статистических данных можно вычислить как можно более точные приближенные значения (статистические оценки) для одного или нескольких числовых параметров или функций, характеризующих функционирование исследуемой системы.
Статистическая оценка строится в виде функции от результатов наблюдений и сама является величиной случайной.
В
качестве основной меры точности
статистической оценки неизвестного
параметра Х чаще всего используется
средний квадрат ее отклонения от
оцениваемого значения
,
а в многомерном случае – ковариационная
матрица компонент векторной оценки
(ковариационная матрица – это матрица,
образованная из попарных ковариаций
случайных величин). Для К-мерного
случайного вектора Х=(x1,
x2,
…, xk)
ковариационная матрица – это квадратная
матрица с компонентами: dij
= E[(xi
– Exi)
(xj-Exj)].
На главной диагонали ковариационной
матрицы находится дисперсии величин
xi:di=Dхi.
Ковариационная матрица является
симметричной, т.е. dij
= dji
и неотрицательно определенной). Чем
меньше
,
тем точнее (эффективнее) оценка. Для
широкого класса генеральных совокупностей
существует неравенство Рао-Крамера-Фреше,
задающее тот минимум
(по
всем возможным оценкам) среднего квадрата
,
улучшить который невозможно.
используется в качестве начальной точки
отсчета меры эффективности оценки,
определив эффективность
любой оценки
параметра
в виде отношения:
(1.2.1)
Свойство состоятельности оценки обеспечивает ее статистическую устойчивость, т.е. сходимость (по вероятности) к истинному значению оцениваемого параметра по мере роста объема выборки, на основании которой эта оценка строится.
С
учетом случайной природы каждого
конкретного оценочного значения
неизвестного параметра
представляет интерес построение целых
интервалов оценочных значений
,
а в многомерном случае – целых областей,
которые с наперед заданной (и близкой
к единице) вероятностью р накрывали бы
истинное значение оцениваемого параметра
,
т.е.
.
Эти интервалы (области) принято называть
доверительными или интервальными
оценками.
Существует два подхода к построению интервальных оценок: точный (конструктивно реализуемый лишь в сравнительно узком классе ситуаций) и асимптотически-приближенный (наиболее распространенный в практике статистических приложений).
Основными методами статистических оценок являются: метод максимального правдоподобия; метод моментов; метод наименьших квадратов; метод, использующий взвешивание наблюдений – цензурирование, урезание, порядковые статистики. Различные варианты метода, использующего и взвешивание наблюдений находят все большее распространение в связи с устойчивостью получаемых при этом статистических выводов по отношению к возможным отклонениям реального распределения исследуемой генеральной совокупности от постулируемого модельного.
Теория статистической проверки гипотез исследует процедуры сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися выборочными данными.
Результат сравнения может быть отрицательным, т.е. данные наблюдения противоречат высказанной гипотезе и тогда от нее нужно отказаться либо неотрицательным, т.е. данные наблюдения не противоречат высказанной гипотезе и тогда ее можно принять в качестве допустимого решения.
По своему прикладному содержанию, высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов:
1. Гипотезы о типе закона распределения исследуемой случайной величины. Проверка гипотез этого типа осуществляется с помощью так называемого согласия критериев и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения F(x) и гипотетическим модельным законом Fmod(x).
2. Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей. Например, если имеется несколько «порций» выборочных данных:
1-я: х11, х12, …, х1n
2-я: х21, х22, …, х2n
то
говорят, что соответствующие выборочные
характеристики: Fi(x)
– вероятностный закон, которому
подчиняются наблюдения выборки; аi
– средние значения;
- дисперсия и т.д. различаются
статистически незначительно, т.е.:
(1.2.2)
(1.2.3)
(1.2.4)
3. Гипотезы о числовых значениях параметров исследуемой генеральной совокупности.
Например, если а0 – номинальное значение исследуемого параметра. Каждое отдельное значение об этом параметре хi может отклоняться от него. Чтобы проверить исследуемое явление, например, точность настройки станка на обработку определенной детали, необходимо убедиться, что среднее значение исследуемого параметра у производимых на станке деталей будет соответствовать номиналу, т.е. проверить гипотезу:
Н : Еу = аi, где у – исследуемая случайная величина.
4. Гипотезы о типе зависимости между компонентами исследуемого многомерного признака.
Подобно тому как при исследовании закона распределения обрабатываемых наблюдений бывает важно правильно подобрать соответствующий модельный закон, так при исследовании статистической зависимости, например, х2 от х1 анализируемого двумерного признака х=(х1, х2) бывает важно проверить гипотезу об общем виде этой зависимости. Например, гипотезу о том, что х2 и х1 связаны линейной регрессионной связью, т.е.:
Н : Е(х2 | х1 =х) = а0 + а1х, (1.2.5)
где: а0 и а1 - некоторые неизвестные параметры модели.
Статистические критерии, с помощью которых проверяются гипотезы этого типа, часто называют критериями адекватности. По своему назначению и характеру решаемых задач они чрезвычайно разнообразны, но строятся они по одной логической схеме.
Если проверяемое предположительное утверждение сводится к гипотезе о том, что значение некоторого параметра х в точности равно заданной величине х0, то эта гипотеза называется простой, в других случаях гипотеза называется сложной.
