- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
3.1.3. Предпосылки к проведению регрессионного анализа
1. Случайные ошибки наблюдений имеют нормальный закон распределения
2. Отсутствие автокорреляции между ошибками наблюдений, т.е. последовательные значения i не зависят друг от друга.
3.2. Метод наименьших квадратов
Для нахождения оценок параметров модели по результатам наблюдений используется метод наименьших квадратов (МНК). Пусть проведено n независимых наблюдений случайной величины Y при соответствующих значениях , совместный закон распределения которых неизвестен. Следовательно, теоретическую функцию регрессии мы не сможем найти. Наша задача оценить эмпирическую функцию регрессии
(3.2. 1.)
Согласно МНК, параметры подбираются таким образом, чтобы минимизировать сумму квадратов отклонений наблюдаемых значений от расчетных по модели значений
(3.2.2.)
где – наблюдаемые значения выходной переменной;– значения выходной переменной, рассчитанные по модели.
Из необходимых условий минимума
находим оценки параметров и(здесь и далее, если это не мешает пониманию, знак ~ над параметрами будет опускаться). Они будут определяться из решения системы двух линейных уравнений
Здесь и далее, если это не оговорено особо, суммирование происходит от i=1, …,n.
Оценки параметров, получаемые по методу МНК, при условии выполнения предпосылок относительно случайных ошибок наблюдений, будут обладать следующими свойствами:
несмещенность;
состоятельность;
эффективность.
3.2.1. Проверка адекватности модели
Для проверки гипотезы адекватности модели необходимо сравнить две суммы квадратов:
1) Остаточную сумму квадратов, характеризующую отклонение от регрессии
2) Сумму квадратов, обусловленную регрессией
где.
Тогда выборочное значение F, имеющее распределение Фишера
может служить проверкой адекватности для заданного уровня значимости (обычно для экономических задач=0,05) и степеней свободы f1= ;f2= , где– число оцениваемых параметров, исключая свободный коэффициент.
Если FF; f1; f2– модель адекватна.
Остаточную дисперсию ошибки можно использовать в качестве оценки дисперсии– дисперсии случайной величины. Результаты проверки адекватности удобно представить в виде таблицы (табл.3.1).
Полезной характеристикой линейной регрессии является коэффициент детерминации, вычисляемый по формуле
Т а б л и ц а 3.1
Источник изменения |
Сумма квадратов |
Число степеней свободы |
Оценка дисперсии |
Модель |
|
|
|
Ошибка |
|
|
|
Сумма |
|
|
|
Коэффициент детерминации равен той доле результатов наблюдений относительно горизонтальной прямой , которая объясняется уравнением регрессии. Величинаявляется оценкой множественного коэффициента корреляции между результатами наблюдений и вычисленными значениями.
Если R2=0.75 это значит, что модель работает на 75%, а 25% приходится на ошибку или неучтенные в модели факторы (для практических целей целесообразно, чтобы R2 0,75). Для небольших значений n<30 необходимо использовать скорректированный коэффициент детерминации:
3.2.2. Проверка значимости параметров модели
В результате проверки устанавливается статистическая значимость или не значимость отличия от нуля оценок параметров регрессии. Это проверка осуществляется отдельно для каждого параметра модели. Для оценки значимости коэффициентов регрессии можно воспользоваться следующим правилом, если абсолютная величина коэффициента регрессии больше доверительного интервала, то гипотеза о незначимости коэффициента отвергается
,
,
где – значение Стьюдента, определяемое по числу степеней свободыf= и=0,05,– среднеквадратические отклонения(с.к.о.) ошибок коэффициентов регрессии, для простой линейной регрессииони имеют вид:
Можно проверять значимость коэффициентов по t-критерию. Воспользуемся формулой
Вычисленное значение сравнивается с табличным значением и, если t tf; /2 , то коэффициент значим. В противном случае соответствующую переменную можно исключить из модели и все расчеты, включая решение системы линейных уравнений, повторить снова.