- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
3.3. Описание типового примера. Алгоритм построения регрессионной модели.
В табл. 3.2 приведены значения выходной переменной при данном значении входной переменной. Модель ищется в виде.
Т а б л и ц а 3.2
X |
1 |
2 |
3 |
4 |
Y |
2 |
4 |
5 |
7 |
Шаг 1. Вычислим оценки математических ожиданий, смещенные и несмещенные оценки дисперсий и среднеквадратических отклонений.
Оценки математических ожиданий:
Несмещенные оценки дисперсий:
Несмещенные оценки среднеквадратических отклонений:
Шаг 2.Определим модель. Вычислим соответствующие суммы и составим систему двух линейных уравнений:
xi=10,yi=18,xi2=30,xiyi=53,yi2=94,
, решая которую, получаем: = 0,5,=1,6. Модель имеет вид
Шаг 3.Рассчитаем модельные (теоретические) значения, подставляя в уравнение значения входной переменной (табл.3.3).
Т а б л и ц а 3.3.
-
2,1
3,7
5,3
6,9
Шаг 4.Определим адекватность модели, для этого вычислим общую сумму квадратов, сумму квадратов, относящуюся к регрессии, и сумму квадратов остатков:
;
Qe=ei2=(2–2,1)2+(4–3,7)2+(5–5,3)2+(7–6,9)2=0,02 .
Для проверки полученных расчетов необходимо, чтобы В нашем случае равенство выполняется. Расчетное значение критерия Фишера вычисляется по формуле и равно:
Расчетное значение критерия Фишера больше, чем табличное значение, т. е.
F>FТАБЛ.=F0,05;1;2=18,512,
следовательно, модель адекватна. Это означает, что исходные данные хорошо согласуются с моделью.
Шаг 5. Оперативно адекватность модели можно проверить по коэффициентам детерминации или корреляции.
Коэффициент детерминации, скорректированный коэффициент детерминации и коэффициент корреляции определяются следующим образом:
.
Полученное значение коэффициента детерминации больше, чем 0,75 следовательно, модель можно считать адекватной.
Шаг 6.Определим значимость параметров модели. Вычислим среднеквадратические отклонения ошибок коэффициентов регрессии:
;
Табличное значение Стьюдента t2;0,025=4,303. Получаем расчетные значения Стьюдентов:
=0,5/0,387=1,291;=1,6/0,141=11,31.
Вывод 1.Параметрбудет значим, так для него расчетное значение Стьюдента будет больше, чем табличное, параметр– незначим, так для него расчетное значение Стьюдента будет меньше, чем табличное,
Аналогичный вывод можно сделать иначе, вычисляя доверительные интервалы для параметров модели:
=0,54,303·0,387 = 0,51,665;
= 1,64,303·0,141 = 1,60,607.
Так как абсолютное значение параметра будет больше, чем его доверительный интервал, то параметр значим. Параметрнезначим.
Оценка среднеквадратического отклонения ошибки . Разделив все отклонения (остатки) на эту величину, получим нормированные отклонения, которые все находятся в интервале [-2; +2] (табл. 3.4).
Вывод 2.Первая предпосылка выполняется, случайная ошибка имеет нормальный закон распределения с нулевым математическим ожиданием.
Критерий Дарбина -Уотсона вычисляем следующим образом:
DW = ((0,3+0,1)2+(–0,3–0,3)2+(0,1+0,3)2) / 0,2=3,4 ;
4-dв < DW< 4 (dВпримерно равно 1,5 (прил.3)).
Вывод 3.Вторая предпосылка не выполняется, между текущими значениями случайной величины присутствует отрицательная автокорреляция.
В завершении работы приведем итоговую таблицу остатков (табл.3.4).
Т а б л и ц а 3.4
N/N |
Значение Y |
Оценка Y |
Остаток |
Нормированные остатки |
1 2 3 4 |
2 4 5 7 |
2,1 3,7 5,3 6,9 |
–0,1 0,3 –0,3 0,1 |
–0,316 0,948 –0,948 0,316 |