- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
4.2. Некоторые нелинейные модели, сводящиеся к линейным
Существуют два вида нелинейности регрессионных моделей. Нелинейные относительно независимых переменных, например,
(4.2.1.)
В этом случае необходимо просто сделать замену переменных:
(4.2.2.)
Нелинейные относительно параметров регрессии, например,
(4.2.3.)
Выполним функциональное преобразование:
(4.2.4.)
К сожалению, не всегда можно функциональными преобразованиями от нелинейных моделей перейти к линейным. Кроме того, нужно иметь в виду, что при вычислении параметров по методу МНК минимизируется сумма квадратов отклонений преобразованных, а не исходных данных.
4.3. Проверка предпосылок регрессионного анализа
1. Проверка нормальности закона распределения ошибок
Анализ ошибок проводится по следующей схеме. Предполагаем, что , тогда. Тогда, если модель правильна, то дисперсия остатков, характеризующая качество аппроксимации результатов наблюдений
(4.3.1.)
служит оценкой величины – дисперсии ошибок наблюдений, гдесреднее значение отклонений. Случайная величинапредставляет собой единичные нормальные отклонения. Если эти отклонения будут находиться в интервале [-2; 2] , то, следовательно, наше предположение о том, чтоне ошибочно.
Проверка на однородность случайных ошибок
Для проверки на однородность дисперсии D(ε)=const. Целесообразно воспользоваться методом Гольфельда. Последовательность значений случайной величины Y разбивается на две последовательности объемом n1 и n2(n1+n2=n). Для каждой последовательности вычисляются дисперсии воспроизводимости и . Тогда отношение
(4.3.2.)
при < будет иметь распределение Фишера со степенями свободы f1= ;
f2= . Если значение F превышает табличное, то гипотеза об однородности дисперсии отклоняется. Чувствительность критерия увеличивается, если исключить средние наблюдения.
В случае, если дисперсии оказались неоднородными, часто оказывается полезным изменение масштаба для выходной переменной. Вводится некоторая функция от выходной переменной, например или.
3. Проверка на автокорреляцию случайных ошибок
Наличие автокорреляции ошибок можно проверить с помощью критерия Дарбина -Уотсона:
(4.3.3.)
Критерий Дарбина - Уотсона изменяется в диапазоне 0 ≤ DW ≤ 4.При отсутствии автокорреляции DW=2. Нижние и верхние границы критерияdниdв для степеней свободыf1=n; f2=kследует выбирать из таблицы. Если0≤ DW ≤ dн, есть положительная автокорреляция, а4–dн ≤ DW ≤ 4, есть отрицательная автокорреляция, илиdв≤ DW ≤ 4–dв - автокорреляция отсутствует, еслиdн < DW < dвили4–dв ≤ DW ≤ 4–dн ,нужны дополнительные исследования.
Замечание.Желательно область неопределенности подключить к области отклонения гипотезы об отсутствии автокорреляции.
Подводя итог этому разделу, перечислим основные этапы решения задачи методом наименьших квадратов:
1 этап. Формулируем модель, т.е. вид зависимости параметра от факторов.
2 этап. Выбираем диапазон варьирования факторов (область плана эксперимента).
3 этап. В этой области выбираем экспериментальные точки, т.е. те значения уровней факторов, при которых ставится эксперимент. При этом желательно придерживаться следующих правил:
- обязательно делать опыты на границах варьирования факторов;
- обязательно делать опыты в центре плана (за исключением случая, когда мы уверены, что в модель входят только линейные по факторам члены, и это не нуждается в экспериментальной проверке);
- располагать экспериментальные точки симметрично относительно центра плана. В общем случае, имея в своем распоряжении ЭВМ, можно всегда подобрать набор экспериментальных точек, обеспечивающих максимальное значение определителя матрицы (AТA), что в свою очередь, минимизирует в совокупности [(AТA)-1]ii, при всех i.
Расчет по формулам даст правильные результаты и в том случае, если параметр не является нормально распределенной случайной величиной, т.к. при выводе этих формул такое предположение не иcпользовалось, а вот проверки значимости коэффициентов и адекватности модели при "не нормальном" распределении параметра выполнить нельзя, поскольку в этих проверках используются критерии, распределенные по законам, "производным от нормального.
4 этап. Проверяем значимость коэффициентов по t-критерию.
5 этап. Проверяем адекватность модели по F-критерию.