- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
7.3. Нахождение коэффициентов характеристического уравнения
После вычисления рекуррентных соотношений (см. пункт 7.2) был найден характеристический полином (7.2.6), приравняем его к нулю, получим уравнение (7.3.1):
Pm(λ)= λm - P1 λm-1 - P2 λm-2 -…- Pm= 0(7.3.1)
Известно, что при m > 4(7.3.1) не имеет общего решения. Однако мы знаем, что это уравнение имеет все вещественные корни, и что их число равноm. Для их нахождения используется итерационный метод Ньютона, поскольку исследуемая функция – полином и нет затруднений в вычислении ее производной. Итерационная формула Ньютона дляi-й точки имеет вид:
, (7.3.2)
где j– номер итерации.
Далее в соответствии с (7.3.1) находим собственные векторы матрицы R.
Для решения систем уравнений применяется метод Гаусса. Однако предварительно необходимо исключить одно неизвестное. Для этого переменным umjприсваиваются единичные значения, последний столбец переносится в правую часть с обратным знаком, а последнее уравнение исключается из рассмотрения.
После получения матрицы собственных векторов Uбыло проведено ее нормирование, в результате чего была получена матрица нормированных собственных векторовV.
Затем вычисляется матрица факторного отображения Aв соответствии с правилами умножения матриц.
Далее находится матрица, обратная к A, методомm-кратного пересчета элементов по рекуррентным формулам (7.3.3.):
(7.3.3.)
где k– номер итерации,k=1..m.
На заключительном этапе A-1 = -A(k). После нахождения матрицы, обратнойA, находим матрицуF– матрицу факторного отображения и выводим ее на экран в транспонированном виде в соответствии с (7.2.10). На этом расчеты по методу главных компонент завершены.
Глава 8. Факторный анализ
В описанном выше методе главных компонент подразумевается, что пространство признаков можно отразить в линейной модели, которая соответствует новой координатной оси в данном пространстве с максимальной дисперсией распределения проекций исследуемых объектов.
Такой подход является продуктивным при сравнительно небольшом объеме группы признаков.
В отличие от метода главных компонент, факторный анализ основан не на дисперсионном критерии информативности системы признаков, а ориентирован на объяснение имеющихся между признаками корреляций.
Поэтому он применяется в более сложных случаях совместного проявления на структуре экспериментальных данных, сопоставимых по степени внутренней согласованности, а также для выделения группы диагностических показателей из общего исходного множества признаков.
8.1. Модель факторного анализа.
Основная модель факторного анализа записывается следующей системой равенств /Налимов В. В., 1971/
(8.1. )
Полагается, что значения каждого признака xi могут быть выражены взвешенной суммой переменных (простых факторов) fi, количество которых меньше числа исходных признаков, и остаточным членом εi с дисперсией σ2(εi), действующей только на xi. xi в этом случае называют специфическим фактором.
Коэффициенты lij называются нагрузкой i-й переменной на j-й фактор или нагрузкой j-го фактора на i-ю переменную.
В самой простой модели факторного анализа считается, что факторы fj взаимно независимы и их дисперсии равны единице, а случайные величины εi тоже независимы друг от друга и от какого-либо фактора fj. Максимально возможное количество факторов m при заданном числе признаков р определяется неравенством
(р+m)<(р—m)2,
которое должно выполняться, чтобы задача не вырождалась в тривиальную.
Данное неравенство получается на основании подсчета степеней свободы, имеющихся в задаче [Лоули Д. и др., 1967].
Сумму квадратов нагрузок в формуле основной модели факторного анализа называют общностью соответствующего признака xi и чем больше это значение, тем лучше описывается признак xi выделенными факторами fj.
Общность есть часть дисперсии признака, которую объясняют факторы. В свою очередь, ε2i показывает, какая часть дисперсии исходного признака остается необъясненной при используемом наборе факторов и данную величину называют специфичностью признака. Таким образом,
Основное соотношение факторного анализа показывает, что коэффициент корреляции любых двух признаков xi и хj можно выразить суммой произведения нагрузок некоррелированных факторов
Задачу факторного анализа нельзя решить однозначно. Равенства основной модели факторного анализа не поддаются непосредственной проверке, так как р исходных признаков задается через(р+m)других переменных — простых и специфических факторов.
Поэтому представление корреляционной матрицы факторами, как говорят, ее факторизацию, можно произвести бесконечно большим числом способов. Если удалось произвести факторизацию корреляционной матрицы с помощью некоторой матрицы факторных нагрузок F, то любое линейное ортогональное преобразованиеF(ортогональное вращение) приведет к такой же факторизации. [Налимов В.В., 1971]
Алгоритм машинной реализации факторного анализа[Александров В. В. и др., 1990]. можно представить в следующей укрупненной форме.
Вычисляются факторные нагрузки для m=1 (однофакторная модель)
Затем проверяется, насколько корреляционная матрица, восстановленная по однофакторной модели в соответствии с основным соотношением факторного анализа, отличается от корреляционной матрицы исходных данных.
Если однофакторная модель признается неудовлетворительной, то испытывается модель с m=2.
и т. д. до тех пор, пока при некотором m не будет достигнута адекватность или число факторов в модели не превысит максимально допустимое. В последнем случае говорят, чтоадекватной модели факторного анализа не существует.
Если факторная модель существует, то производится вращение полученной системы общих факторов, так как значения факторных нагрузок и нагрузок на факторы есть лишь одно из возможных решений основной модели.
В завершение всей процедуры факторного анализа с помощью математических преобразований выражают факторы fjчерез исходные признаки, то есть получают в явном виде параметры линейной диагностической модели.