Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc
Скачиваний:
93
Добавлен:
28.03.2016
Размер:
1.95 Mб
Скачать

7.3. Нахождение коэффициентов характеристического уравнения

После вычисления рекуррентных соотношений (см. пункт 7.2) был найден характеристический полином (7.2.6), приравняем его к нулю, получим уравнение (7.3.1):

Pm(λ)= λm - P1 λm-1 - P2 λm-2 -…- Pm= 0(7.3.1)

Известно, что при m > 4(7.3.1) не имеет общего решения. Однако мы знаем, что это уравнение имеет все вещественные корни, и что их число равноm. Для их нахождения используется итерационный метод Ньютона, поскольку исследуемая функция – полином и нет затруднений в вычислении ее производной. Итерационная формула Ньютона дляi-й точки имеет вид:

, (7.3.2)

где j– номер итерации.

Далее в соответствии с (7.3.1) находим собственные векторы матрицы R.

Для решения систем уравнений применяется метод Гаусса. Однако предварительно необходимо исключить одно неизвестное. Для этого переменным umjприсваиваются единичные значения, последний столбец переносится в правую часть с обратным знаком, а последнее уравнение исключается из рассмотрения.

После получения матрицы собственных векторов Uбыло проведено ее нормирование, в результате чего была получена матрица нормированных собственных векторовV.

Затем вычисляется матрица факторного отображения Aв соответствии с правилами умножения матриц.

Далее находится матрица, обратная к A, методомm-кратного пересчета элементов по рекуррентным формулам (7.3.3.):

(7.3.3.)

где k– номер итерации,k=1..m.

На заключительном этапе A-1 = -A(k). После нахождения матрицы, обратнойA, находим матрицуF– матрицу факторного отображения и выводим ее на экран в транспонированном виде в соответствии с (7.2.10). На этом расчеты по методу главных компонент завершены.

Глава 8. Факторный анализ

В описанном выше методе главных компонент подразумевается, что пространство признаков можно отразить в линейной модели, которая соответствует новой координатной оси в данном пространстве с максимальной дисперсией распределения проекций исследуемых объектов.

Такой подход является продуктивным при сравнительно небольшом объеме группы признаков.

В отличие от метода главных компонент, факторный анализ основан не на дисперсионном критерии информативности системы признаков, а ориентирован на объяснение имеющихся между признаками корреляций.

Поэтому он применяется в более сложных случаях совместного проявления на структуре экспериментальных данных, сопоставимых по степени внутренней согласованности, а также для выделения группы диагностических показателей из общего исходного множества признаков.

8.1. Модель факторного анализа.

Основная модель факторного анализа записывается следующей системой равенств /Налимов В. В., 1971/

(8.1. )

Полагается, что значения каждого признака xi могут быть выражены взвешенной суммой переменных (простых факторов) fi, количество которых меньше числа исходных признаков, и остаточным членом εi с дисперсией σ2i), действующей только на xi. xi в этом случае называют специфическим фактором.

Коэффициенты lij называются нагрузкой i-й переменной на j-й фактор или нагрузкой j-го фактора на i-ю переменную.

В самой простой модели факторного анализа считается, что факторы fj взаимно независимы и их дисперсии равны единице, а случайные величины εi тоже независимы друг от друга и от какого-либо фактора fj. Максимально возможное количество факторов m при заданном числе признаков р определяется неравенством

(р+m)<(р—m)2,

которое должно выполняться, чтобы задача не вырождалась в тривиальную.

Данное неравенство получается на основании подсчета степеней свободы, имеющихся в задаче [Лоули Д. и др., 1967].

Сумму квадратов нагрузок в формуле основной модели факторного анализа называют общностью соответствующего признака xi и чем больше это значение, тем лучше описывается признак xi выделенными факторами fj.

Общность есть часть дисперсии признака, которую объясняют факторы. В свою очередь, ε2i показывает, какая часть дисперсии исходного признака остается необъясненной при используемом наборе факторов и данную величину называют специфичностью признака. Таким образом,

Основное соотношение факторного анализа показывает, что коэффициент корреляции любых двух признаков xi и хj можно выразить суммой произведения нагрузок некоррелированных факторов

Задачу факторного анализа нельзя решить однозначно. Равенства основной модели факторного анализа не поддаются непосредственной проверке, так как р исходных признаков задается через(р+m)других переменных — простых и специфических факторов.

Поэтому представление корреляционной матрицы факторами, как говорят, ее факторизацию, можно произвести бесконечно большим числом способов. Если удалось произвести факторизацию корреляционной матрицы с помощью некоторой матрицы факторных нагрузок F, то любое линейное ортогональное преобразованиеF(ортогональное вращение) приведет к такой же факторизации. [Налимов В.В., 1971]

Алгоритм машинной реализации факторного анализа[Александров В. В. и др., 1990]. можно представить в следующей укрупненной форме.

  1. Вычисляются факторные нагрузки для m=1 (однофакторная модель)

  2. Затем проверяется, насколько корреляционная матрица, восстановленная по однофакторной модели в соответствии с основным соотношением факторного анализа, отличается от корреляционной матрицы исходных данных.

  3. Если однофакторная модель признается неудовлетворительной, то испытывается модель с m=2.

  4. и т. д. до тех пор, пока при некотором m не будет достигнута адекватность или число факторов в модели не превысит максимально допустимое. В последнем случае говорят, чтоадекватной модели факторного анализа не существует.

  5. Если факторная модель существует, то производится вращение полученной системы общих факторов, так как значения факторных нагрузок и нагрузок на факторы есть лишь одно из возможных решений основной модели.

  6. В завершение всей процедуры факторного анализа с помощью математических преобразований выражают факторы fjчерез исходные признаки, то есть получают в явном виде параметры линейной диагностической модели.