Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы анализа.docx
Скачиваний:
0
Добавлен:
25.12.2019
Размер:
24.65 Кб
Скачать

Компонентный анализ

В ряде случаев исследователь, приступая к изучению некоторой проблемы, не знает, сколько влияющих факторов в конечном итоге окажется в разрабатываемой модели. Тогда на первоначальном этапе выбирается максимально возможное количество факторов, которые могут оказывать некоторое влияние на результирующий показатель. Одним из методов, позволяющих из множества факторов выявить только те, которые оказывают реальное влияние на результирующий показатель, является метод компонентного анализа. В компонентном анализе первоначальную систему из m факторов преобразуют в систему с новыми к факторами, причем к<m. Эта новая система факторов называется системой главных компонент. Все главные компоненты не коррелированны между собой и распределены в порядке убывания дисперсии. Смысл компонентного анализа заключается в приведении корреляционной матрицы к диагональному виду и определении неколлинеарных факторов среди всех первоначально выбранных. При этом находится вектор собственных значений и матрица собственных векторов исходной корреляционной матрицы. Собственные значения характеризуют вес каждого главного компонента.

Матрица, равная произведению матрицы собственных векторов на диагональную матрицу, на главной диагонали которой находятся числа, равные квадратному корню из соответствующего собственного числа, представляет собой матрицу факторных нагрузок, т.е. степени влияния каждого фактора на результирующий показатель. Алгоритм компонентного анализа состоит в следующем:

  • на первом этапе по исходным данным определяется корреляционная матрица;

  • для корреляционной матрицы рассчитываются собственные числа и собственные векторы. Собственные числа матрицы характеризуют вклады каждого фактора в суммарную дисперсию;

  • по найденным собственным векторам корреляционной матрицы и соответствующим собственным числам строится ортогональная матрица и нормированных векторов;

  • рассчитывается матрица факторных нагрузок.

Полученные главные компоненты удобны для расчета регрессионного уравнения, поскольку они являются ортогональными, а, следовательно, независимыми. Матрица факторных нагрузок позволяет выделить наиболее важные компоненты, оказывающие наибольшее влияние на результирующий показатель.

Поскольку задача нахождения собственных чисел и собственных векторов матрицы является довольно сложной с математической точки зрения, то желающие лучше изучить компонентный анализ должны обратиться к соответствующим материалам по высшей алгебре или статистике.

Дискриминантный анализ

Одним из самых распространенных методов статистического исследования является метод группировки. В соответствии с этим методом исходный материал, полученный в результате статистического исследования, разбивается на группы, однородные по какому-либо показателю. Разбиение исходного статистического материала на группы можно проводить либо в соответствии с некоторыми теоретическими представлениями, либо с помощью автоматических группировок: метода обучающих выборок (дискриминантный анализ) и без помощи обучающих выборок (кластерный анализ).

В качестве обучающих выборок выступают исходные группировки, в которых содержится статистический материал по тем элементам, для которых принадлежность к той или иной группе заранее известна.

Целью исследования в этом случае будет выборка произвольного объема, каждый элемент которой необходимо отнести к одной из обучающих выборок.

Алгоритм решения поставленной задачи следующий:

  • определяется вектор средних значений по каждой из обучающих выборок. Каждый элемент векторов средних значений рассчитывается по формуле «простой средней арифметической»;

  • по каждой из обучающих выборок рассчитываются ковариационные матрицы;

  • рассчитывается несмещенная оценка суммарной ковариационной матрицы;

  • находится матрица, обратная матрице несмещенной оценки, а также вектор оценки дискриминантной функции;

  • рассчитываются вектора оценки дискрименантной функции для обучающих выборок x и z;

  • рассчитываются средние значения компонентов векторов оценки дискриминантной функции для обучающих выборок x и z по формуле «простой средней арифметической»;

  • определяется граница дискриминации.

После проведенной подготовительной работы можно приступать к исследованию исходной статистической информации. Для того чтобы определить, к какой группе принадлежит то или иное наблюдение, из исходной статистической совокупности у необходимо вычислить дискриминантную оценку.

Если дискриминантная оценка больше границы дискриминации, то наблюдение принадлежит к первой выборке, а если меньше – ко второй.