Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
13.67 Mб
Скачать

Факторный анализ

Цель факторного анализа заключается в понижении размерности пространства факторов. Понижение размерности необходимо в случаях, когда входные факторы коррелированы друг с другом, т.е. взаимозависимы. В факторном анализе речь идет о выделении из множества измеряемых характеристик объекта новых факторов, более адекватно отражающих свойства объекта.

Факторный анализ - метод многомерного статистического анализа, позволяющий на основе экспериментального наблюдения признаков объекта выделить группу переменных, определяющих корреляционную взаимосвязь между признаками. Например, при проведении элементного анализа предельных углеводородов можно отдельно измерять массовую долю углерода и массовую долю водорода - два признака. Однако, эти признаки не являются независимыми (коррелируют между собой) и оба определяются длиной углеродной цепи. В этом и состоит суть факторного анализа - на основе исследования корреляционных взаимосвязей признаков находить причины, определяющие эти взаимосвязи.

Поле может быть использовано в факторном анализе, если выполнено несколько условий:

  • оно имеет числовой тип данных;

  • в нем не содержатся пропуски;

  • стандартное отклонение столбца не равно нулю, то есть в столбце содержатся различные значения.

В противном случае, поле будет автоматически помечено как непригодное. Для понижения размерности пространства факторов необходимо наличие хотя бы двух входных полей.

Процесс заключается в отбрасывании некоторых факторов, которые в меньшей степени объясняют дисперсию результирующих факторов, а оставшиеся факторы в достаточной мере определяют дисперсию результирующих факторов.

Устранение незначащих факторов необходимо, когда входные факторы наименьшим образом коррелированы с выходным фактором и могут быть исключены из результирующего набора данных практически без потери полезной информации. Обязательно наличие хотя бы двух входных полей и одного выходного.

В обоих случаях, если степень корреляция между факторами меньше порога значимости, устанавливаемым аналитиком при работе с тем или иным алгоритмом, то такие факторы могут быть удалены из исходной выборки как незначащие.

Импортируем данные из файла «TestForCPP.txt» для обработки. Данный файл содержит столбцы: «Аргумент», «Фактор1», «Фактор2», «Фактор3», «Результат1» и «Результат2» – импортируем с параметрами по умолчанию.

Для этого выполним команду «Выделить узел «Текстовый файл (TestForPPP.txt)»/Щелкнуть левой кнопкой мыши на кнопку мастера импорта /Выбрать «Текстовый файл с разделителями»/Далее/Используя кнопку … открывать файл TestForCPP.txt/Далее/Далее. На 3-м шаге установим назначений: «Аргумент» – неиспользуемое, «Фактор1», «Фактор2», «Фактор3» – входные факторы (можно их выделить и сразу для всех назначить – входные факторы), «Результат1» и «Результат2» – выходные факторы. Выполним команду «Далее/ Пуск/ Далее/ Определите вид отображения – Диаграмма/Нажмите кнопку «Далее»/Выберите метки столбцов «Фактор1» – зельёный, «Фактор2» – синий, «Фактор3» – оранжевый, тип «Линии»/Далее/Готово. Получим:

Построим также диаграмм для результатов. Для этого выделим узел «Текстовый файл (TestForCPP.txt-Факторы)» и выполним предыдущую команду для построения диграмму для факторов, лишь с разницей тем, что вместо выбора меток столбцов выбираем метки результатов «Результат1» – цвет лимона и «Результат2» – бледно-синий. Получим:

Понижение размерности и устранение незначащих факторов

Выделим узел «Текстовый файл (TestForCPP.txt)» и нажмем кнопку – Мастер обработки. В мастере обработки выберём «Факторный анализ» и нажмем кнопку «Далее».

Установим назначений: «Аргумент» – неиспользуемое, «Фактор1», «Фактор2», «Фактор3» – входные факторы, «Результат1» и «Результат2» – неиспользуемое.

Выполним команду «Далее/ Пуск/ Далее».

На 4 шаге мастер предлагает установить настройки для «Устранения незначащих факторов», где нас все устраивает (порог значимости 90%).

Выполним команду «Далее/Выбрать способ отображение данных «Диаграмма» /Далее/Выбрать меток столбцов диаграммы «Фактор1», «Фактор2», тип «Линии»/Далее/Готово.

Получим:

Диаграмма позволяет нам оценить результаты мастера.

а) исходные входные факторы

б) полученные входные факторы

После обработки вместо трех входных факторов осталось два входных фактора «Фактор1» – красный и «Фактор2» – зельёный, что является результатом понижения размерности. На диаграмме видно, что фактор «Фактор2» близок к полю «Фактор3», соответственно, «Фактор1» – это преобразованные факторы «Фактор1» и «Фактор2».