Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
posobie_(informacionnye_sistemy)_s_oglavleniem.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
3.04 Mб
Скачать

2. Обработка многомерных данных.

Производится обработка полной матрицы исходных данных с учетом взаимосвязи между признаками (исследуется каждый объект по всем признакам).

Методы многомерного статистического анализа: характеристика возможностей и сферы применения

В многомерном статистическом анализе образовалось несколько взаимосвязанных направлений или разделов:

- корреляционный анализ;

- регрессионный анализ;

- дисперсионный анализ;

- дискриминантный анализ;

- факторный анализ;

- кластерный анализ.

Корреляционный анализ изучает взаимосвязи между двумя или несколькими признаками. При этом устанавливается не только наличие связей, но и их теснота и направление. Инструментами корреляционного анализа являются коэффициенты корреляции: парные, частные, множественные, канонические.

Регрессионный анализ – основной целью ставит формирование зависимости между результативными и факторными признаками, т.е. составление уравнения регрессии и оценку его параметров.

Регрессионные зависимости могут быть:

- одномерные,

- многомерные,

- линейные,

- нелинейные,

- гребеночные.

Дисперсионный анализ позволяет исследовать влияние номинальных (качественных) признаков на результативные показатели; а также используется для проверки статистических гипотез в регрессионном анализе.

Факторный анализ. Если число влияющих признаков невелико (5-7), то для описания связи и исследования зависимости между ними и результативным признаком используется кореляционно-регрессионный анализ, а если число признаков больше, эту же задачу выполняет факторный анализ.

При этом влияющие признаки группируются в обобщающие факторы, которые в достаточной степени объясняют изменение изучаемого результативного признака. Таким образом, задача факторного анализа - заменить набор наблюдаемых признаков на меньшее число влияющих факторов, являющихся комбинацией исходных признаков. В основе этого метода лежит следующая гипотеза: измеряемые признаки являются лишь косвенными характеристиками изучаемого объекта, а на самом деле, существуют внутренние или скрытые свойства (факторы), число которых невелико, но которые объясняют поведение объекта. Основная цель факторного анализа – выявить скрытые факторы и установить зависимость между ними и результативным признаком.

Пример: Уровень производительности труда зависит от большого числа признаков: квалификации работников, фондовооруженности труда, возраста оборудования, среднемесячной заработной платы и т.д. (до 40 признаков). С помощью факторного анализа удалось обнаружить, что решающее воздействие на производительность труда оказывают лишь несколько обобщающих факторов (например, размер предприятия, уровень организации труда), которые непосредственно не наблюдаются при исследовании.

Дискриминантный анализ: этот метод наряду с кластерным анализом позволяет проводить классификацию исследуемых объектов, т.е. разделять исследуемую совокупность на однородные группы. Классификация с использованием предварительных сведений («обучение с учителем»)- дискриминантный анализ, а без них («обучение без учителя») - кластерный анализ. При этом в дискриминантном анализе количество групп устанавливается заранее, и надо найти лишь разделяемую плоскость между ними. Для этого в исследование включается большое число переменных с целью определения тех из них, которые наилучшим образом разделяют совокупность объектов на однородные группы.

Например, при помощи дискриминантного анализа все страны мира можно разделить на 3 группы по уровню их человеческого развития – страны с высоким, средним и низким уровнем человеческого развития.

Кластерный анализ ставит задачу формирования классификатора на основе сочетания ряда признаков и проведения самой группировки объектов наблюдения, при этом количество групп и их состав заранее неизвестны. Объекты социально-трудовой сферы по своим количественным и качественным характеристикам разбиваются на группы (кластеры) так, чтобы каждый объект принадлежал только одной группе и чтобы объекты, входящие в одну группу, были максимально схожи по ряду признаков. Решение задачи кластерного анализа - это определение меры, при помощи которой один объект может быть отделен от другого или соединен с ним.

Например, при помощи процедур кластерного анализа можно провести разделение всех стран на группы по уровню жизни населения с использованием достаточно большого числа индикаторов уровня жизни.