Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ргр анализ данных. Зыкова.doc
Скачиваний:
65
Добавлен:
03.05.2015
Размер:
1.46 Mб
Скачать

Дендрограмма, построенная методом полной связи Дендрограмма, построенная методом Варда

Рассмотрим дендрограмму, построенную методом Варда, так как часто именно он дает довольно компактные и хорошо разделенные кластеры:

На дендрограмме, построенной методом Варда выделились 3 группы, как и в первом периоде, схожих между собой по потребности в работниках, заявленной организациями в государственные учреждения службы занятости населения.

Первая группа включает в себя, Оренбургскую, Самарскую, Кировскую области, Чувашскую республику, Удмуртскую республику.

Вторая –, Ульяновскую, Пензенскую области, , Республику Мордовию и Республику Марий Эл.

Третья состоит из Саратовской и Нижегородской областей, а также республик Татарстан и Башкортостан, Пермский край

Метод k-средних

При использовании метода k-средних, мы также имеем 3 кластера, которые получили при использовании иерархических методов.

Элементы 1 кластера

Элементы 2 кластера

Элементы 3 кластера

По полученным данным, можно судить в промежутке от 2006 до 2009 года произошли изменения в потребности в работниках в регионах.

Чтобы посмотреть различия в полученных кластерах, построим график средних, сравним средние кластеров и евклидовы расстояния:

График средних

Из графика видно, что для данного периода наивысшая потребность в работниках приходится на кластер №3. Пиковой ситуация была 2009 году. Тогда, потребность в работниках была приблизительно равна 150 человек. Меньше всего в работниках нуждались регионы кластер №2. Здесь ситуация относительно стабильная.

График строился по средним кластерным и евклидовым расстояниям, которые представлены на рисунках:

Средние кластеров

Евклидовые расстояния

По данным евклидовых расстояний, представленным на рисунке можно наблюдать насколько далеко друг от друга расположены кластеры.

3.3. Вывод

Сравнивая регионы по потребности в работниках, заявленной организациями в государственные учреждения службы занятости населения в 1995-2005 г.г и 2006-2009г.г можно сказать , что разбиение идет на одинаковое количество кластеров.

Сравнивая значения средних кластеров двух временных периодов можно отметить острую нехватку работников в организациях в 2009 году для Саратовской и Нижегородской областей, а также республик Татарстан и Башкортостан. Но в последующие годы наблюдается постепенное уменьшение данной нехватки. Возможно, были приняты меры по решению данного вопроса. Также можно заметить, что у всех регионов трех кластеров в этот период наблюдался рост данной потребности.

Сравнив графики двух данных периодов можно заметить, что Самарская область в обоих случаях попадает в кластеры с наименьшей потребностью в работниках. Следовательно, за период в 14 лет у данного региона не было проблемы в найме кадров в организации.

Средние значения кластеров по регионам во временных, чем средние показатели по ПФО в этих же периодах. Это объясняется суммированием регионов ПФО.

На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, возникает вопрос, как следует определить расстояния между кластерами?

Сравним кластеры со средним значением данного показателя по Приволжскому Федеральному округу.

Таблица 9

Средние значения Приволжского Федерального округа

1995

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

ПФО

1377

1543

1306

1199

1180

1217

1152

1028

969

1010

1385

В 2009 году среднее по ПФО было значение превышает средние по первому и второму кластерам, но меньше чем среднее кластера №3. Из этого следует, что регионы входящие в этот кластер имели показатели больше среднего по ПФО. Средние кластеров №1 и №2 ниже чем средние показатели по ПФО. Больше аналогичных ситуаций за данный период не наблюдалось.