
- •1. Сущность профессионального отбора
- •2. Анализ методов профессионального отбора
- •3. Требования к методикам, принципы и эффективность методов профессионального отбора
- •4. Этапы профессионального отбора
- •5. Рекомендации по проведению профессионального отбора в металлургии
- •6. Методика определения профессиональной пригодности основных специальностей прокатного производства
- •7. Описание метода кластерного анализа
- •8. Последовательность работы в программе «Statistica 5.5» для определения класса профессиональной пригодности мастера
- •Методика определения скорости переключения внимания (пв)
- •Корректурная проба
- •Метод воспроизведения фигур
- •Методика «Память на числа»
- •Тест механической понятливости Беннета
- •Тест р. Кэттелла (сокращенный) (факторы «а», «в», «с», «g», «l» и «q2»)
- •Методика межличностных отношений т. Лири
8. Последовательность работы в программе «Statistica 5.5» для определения класса профессиональной пригодности мастера
Реализация кластерного анализа производится в пакете прикладных программ «Statistica». Процесс анализа данных с помощью системы «Statistica» включает следующие этапы:
ввод данных в систему;
преобразование данных, адекватное выбранным статистическим методам;
визуализация данных с помощью различных типов графиков;
реализация алгоритма статистического метода;
вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;
интерпретация полученных результатов.
Проведение кластерного анализа в системе «Statistica» описывается в соответствии с этими этапами.
Ниже рассмотрен пример обработки данных и определения профессиональной пригодности мастера с помощью кластерного анализа в программе «Statistica 5.5».
Пример: Проведение кластерного анализа для обработки результатов тестирования мастеров прокатного производства.
1. После проведения тестирования составляют таблицу, с занесением в нее информации о результатах тестирования (табл. 4). Первоначально первые строки заполняются как эталонные с определением класса профессиональной пригодности. Эти строки содержат несколько значений - минимальный, максимальные, промежуточные, с учетом допущения отклонений по данному кластеру.
Таблица 4
Исходные данные
Испытуемый |
Результаты тестов |
|||||||
Х4 |
Х6 |
Х7 |
Х8 |
Х9 |
Х11 |
Х12 |
Среднее значение |
|
1 Совершенно пригодные |
12 |
8 |
12 |
8 |
5 |
12 |
12 |
9,857 |
2 Совершенно пригодные |
11 |
7 |
11 |
7 |
4 |
11 |
11 |
8,857 |
3 Совершенно пригодные |
10 |
6 |
10 |
6 |
3 |
10 |
10 |
7,857 |
4 Совершенно пригодные |
9 |
6 |
9 |
6 |
2 |
9 |
9 |
7,143 |
Пригодные |
8 |
6 |
8 |
6 |
1 |
8 |
8 |
6,429 |
1 Условно пригодные |
7 |
5 |
7 |
5 |
6 |
7 |
7 |
6,286 |
2 Условно пригодные |
8 |
5 |
7 |
9 |
6 |
7 |
7 |
7,000 |
3 Условно пригодные |
8 |
5 |
7 |
5 |
6 |
7 |
7 |
6,429 |
1 Не пригодные |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4,000 |
Продолжение табл. 4
Испытуемый |
Результаты тестов |
|||||||
Х4 |
Х6 |
Х7 |
Х8 |
Х9 |
Х11 |
Х12 |
Среднее значение |
|
2 Не пригодный |
4 |
4 |
4 |
12 |
4 |
4 |
4 |
5,143 |
3 Не пригодные |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1,000 |
Испытуемый № 1 |
4 |
1 |
2 |
1 |
7 |
10 |
11 |
5,143 |
Испытуемый № 2 |
3 |
6 |
4 |
4 |
7 |
1 |
3 |
4,000 |
Испытуемый № 3 |
6 |
3 |
2 |
1 |
3 |
6 |
1 |
3,143 |
Испытуемый № 4 |
1 |
8 |
1 |
11 |
1 |
3 |
4 |
4,143 |
Испытуемый № 5 |
1 |
3 |
7 |
1 |
3 |
5 |
9 |
4,143 |
Испытуемый № 6 |
1 |
4 |
7 |
8 |
5 |
11 |
5 |
5,857 |
Испытуемый № 7 |
6 |
7 |
11 |
3 |
8 |
4 |
8 |
6,714 |
Испытуемый № 8 |
9 |
7 |
8 |
4 |
10 |
6 |
4 |
6,857 |
Испытуемый № 9 |
7 |
4 |
8 |
8 |
2 |
3 |
0 |
4,571 |
Испытуемый № 10 |
4 |
7 |
5 |
11 |
4 |
1 |
8 |
5,714 |
Испытуемый № 11 |
12 |
8 |
11 |
9 |
5 |
7 |
6 |
8,286 |
Испытуемый № 12 |
7 |
8 |
1 |
12 |
6 |
8 |
1 |
6,143 |
Испытуемый № 13 |
6 |
1 |
11 |
8 |
5 |
8 |
9 |
6,857 |
Испытуемый № 14 |
10 |
3 |
5 |
2 |
2 |
2 |
8 |
4,571 |
Испытуемый № 15 |
12 |
4 |
9 |
6 |
3 |
9 |
9 |
7,429 |
Испытуемый № 16 |
4 |
6 |
9 |
9 |
3 |
3 |
10 |
6,286 |
Испытуемый № 17 |
6 |
2 |
9 |
1 |
8 |
7 |
9 |
6,000 |
Испытуемый № 18 |
1 |
8 |
2 |
10 |
10 |
11 |
2 |
6,286 |
Испытуемый № 19 |
7 |
3 |
4 |
3 |
11 |
1 |
7 |
5,143 |
Испытуемый № 20 |
8 |
2 |
6 |
8 |
3 |
5 |
12 |
6,286 |
2. В связи с тем, что данные представлены в несопоставимых единицах, конечные результаты будут искажены из-за различных абсолютных значений. Для того, чтобы избежать этого, исходные данные нормируют. В программе «Statistica 5.5» для осуществления этой операции нужно вызвать модуль «Data Management», в нем вызвать строку «Standartize variables». После указания переменных для нормировки (нажатие кнопки «Select All» (выбрать все)) в открывшемся окне «Variables» появляется таблица с нормируемыми данными (табл. 5). Нормирование производится способом деление центрированной величины на среднее квадратическое отклонение.
Таблица 5
Нормированные данные
Испытуемый |
Результаты тестов |
|||||||
Х4 |
Х6 |
Х7 |
Х8 |
Х9 |
Х11 |
Х12 |
Среднее значение |
|
1 Совершенно пригодные |
1,65 |
1,37 |
1,63 |
0,55 |
0,08 |
1,75 |
1,55 |
2,235 |
2 Совершенно пригодные |
1,35 |
0,93 |
1,34 |
0,26 |
-0,29 |
1,45 |
1,26 |
1,667 |
3 Совершенно пригодные |
1,06 |
0,49 |
1,04 |
-0,03 |
-0,66 |
1,15 |
0,97 |
1,099 |
4 Совершенно пригодные |
0,77 |
0,49 |
0,74 |
-0,03 |
-1,03 |
0,85 |
0,68 |
0,693 |
Пригодные |
0,48 |
0,49 |
0,44 |
-0,03 |
-1,40 |
0,55 |
0,39 |
0,287 |
1 Условно пригодные |
0,19 |
0,04 |
0,14 |
-0,32 |
0,46 |
0,25 |
0,10 |
0,206 |
2 Условно пригодные |
0,48 |
0,04 |
0,14 |
0,84 |
0,46 |
0,25 |
0,10 |
0,612 |
3 Условно пригодные |
0,48 |
0,04 |
0,14 |
-0,32 |
0,46 |
0,25 |
0,10 |
0,287 |
1 Не пригодные |
-0,69 |
-0,40 |
-0,75 |
-0,61 |
-0,29 |
-0,65 |
-0,76 |
-1,095 |
2 Не пригодный |
-0,69 |
-0,40 |
-0,75 |
1,71 |
-0,29 |
-0,65 |
-0,76 |
-0,442 |
3 Не пригодные |
-1,56 |
-1,73 |
-1,64 |
-1,47 |
-1,40 |
-1,55 |
-1,63 |
-2,795 |
Испытуемый № 1 |
-0,69 |
-1,73 |
-1,35 |
-1,47 |
0,83 |
1,15 |
1,26 |
-0,442 |
Испытуемый № 2 |
-0,98 |
0,48 |
-0,75 |
-0,61 |
0,83 |
-1,55 |
-1,05 |
-1,091 |
Испытуемый № 3 |
-0,10 |
-0,84 |
-1,35 |
-1,47 |
-0,66 |
-0,05 |
-1,63 |
-1,578 |
Испытуемый № 4 |
-1,56 |
1,37 |
-1,64 |
1,42 |
-1,40 |
-0,95 |
-0,76 |
-1,010 |
Испытуемый № 5 |
-1,56 |
-0,84 |
0,14 |
-1,47 |
-0,66 |
-0,35 |
0,68 |
-1,010 |
Испытуемый № 6 |
-1,56 |
-0,40 |
0,14 |
0,55 |
0,08 |
1,45 |
-0,48 |
-0,036 |
Испытуемый № 7 |
-0,10 |
0,93 |
1,34 |
-0,90 |
1,20 |
-0,65 |
0,39 |
0,450 |
Испытуемый № 8 |
0,77 |
0,93 |
0,44 |
-0,61 |
1,94 |
-0,05 |
-0,76 |
0,531 |
Испытуемый № 9 |
0,19 |
-0,40 |
0,44 |
0,55 |
-1,03 |
-0,95 |
-1,92 |
-0,766 |
Испытуемый № 10 |
-0,69 |
0,93 |
-0,45 |
1,42 |
-0,29 |
-1,55 |
0,39 |
-0,117 |
Испытуемый № 11 |
1,65 |
1,37 |
1,34 |
0,84 |
0,08 |
0,25 |
-0,19 |
1,342 |
Испытуемый № 12 |
0,19 |
1,37 |
-1,64 |
1,71 |
0,46 |
0,55 |
-1,63 |
0,125 |
Испытуемый № 13 |
-0,10 |
-1,73 |
1,34 |
0,55 |
0,08 |
0,55 |
0,68 |
0,531 |
Испытуемый № 14 |
1,06 |
-0,84 |
-0,45 |
-1,18 |
-1,03 |
-1,25 |
0,39 |
-0,766 |
Испытуемый № 15 |
1,65 |
-0,40 |
0,74 |
-0,03 |
-0,66 |
0,85 |
0,68 |
0,855 |
Испытуемый № 16 |
-0,69 |
0,49 |
0,74 |
0,84 |
-0,66 |
-0,95 |
0,97 |
0,206 |
Испытуемый № 17 |
-0,10 |
-1,29 |
0,74 |
-1,47 |
1,20 |
0,25 |
0,68 |
0,044 |
Испытуемый № 18 |
-1,56 |
1,37 |
-1,35 |
1,13 |
1,94 |
1,45 |
-1,34 |
0,206 |
Испытуемый № 19 |
0,19 |
-0,84 |
-0,75 |
-0,90 |
2,31 |
-1,55 |
0,10 |
-0,442 |
Испытуемый № 20 |
0,48 |
-1,29 |
-0,15 |
0,55 |
-0,66 |
-0,35 |
1,55 |
0,206 |
3. Вызов методов кластерного анализа производится выбором модуля «Cluster Analysis» из списка модулей «Statistica. Module Switcher». В появившемся далее окне выбор строки «К-means clustering» запускает итеративный метод К-средних. В появившемся после запуска метода окне с заголовком «Cluster Analysis: К-means clustering » указываются по каким переменным и как будет производится классификация. Поскольку в данном примере классификация производится по объектам, то в строке «Cluster» выбирается строка cases (rows). В строке «Missing data» устанавливается режим работы с пропущенными данными, поскольку предполагается, что в данных отсутствуют пропуски, то безразлично, какой из двух режимов установлен. По умолчанию в программе устанавливается режим «Casewise deleted» - удаление объектов, в которых имеются пропуски.
Далее в строке «Number of clusters» указывается желаемой число кластеров, в данном случае их 3. После нажатия на кнопку «Оk» будут произведены вычисления и появится окно результатов «K-Means clustering Results». В нижней части окна результатов расположены кнопки для получения подробной информации по кластерам.
При нажатии кнопки «Analysis of variance» (анализ дисперсий) появляется таблица с таким же заголовком. Результаты представлены в табл. 6.
Вероятность ошибки при принятии гипотезы о неравенстве дисперсий меньше уровня значимости (<0,05) (кроме значений для переменных Х6 и Х8), что указывает на достаточно хорошую разбивку на кластеры. Значения дисперсий (внутригрупповой и внешне групповой) являются меньшими для данного разбиения на кластеры по сравнению с другими методами кластерного анализа, что говорит о достаточно удачной разбивке на кластеры.
Таблица 6
Анализ дисперсий
Перемен- ные |
Диспер- сия между кластера-ми |
Число степеней свободы для межклассовой диспер- сии |
Диспер-сия внутри класс- сов |
Число степеней свободы для внутриклассовой дисперсии |
F- критерий для проверки гипотезы о неравенстве дисперсий между кластерами и внутри них |
Р – вероят- ность ошибки при принятии гипотезы о неравен- стве дисперсий |
Х4 |
11,466 |
2 |
18,533 |
28 |
8,6617 |
0,001179 |
Х6 |
1,2198 |
2 |
28,780 |
28 |
0,5934 |
0,559236 |
Х7 |
13,992 |
2 |
16,007 |
28 |
12,238 |
0,000152 |
Х8 |
1,7882 |
2 |
28,211 |
28 |
0,8874 |
0,422977 |
Х9 |
18,129 |
2 |
11,870 |
28 |
21,382 |
0,000002 |
Продолжение табл.6
Перемен- ные |
Диспер- сия между кластера-ми |
Число степеней свободы для межклассовой диспер- сии |
Диспер-сия внутри класс- сов |
Число степеней свободы для внутриклассовой дисперсии |
F- критерий для проверки гипотезы о неравенстве дисперсий между кластерами и внутри них |
Р – вероят- ность ошибки при принятии гипотезы о неравен- стве дисперсий |
Х11 |
13,730 |
2 |
16,269 |
28 |
11,815 |
0,00019 |
Х12 |
12,486 |
2 |
17,513 |
28 |
9,9813 |
0,000534 |
Среднее значение |
19,930 |
2 |
10,069 |
28 |
27,7087 |
0,0000002 |
Вторая кнопка: «Cluster Means & Euclidean Distances» (средние значения в кластерах и евклидово расстояние). При нажатии на эту кнопку выводятся две таблицы (табл. 7 – 8).
Таблица 7
Средние значения в кластерах
Переменные |
Кластер №1 |
Кластер №2 |
Кластер №3 |
Х4 |
0,829317 |
-0,15643 |
-0,65725 |
Х6 |
0,220184 |
0,042893 |
-0,26737 |
Х7 |
0,919103 |
-0,18092 |
-0,72009 |
Х8 |
0,347966 |
-0,15944 |
-0,17258 |
Х9 |
-0,51046 |
1,029411 |
-0,6219 |
Х11 |
0,610825 |
0,305764 |
-0,94717 |
Х12 |
0,854061 |
-0,13392 |
-0,70674 |
Среднее значение |
0,912597 |
0,140374 |
-1,06701 |
Третья кнопка: «Graph of means» вызывает графическое изображение информации (рис. 1), содержащейся в табл. 7.
Таблица 8
Евклидово расстояние
№ кластера |
Кластер №1 |
Кластер №2 |
Кластер №3 |
Кластер №1 |
0 |
0,813416 |
1,775028 |
Кластер №2 |
0,901896 |
0 |
0,840063 |
Кластер №3 |
1,332302 |
0,91655 |
0 |
Рис. 1 График средних значений переменных для каждого кластера
После нажатия кнопки «Discriptive Statistic for each clusters» выводятся
таблицы (табл. 9 – 11), количество которых равно количеству
кластеров.
Таблица 9
Описательная статистика для кластера №1
Признак |
Среднее |
Несмещенное среднеквадратическое отклонение |
Несмещенная дисперсия |
Х4 |
0,829317 |
0,798851 |
0,638163 |
Х6 |
0,220184 |
1,048869 |
1,100127 |
Х7 |
0,919103 |
0,529427 |
0,280293 |
Х8 |
0,347966 |
0,361974 |
0,131025 |
Х9 |
-0,51046 |
0,501432 |
0,251434 |
Х11 |
0,610825 |
0,808895 |
0,654311 |
Х12 |
0,854061 |
0,531215 |
0,282189 |
Среднее значение |
0,912597 |
0,67669 |
0,457909 |
Таблица 10
Описательная статистика для кластера №2
Признак |
Среднее |
Несмещенное среднеквадратическое отклонение |
Несмещенная дисперсия |
Х4 |
-0,15643 |
0,79097 |
0,625633 |
Х6 |
0,042893 |
1,048869 |
1,100126 |
Х7 |
-0,18092 |
0,956082 |
0,914092 |
Х8 |
-0,15944 |
1,069342 |
1,143492 |
Х9 |
1,029411 |
0,749642 |
0,561963 |
Х11 |
0,305764 |
0,886959 |
0,786697 |
Х12 |
-0,13392 |
0,855652 |
0,732139 |
Среднее значение |
0,140374 |
0,349559 |
0,122191 |
Таблица 11
Описательная статистика для кластера №3
Признак |
Среднее |
Несмещенное среднеквадратическое отклонение |
Несмещенная дисперсия |
Х4 |
-0,65725 |
0,852032 |
0,725958 |
Х6 |
-0,26737 |
0,935574 |
0,875299 |
Х7 |
-0,72009 |
0,694706 |
0,482617 |
Х8 |
-0,17258 |
1,316459 |
1,733064 |
Х9 |
-0,6219 |
0,66564 |
0,443076 |
Х11 |
-0,94717 |
0,528469 |
0,279279 |
Х12 |
-0,70674 |
0,922107 |
0,850281 |
Среднее значение |
-1,06701 |
0,724703 |
0,525194 |
Окончательный результат выводится при нажатии кнопки «Members of each cluster & distances». По ней выводится столько окон, сколько задано кластеров. Результаты данного примера находятся в табл. 12.
Из табл. 12 видно, что в кластер № 1 входят совершенно пригодные и пригодные. Пригодные объединены в один кластер с совершенно пригодными, поскольку их значения очень близки. Из примера видно, что самым лучшим является Испытуемый № 15, поскольку у него самое меньшее евклидово расстояние, которое характеризует меру близости к данному кластеру. Незначительная вероятность ошибки показывает на удачную разбивку на кластеры.
Таблица 12
Разбивка на кластеры
Номер кластера |
Испытуемые, входящие в данный кластер |
Евклидово расстояние от центра класса до переменной |
Кластер №1 |
1 Совершенно пригодные |
0,896262 |
2 Совершенно пригодные |
0,552983 |
|
3 Совершенно пригодные |
0,283232 |
|
4 Совершенно пригодные |
0,285787 |
|
Пригодные |
0,495518 |
|
Испытуемый №11 |
0,721113 |
|
Испытуемый №13 |
0,823156 |
|
Испытуемый №15 |
0,408854 |
|
Испытуемый №16 |
0,836868 |
|
Испытуемый №20 |
0,829624 |
|
Кластер №2 |
1 Условно пригодные |
0,283311 |
2 Условно пригодные |
0,514721 |
|
3 Условно пригодные |
0,34374 |
|
Кластер №2 |
Испытуемый №1 |
1,09215 |
Продолжение табл.12
Номер кластера |
Испытуемые, входящие в данный кластер |
Евклидово расстояние от центра класса до переменной |
|
Испытуемый №6 |
0,800716 |
Испытуемый №7 |
0,785976 |
|
Испытуемый №8 |
0,683853 |
|
Испытуемый №12 |
1,126093 |
|
Испытуемый №17 |
0,79464 |
|
Испытуемый №18 |
1,138129 |
|
Испытуемый №19 |
0,951491 |
|
Кластер №3 |
1 Не пригоден |
0,227228 |
2 Не пригоден |
0,720074 |
|
3 не пригоден |
1,135363 |
|
Испытуемый №2 |
0,655581 |
|
Испытуемый №3 |
0,7624 |
|
Испытуемый №4 |
0,968535 |
|
Испытуемый №5 |
0,857146 |
|
Испытуемый №9 |
0,736267 |
|
Испытуемый №10 |
0,909195 |
|
Испытуемый №14 |
0,861626 |
При обработке результатов тестирования для определения профессиональной пригодности можно из списка исключать самого лучшего для дальнейшего определения следующего претендента. Кроме того, для поиска наиболее удачных разбиений на кластеры рекомендуется применять несколько методов кластерного анализа, при этом самым лучшим будет являться метод, который соответствует следующим требованиям:
значения дисперсий внутри групповой и внешне групповой должны быть по возможность минимальными;
сумма квадратов расстояний до центров кластеров должна быть минимальной.
Обработка исходных данных различными методами кластерного анализа занимает небольшое время, поэтому не является трудоемким.
Таким образом, использование метода кластерного анализа позволяет определить профессиональную пригодность испытуемого для данного вида работы, при этом преимущественно данным методом выбирают самых лучших.
Библиографический список
Психологическая диагностика: Пробл. и исслед./[М.К. Акимова, Е.М. Борисова, К.М. Гуревич и др.]. Под.ред. К.М. Гуревича. – М.: Педагогика, 1981. – 232 с.
Глебова Е.В., Иванова М.В. Профессиональный отбор операторов: история и актуальность// Безопасность жизнедеятельности – 2002. – № 9. – с. 15 – 20.
Глебова Е.В., Иванова М.В., Черникова Н.А. Методика тестирования профессиональной пригодности операторов технологических установок на газоизмерительной станции// Безопасность жизнедеятельности, № 7, 2003 г., стр. 8 – 12.
Ростунов А.Т. Формирование профессиональной пригодности. – Минск: Высшая школа, 1984. – 203 с.
Боровской А.Б. Система методов профориентации: Учеб.-метод.пособие. – Киев: Наука, 1993. – 159 с.
Лапин В.Л., Пономарев Н.Л., Сердюк Н.И. Безопасность технологических процессов и производств. – М.: Высшая школа, 2002. – 387 с.
Основы кадрового менеджмента: Учебн. Пособие/ МЗУУП. – Киев: Наука, 1993. – 215 с.
Бушманова М.В., Дуброва Т.А., Мочалкина Н.А. Кластерный анализ. Проведение классификаций многомерных наблюдений методами кластерного анализа в пакете «Statistica»: Учебн. пособие.- Магнитогорск: МГТУ, 2002. –103 с.
Приложение А