Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Профессиональный отбор.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
4.91 Mб
Скачать

8. Последовательность работы в программе «Statistica 5.5» для определения класса профессиональной пригодности мастера

Реализация кластерного анализа производится в пакете прикладных программ «Statistica». Процесс анализа данных с помощью системы «Statistica» включает следующие этапы:

  • ввод данных в систему;

  • преобразование данных, адекватное выбранным статистическим методам;

  • визуализация данных с помощью различных типов графиков;

  • реализация алгоритма статистического метода;

  • вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;

  • интерпретация полученных результатов.

Проведение кластерного анализа в системе «Statistica» описывается в соответствии с этими этапами.

Ниже рассмотрен пример обработки данных и определения профессиональной пригодности мастера с помощью кластерного анализа в программе «Statistica 5.5».

Пример: Проведение кластерного анализа для обработки результатов тестирования мастеров прокатного производства.

1. После проведения тестирования составляют таблицу, с занесением в нее информации о результатах тестирования (табл. 4). Первоначально первые строки заполняются как эталонные с определением класса профессиональной пригодности. Эти строки содержат несколько значений - минимальный, максимальные, промежуточные, с учетом допущения отклонений по данному кластеру.

Таблица 4

Исходные данные

Испытуемый

Результаты тестов

Х4

Х6

Х7

Х8

Х9

Х11

Х12

Среднее значение

1 Совершенно пригодные

12

8

12

8

5

12

12

9,857

2 Совершенно пригодные

11

7

11

7

4

11

11

8,857

3 Совершенно пригодные

10

6

10

6

3

10

10

7,857

4 Совершенно пригодные

9

6

9

6

2

9

9

7,143

Пригодные

8

6

8

6

1

8

8

6,429

1 Условно пригодные

7

5

7

5

6

7

7

6,286

2 Условно пригодные

8

5

7

9

6

7

7

7,000

3 Условно пригодные

8

5

7

5

6

7

7

6,429

1 Не пригодные

4

4

4

4

4

4

4

4,000

Продолжение табл. 4

Испытуемый

Результаты тестов

Х4

Х6

Х7

Х8

Х9

Х11

Х12

Среднее значение

2 Не пригодный

4

4

4

12

4

4

4

5,143

3 Не пригодные

1

1

1

1

1

1

1

1,000

Испытуемый № 1

4

1

2

1

7

10

11

5,143

Испытуемый № 2

3

6

4

4

7

1

3

4,000

Испытуемый № 3

6

3

2

1

3

6

1

3,143

Испытуемый № 4

1

8

1

11

1

3

4

4,143

Испытуемый № 5

1

3

7

1

3

5

9

4,143

Испытуемый № 6

1

4

7

8

5

11

5

5,857

Испытуемый № 7

6

7

11

3

8

4

8

6,714

Испытуемый № 8

9

7

8

4

10

6

4

6,857

Испытуемый № 9

7

4

8

8

2

3

0

4,571

Испытуемый № 10

4

7

5

11

4

1

8

5,714

Испытуемый № 11

12

8

11

9

5

7

6

8,286

Испытуемый № 12

7

8

1

12

6

8

1

6,143

Испытуемый № 13

6

1

11

8

5

8

9

6,857

Испытуемый № 14

10

3

5

2

2

2

8

4,571

Испытуемый № 15

12

4

9

6

3

9

9

7,429

Испытуемый № 16

4

6

9

9

3

3

10

6,286

Испытуемый № 17

6

2

9

1

8

7

9

6,000

Испытуемый № 18

1

8

2

10

10

11

2

6,286

Испытуемый № 19

7

3

4

3

11

1

7

5,143

Испытуемый № 20

8

2

6

8

3

5

12

6,286

2. В связи с тем, что данные представлены в несопоставимых единицах, конечные результаты будут искажены из-за различных абсолютных значений. Для того, чтобы избежать этого, исходные данные нормируют. В программе «Statistica 5.5» для осуществления этой операции нужно вызвать модуль «Data Management», в нем вызвать строку «Standartize variables». После указания переменных для нормировки (нажатие кнопки «Select All» (выбрать все)) в открывшемся окне «Variables» появляется таблица с нормируемыми данными (табл. 5). Нормирование производится способом деление центрированной величины на среднее квадратическое отклонение.

Таблица 5

Нормированные данные

Испытуемый

Результаты тестов

Х4

Х6

Х7

Х8

Х9

Х11

Х12

Среднее значение

1 Совершенно пригодные

1,65

1,37

1,63

0,55

0,08

1,75

1,55

2,235

2 Совершенно пригодные

1,35

0,93

1,34

0,26

-0,29

1,45

1,26

1,667

3 Совершенно пригодные

1,06

0,49

1,04

-0,03

-0,66

1,15

0,97

1,099

4 Совершенно пригодные

0,77

0,49

0,74

-0,03

-1,03

0,85

0,68

0,693

Пригодные

0,48

0,49

0,44

-0,03

-1,40

0,55

0,39

0,287

1 Условно пригодные

0,19

0,04

0,14

-0,32

0,46

0,25

0,10

0,206

2 Условно пригодные

0,48

0,04

0,14

0,84

0,46

0,25

0,10

0,612

3 Условно пригодные

0,48

0,04

0,14

-0,32

0,46

0,25

0,10

0,287

1 Не пригодные

-0,69

-0,40

-0,75

-0,61

-0,29

-0,65

-0,76

-1,095

2 Не пригодный

-0,69

-0,40

-0,75

1,71

-0,29

-0,65

-0,76

-0,442

3 Не пригодные

-1,56

-1,73

-1,64

-1,47

-1,40

-1,55

-1,63

-2,795

Испытуемый № 1

-0,69

-1,73

-1,35

-1,47

0,83

1,15

1,26

-0,442

Испытуемый № 2

-0,98

0,48

-0,75

-0,61

0,83

-1,55

-1,05

-1,091

Испытуемый № 3

-0,10

-0,84

-1,35

-1,47

-0,66

-0,05

-1,63

-1,578

Испытуемый № 4

-1,56

1,37

-1,64

1,42

-1,40

-0,95

-0,76

-1,010

Испытуемый № 5

-1,56

-0,84

0,14

-1,47

-0,66

-0,35

0,68

-1,010

Испытуемый № 6

-1,56

-0,40

0,14

0,55

0,08

1,45

-0,48

-0,036

Испытуемый № 7

-0,10

0,93

1,34

-0,90

1,20

-0,65

0,39

0,450

Испытуемый № 8

0,77

0,93

0,44

-0,61

1,94

-0,05

-0,76

0,531

Испытуемый № 9

0,19

-0,40

0,44

0,55

-1,03

-0,95

-1,92

-0,766

Испытуемый № 10

-0,69

0,93

-0,45

1,42

-0,29

-1,55

0,39

-0,117

Испытуемый № 11

1,65

1,37

1,34

0,84

0,08

0,25

-0,19

1,342

Испытуемый № 12

0,19

1,37

-1,64

1,71

0,46

0,55

-1,63

0,125

Испытуемый № 13

-0,10

-1,73

1,34

0,55

0,08

0,55

0,68

0,531

Испытуемый № 14

1,06

-0,84

-0,45

-1,18

-1,03

-1,25

0,39

-0,766

Испытуемый № 15

1,65

-0,40

0,74

-0,03

-0,66

0,85

0,68

0,855

Испытуемый № 16

-0,69

0,49

0,74

0,84

-0,66

-0,95

0,97

0,206

Испытуемый № 17

-0,10

-1,29

0,74

-1,47

1,20

0,25

0,68

0,044

Испытуемый № 18

-1,56

1,37

-1,35

1,13

1,94

1,45

-1,34

0,206

Испытуемый № 19

0,19

-0,84

-0,75

-0,90

2,31

-1,55

0,10

-0,442

Испытуемый № 20

0,48

-1,29

-0,15

0,55

-0,66

-0,35

1,55

0,206

3. Вызов методов кластерного анализа производится выбором модуля «Cluster Analysis» из списка модулей «Statistica. Module Switcher». В появившемся далее окне выбор строки «К-means clustering» запускает итеративный метод К-средних. В появившемся после запуска метода окне с заголовком «Cluster Analysis: К-means clustering » указываются по каким переменным и как будет производится классификация. Поскольку в данном примере классификация производится по объектам, то в строке «Cluster» выбирается строка cases (rows). В строке «Missing data» устанавливается режим работы с пропущенными данными, поскольку предполагается, что в данных отсутствуют пропуски, то безразлично, какой из двух режимов установлен. По умолчанию в программе устанавливается режим «Casewise deleted» - удаление объектов, в которых имеются пропуски.

Далее в строке «Number of clusters» указывается желаемой число кластеров, в данном случае их 3. После нажатия на кнопку «Оk» будут произведены вычисления и появится окно результатов «K-Means clustering Results». В нижней части окна результатов расположены кнопки для получения подробной информации по кластерам.

При нажатии кнопки «Analysis of variance» (анализ дисперсий) появляется таблица с таким же заголовком. Результаты представлены в табл. 6.

Вероятность ошибки при принятии гипотезы о неравенстве дисперсий меньше уровня значимости (<0,05) (кроме значений для переменных Х6 и Х8), что указывает на достаточно хорошую разбивку на кластеры. Значения дисперсий (внутригрупповой и внешне групповой) являются меньшими для данного разбиения на кластеры по сравнению с другими методами кластерного анализа, что говорит о достаточно удачной разбивке на кластеры.

Таблица 6

Анализ дисперсий

Перемен-

ные

Диспер-

сия между кластера-ми

Число степеней свободы для межклассовой диспер-

сии

Диспер-сия внутри класс-

сов

Число степеней свободы для внутриклассовой дисперсии

F- критерий для проверки гипотезы о неравенстве дисперсий между кластерами и внутри них

Р – вероят-

ность ошибки при принятии гипотезы о неравен-

стве дисперсий

Х4

11,466

2

18,533

28

8,6617

0,001179

Х6

1,2198

2

28,780

28

0,5934

0,559236

Х7

13,992

2

16,007

28

12,238

0,000152

Х8

1,7882

2

28,211

28

0,8874

0,422977

Х9

18,129

2

11,870

28

21,382

0,000002

Продолжение табл.6

Перемен-

ные

Диспер-

сия между кластера-ми

Число степеней свободы для межклассовой диспер-

сии

Диспер-сия внутри класс-

сов

Число степеней свободы для внутриклассовой дисперсии

F- критерий для проверки гипотезы о неравенстве дисперсий между кластерами и внутри них

Р – вероят-

ность ошибки при принятии гипотезы о неравен-

стве дисперсий

Х11

13,730

2

16,269

28

11,815

0,00019

Х12

12,486

2

17,513

28

9,9813

0,000534

Среднее значение

19,930

2

10,069

28

27,7087

0,0000002

Вторая кнопка: «Cluster Means & Euclidean Distances» (средние значения в кластерах и евклидово расстояние). При нажатии на эту кнопку выводятся две таблицы (табл. 7 – 8).

Таблица 7

Средние значения в кластерах

Переменные

Кластер №1

Кластер №2

Кластер №3

Х4

0,829317

-0,15643

-0,65725

Х6

0,220184

0,042893

-0,26737

Х7

0,919103

-0,18092

-0,72009

Х8

0,347966

-0,15944

-0,17258

Х9

-0,51046

1,029411

-0,6219

Х11

0,610825

0,305764

-0,94717

Х12

0,854061

-0,13392

-0,70674

Среднее значение

0,912597

0,140374

-1,06701

Третья кнопка: «Graph of means» вызывает графическое изображение информации (рис. 1), содержащейся в табл. 7.

Таблица 8

Евклидово расстояние

№ кластера

Кластер №1

Кластер №2

Кластер №3

Кластер №1

0

0,813416

1,775028

Кластер №2

0,901896

0

0,840063

Кластер №3

1,332302

0,91655

0

Рис. 1 График средних значений переменных для каждого кластера

После нажатия кнопки «Discriptive Statistic for each clusters» выводятся

таблицы (табл. 9 – 11), количество которых равно количеству

кластеров.

Таблица 9

Описательная статистика для кластера №1

Признак

Среднее

Несмещенное среднеквадратическое отклонение

Несмещенная дисперсия

Х4

0,829317

0,798851

0,638163

Х6

0,220184

1,048869

1,100127

Х7

0,919103

0,529427

0,280293

Х8

0,347966

0,361974

0,131025

Х9

-0,51046

0,501432

0,251434

Х11

0,610825

0,808895

0,654311

Х12

0,854061

0,531215

0,282189

Среднее значение

0,912597

0,67669

0,457909

Таблица 10

Описательная статистика для кластера №2

Признак

Среднее

Несмещенное среднеквадратическое отклонение

Несмещенная дисперсия

Х4

-0,15643

0,79097

0,625633

Х6

0,042893

1,048869

1,100126

Х7

-0,18092

0,956082

0,914092

Х8

-0,15944

1,069342

1,143492

Х9

1,029411

0,749642

0,561963

Х11

0,305764

0,886959

0,786697

Х12

-0,13392

0,855652

0,732139

Среднее значение

0,140374

0,349559

0,122191

Таблица 11

Описательная статистика для кластера №3

Признак

Среднее

Несмещенное среднеквадратическое отклонение

Несмещенная дисперсия

Х4

-0,65725

0,852032

0,725958

Х6

-0,26737

0,935574

0,875299

Х7

-0,72009

0,694706

0,482617

Х8

-0,17258

1,316459

1,733064

Х9

-0,6219

0,66564

0,443076

Х11

-0,94717

0,528469

0,279279

Х12

-0,70674

0,922107

0,850281

Среднее значение

-1,06701

0,724703

0,525194

Окончательный результат выводится при нажатии кнопки «Members of each cluster & distances». По ней выводится столько окон, сколько задано кластеров. Результаты данного примера находятся в табл. 12.

Из табл. 12 видно, что в кластер № 1 входят совершенно пригодные и пригодные. Пригодные объединены в один кластер с совершенно пригодными, поскольку их значения очень близки. Из примера видно, что самым лучшим является Испытуемый № 15, поскольку у него самое меньшее евклидово расстояние, которое характеризует меру близости к данному кластеру. Незначительная вероятность ошибки показывает на удачную разбивку на кластеры.

Таблица 12

Разбивка на кластеры

Номер кластера

Испытуемые, входящие в данный кластер

Евклидово расстояние от центра класса до переменной

Кластер №1

1 Совершенно пригодные

0,896262

2 Совершенно пригодные

0,552983

3 Совершенно пригодные

0,283232

4 Совершенно пригодные

0,285787

Пригодные

0,495518

Испытуемый №11

0,721113

Испытуемый №13

0,823156

Испытуемый №15

0,408854

Испытуемый №16

0,836868

Испытуемый №20

0,829624

Кластер №2

1 Условно пригодные

0,283311

2 Условно пригодные

0,514721

3 Условно пригодные

0,34374

Кластер №2

Испытуемый №1

1,09215

Продолжение табл.12

Номер кластера

Испытуемые, входящие в данный кластер

Евклидово расстояние от центра класса до переменной

Испытуемый №6

0,800716

Испытуемый №7

0,785976

Испытуемый №8

0,683853

Испытуемый №12

1,126093

Испытуемый №17

0,79464

Испытуемый №18

1,138129

Испытуемый №19

0,951491

Кластер №3

1 Не пригоден

0,227228

2 Не пригоден

0,720074

3 не пригоден

1,135363

Испытуемый №2

0,655581

Испытуемый №3

0,7624

Испытуемый №4

0,968535

Испытуемый №5

0,857146

Испытуемый №9

0,736267

Испытуемый №10

0,909195

Испытуемый №14

0,861626

При обработке результатов тестирования для определения профессиональной пригодности можно из списка исключать самого лучшего для дальнейшего определения следующего претендента. Кроме того, для поиска наиболее удачных разбиений на кластеры рекомендуется применять несколько методов кластерного анализа, при этом самым лучшим будет являться метод, который соответствует следующим требованиям:

  • значения дисперсий внутри групповой и внешне групповой должны быть по возможность минимальными;

  • сумма квадратов расстояний до центров кластеров должна быть минимальной.

Обработка исходных данных различными методами кластерного анализа занимает небольшое время, поэтому не является трудоемким.

Таким образом, использование метода кластерного анализа позволяет определить профессиональную пригодность испытуемого для данного вида работы, при этом преимущественно данным методом выбирают самых лучших.

Библиографический список

  1. Психологическая диагностика: Пробл. и исслед./[М.К. Акимова, Е.М. Борисова, К.М. Гуревич и др.]. Под.ред. К.М. Гуревича. – М.: Педагогика, 1981. – 232 с.

  2. Глебова Е.В., Иванова М.В. Профессиональный отбор операторов: история и актуальность// Безопасность жизнедеятельности – 2002. – № 9. – с. 15 – 20.

  3. Глебова Е.В., Иванова М.В., Черникова Н.А. Методика тестирования профессиональной пригодности операторов технологических установок на газоизмерительной станции// Безопасность жизнедеятельности, № 7, 2003 г., стр. 8 – 12.

  4. Ростунов А.Т. Формирование профессиональной пригодности. – Минск: Высшая школа, 1984. – 203 с.

  5. Боровской А.Б. Система методов профориентации: Учеб.-метод.пособие. – Киев: Наука, 1993. – 159 с.

  6. Лапин В.Л., Пономарев Н.Л., Сердюк Н.И. Безопасность технологических процессов и производств. – М.: Высшая школа, 2002. – 387 с.

  7. Основы кадрового менеджмента: Учебн. Пособие/ МЗУУП. – Киев: Наука, 1993. – 215 с.

  8. Бушманова М.В., Дуброва Т.А., Мочалкина Н.А. Кластерный анализ. Проведение классификаций многомерных наблюдений методами кластерного анализа в пакете «Statistica»: Учебн. пособие.- Магнитогорск: МГТУ, 2002. –103 с.

Приложение А