
социология02 / методика / методика 2 / 11а Технология тестирования
.docТехнология тестирования
В настоящее время все шире распространяется стремление использовать тесты и аналогичный им социально-психологический инструментарий в процессе управления персоналом. Это и понятно: внедрение рыночных механизмов настоятельно требует внедрения и «рыночно-ориентированных» методик работы с актуальными и потенциальными сотрудниками. Огромное количество литературы, посвященной различного рода тестам и их возможностям и роли в управленческой деятельности, действительно создает впечатление о безграничной власти этого метода в процессе отбора персонала, расстановки его, обучения и развития, продвижения или исследования карьеры. Следует признать тот факт, что использование оценочных или тестирующих методик и программ может принести реальную пользу организации, если выяснено, что текущие процедуры отбора или расстановки сотрудников не приносят должного эффекта, если налицо низкая производительность труда, если ошибки работников имеют серьезные финансовые последствия, негативно влияют на здоровье или безопасность, если высока степень абсентеизма, если имеющиеся процедуры оценки не соответствуют правовым или профессиональным стандартам. Однако обольщение, связанное с эффективностью тестов, заставляет иногда забыть, что любая оценочная методика или процедура, любой оценочный инструментарий подвержены ошибкам.
Для того чтобы использование подобных методик и программ действительно могло дать средство для нахождения оптимального баланса между работниками и работодателями, увеличения адекватности информации о персонале и улучшения процесса использования полученной информации при принятии решений, необходимо знать некие ориентиры, по которым можно было бы судить о том, являются ли предлагаемые тесты научными (а значит, эффективными) или не являются. К таким критериям-ориентирам относятся прежде всего:
-
наличие приложенного к комплекту методических материалов «лицензионного паспорта» (или лицензионного соглашения), в котором указаны легальные права и обязанности лицензиара (изготовителя и владельца методики) и лицензиата (пользователя методики); наличие в этом лицензионном паспорте ссылок на сертификацию методики в определенных научно-профессиональных организациях;
наличие в инструкции к методике полного перечня комплектующих материалов и реальная полнота комплекта (к сожалению, чаще всего российские пользователи тестов располагают лишь обрывками случайно скопированных где-то и кем-то тестовых материалов); ,_ типовой комплект профессионального теста должен включать следующий минимум: инструкцию по области применения с научным обоснованием и сведениями об опыте использования и психометрических свойствах теста (надежность, валидность, репрезентативность, стандартизация), инструкцию по проведению, включая стандартную инструкцию испытуемому, перечень тестовых заданий (тестовый буклет), бланк-протокол, инструкцию по обработке бланка-протокола, включая ключи для подсчета количественных показателей (тестовых баллов), инструкцию по интерпретации результатов, включая пороговые количественные показатели (тестовые нормы);
-
наличие в инструкции по области применения и в научном обосновании ссылок на авторов теста (или научную организацию), включая точные адреса и телефоны, а также информацию об условиях распространения;
-
указание на то, какой именно контингент испытуемых (по численности, возрасту, полу, образовательно-профессиональным параметрам) участвовал в стандартизации (опытной эксплуатации) теста;
-
количественно-статистические данные (в виде величин коэффициентов корреляции) об эффективности прогноза определенных показателей деятельности с указанием размеров выборок, интервала прогноза (между тестом и съемом критериального показателя), смысла избранного критериального показателя.
Нельзя упускать из виду еще один момент: использование методов тестирования предполагает прежде всего понимание того, что должно быть измерено и для какой цели. Оценочный тест или оценочная процедура обеспечивают только часть общей «картинки», а процесс персональной оценки должен комбинировать и оценивать всю информацию. Ниже излагается несколько принципов, которые, по мнению специалистов, обеспечивают исходный «каркас» для создания и функционирования эффективной оценочно-тестирующей программы в практике управления человеческими ресурсами.
1. Использование оценочного инструментария целенаправленным образом: решающим для использования тестов является ясное понимание того, что должно быть измерено и для какой цели. Методики персональной оценки различаются по цели (отбор, расстановка, использование, обсуждение продвижения, обучение); по тому, что именно они намерены оценивать (навыки, умения, способности, стиль, интересы); по тому, что они должны предсказывать (успехи в работе, потенциал, карьерный успех, удовлетворенность работой, занятие определенной должности); по способу реализации (ручные, образчиковые, компьютерные); по уровню стандартизации, объективности и общности (стандартизированный тест с вариантами от ветов, субъективная оценка резюме, персональная оценка без предложения каких-либо правильных или неправильных ответов).
-
Использование в оценках персонала целостного подхода: оценочный инструментарий должен обеспечивать сбор важнейшей информации относительно индивида и быть релевантным предполагаемой деятельности. Какой-либо один инструментарий обеспечивает крайне ограниченный взгляд на индивида, поэтому для оценки навыков, умений, способностей и иных характеристик работника необходимо использовать разнообразные тестовые инструменты, сочетающиеся между собой. В этом случае обычно используются «составной барьер» или «общая оценка». Подход на базе «составного барьера» реализуется таким образом, что каждый тест или оценочная процедура продолжаются в рамках одного оценочного процесса (примерами являются так называемые «тестовые батареи» — шкалы измерения интеллекта Векслера, батарея тестов общих способностей (GATB), тест структуры интеллекта Амтхауэра (TSI)). Общая оценка ряда тестов также позволяет достичь определенного баланса, при этом низкие оценки по одному тесту могут быть компенсированы высокими оценками по другому.
-
Использование объективного оценочного инструментария, подходящего для любых групп респондентов: оценочный инструментарий, результаты, полученные посредством его использования, и соответствующие решения должны обеспечивать всем тестируемым равные права и возможности. Никакие решения не могут быть основаны на возрастных, половых, национальных, религиозных и иных различиях между кандидатами: учитываться должны лишь релевантные работе характеристики, касающиеся знаний, навыков, умений и способностей. Оценивающие процедуры и программы, в той или иной степени находящиеся под влиянием негативных, нежелательных факторов, должны быть исключены.
-
Использование оценочных процедур и инструментов, зарекомендовавших себя и продемонстрировавших свою значимость в отношении специфических целей, для которых они были разработаны. Проведение тестирования требует, с одной стороны, определенной квалификации от тестирующих, с другой — сами предлагаемые процедуры должны быть сертифицированы соответствующим образом. Целесообразнее обратиться в имеющиеся центры тестирования и оценки при условии, что последние имеют необходимый опыт работы, сертифицированный инструментарий, который может быть целенаправленно использован для измерения умственных или физических способностей, уровня и объема знаний, оценки личности и ее характеристик, а также иметь соответствующие рекомендации и свидетельства. Использование методик оценки, приемлемых для целевой группы. В оценке валидности важно определить, может ли тест быть использован тем специфическим образом, которым вы предполагаете его использовать, и соответствует ли ваша целевая группа референтной группе, на которой он апробировался. В этом смысле руководство к проведению теста должно содержать свидетельство валидности, описание процедур, использованных в ее исследовании, и результатов этих исследований.
-
Использование оценочных инструментов, снабженных понятной и исчерпывающей документацией. Зачастую описания тестов, содержащиеся в научной и популярной литературе, не всегда адекватно излагают ограничения по их использованию, подробные инструкции и ключи. Иногда разработки, предлагаемые к использованию, содержат лишь рекламную информацию, более подробная же скрывается под грифом «ноу-хау». Для принятия решения об использовании того или иного оценочного инструмента необходимы по меньшей мере наименование и подробное описание теста, время и место его создания, авторство, формы и способы проведения, цена, информация о надежности и валидности, сведения об апробации, отзывы специалистов.
-
Соответствующая подготовка административного персонала: речь в первую очередь идет о той совокупности требований, которые предъявляются к проводящим оценку или тестирование, объединенной термином «тестовая компетентность». В некоторых странах (США, Великобритания, Германия) требования к подготовке административного персонала закреплены соответствующим нормативным документом. Поскольку в России До этого пока еще далеко, требования, как правило, закрепляются содержательно: при принятии решения об оценке и тестировании необходимо быть уверенным в компетентности тех, кому они будут поручены.
-
Создание условий тестирования, приемлемых для всех тестируемых, на надежность и валидность оценочных процедур могут влиять различные внешние факторы. Полностью избежать негативных внешних влияний невозможно, однако их можно минимизировать, для чего необходимо соблюсти ряд условий: выбрать подходящее для проведения теста место; заранее подготовить тестовые материалы; предварительно известить всех тестируемых, а перед испытанием проинструктировать их должным образом. Важно еще и то, что весь процесс оценки должен проводиться одним и тем же персоналом, поскольку оценочные процедуры предназначены для учета различий между тестируемыми, но не между тестирующими.
Безопасность оценочного инструментария: для получения справедливых, валидных и надежных результатов ни один из тестируемых не должен иметь доступа к оценочному инструментарию заранее. Иначе говоря, должна быть обеспечена его защита от несанкционированного доступа в полном соответствии с требованиями защиты и безопасности информации.
-
Конфиденциальность результатов оценки: полученные в ходе тестирования/оценки результаты должны быть доведены лишь до ограниченного числа руководителей. При этом в соответствии с нормативными документами_тестируемый имеет право на ознакомление с продемонстрированными им результатами.
-
Обеспечение корректной и надлежащей интерпретации оценок. В случае, если на основе результатов, полученных в процессе тестирования, делаются какие-либо выводы относительно характеристик, способностей и иных черт индивида, которые могут представлять интерес для последующей работы, возникают вопросы их интерпретации: в частности, должны ли результаты тестирования индивида сравниваться с результатами других респондентов или с какими-либо абсолютными оценками. Здесь возможны следующие варианты: 1) интерпретация теста со ссылкой на нормы (речь идет о сравнении результатов тестирования с результатами, полученными от референтной (нормативной) группы. Нормативная группа состоит из большого репрезентативного числа индивидов специфической «популяции», например чиновников, студентов, людей какой-то одной специальности. Если в тесте предполагается именно такая интерпретация, то руководство к тесту должно содержать детализированное описание норм и нормативных групп; тогда следует убедиться, что тестируемая группа подобна нормативной группе по образовательному, языковому, культурному и другим основаниям); 2) интерпретация теста со ссылкой на критерии (в этом случае результаты теста должны указывать объем навыков или знаний, которыми должны обладать тестируемые относительно отдельной области или содержательной сферы: тест устанавливает степень компетентности. Такого сорта тесты обычно используются в сертифицировании, установлении образовательного уровня и других аналогичных ситуациях; руководство к тесту должно указывать на минимально допустимый уровень).
Как правило, результаты, полученные в ходе тестирования, представляются в количественных показателях. Существуют следующие типы или системы их обсчета и оценки:
♦ «сырая» (невыверенная) оценка. Сырые оценки обычно не обеспечивают достаточным количеством полезной информации. Предположим, что в' математическом тесте тестируемый дал 25 правильных ответов на 50 вопросов. Много это или мало? Может оказаться и так, что после прохождения данного теста труппой индивидов такая оценка окажется наивысшей, и тогда важным становится контекст сравнения данного индивида с другими;
-
стандартные или конвертированные сырые оценки. Они указывают, где находятся оценки индивида в сравнении с референтной группой;
-
процентные оценки, получаемые путем конвертирования сырой оценки индивида в некоторое число, указывают процент людей в референтной группе, получивших оценки ниже оценки данного индивида.
Иногда можно столкнуться с тем, что ситуация тестирования вызывает протест у кандидатов. Одни возмущаются тем, что про них хотят что-то «вызнать», еще не приняв на работу. Другим кажется унизительной сама ситуация проверки. Третьи просто считают тесты пустой тратой времени, своего рода развлечением менеджера по персоналу, или руководства предприятия. В этой связи следует помнить, что сама процедура тестирования правомерна. Правда, на Западе есть правовые нормы, запрещающие дискриминацию на основании результатов психологического тестирования.То есть, отказывая кандидату, работодатель не должен мотивировать свой отказ тем, что тот плохо прошел психологическое тестирование. Но у работодателя всегда есть шанс сослаться на недостаточный или неподходящий стаж и опыт работы, наличие более подходящих кандидатур и т.п. Согласно российскому законодательству результаты психологического тестирования также не могут служить основанием для увольнения или отказа в работе. Поэтому если данный кандидат представляет интерес и загвоздка только в том, что он не хочет проходить психологическое тестирование, возможно, стоит дать ему позитивную установку на его прохождение.
Как правило, применение тестирования хорошо характеризует компанию как уделяющую внимание подбору сотрудников и работе с персоналом. Коллективу не безразлично, какой человек вольется в его ряды. От тщательного подбора сотрудников зависит работоспособность и результативность организации. Человек должен быть не только хорошим профессионалом, но и членом команды, разделяющим ее человеческие и корпоративные ценности. Грамотный руководитель старается доверить выбор профессионала профессиональному психологу или менеджеру по персоналу с психологическим образованием.
Для каждой вакансии составляется свой набор (батарея) тестов, соответствующий основным компетенциям сотрудника. Например, для бухгалтера важно быть ответственным, внимательным, уметь работать с большими объемами информации, обладать хорошей памятью на цифры, высокой помехоустойчивостью и работоспособностью. Учитывая тот момент, что в бухгалтерии работают в основном женщины, руководитель может обратить особое внимание на умение бесконфликтно сосуществовать в женском коллективе. Для линейного менеджера важны достаточно высокий уровень интеллекта, способность к стратегическому мышлению и анализу, гибкость поведения, способность принимать решения и брать на себя ответственность за них, умение общаться с клиентами и руководить подчиненными. Дизайнер рекламного агентства должен продуцировать нестандартные идеи, иметь богатую фантазию, уметь продуктивно и самостоятельно работать, выдерживать авралы и гибко подходить к требованиям клиентов.
Компьютерное тестирование
На сегодняшний день одной из проблемных областей практики применения тестов и иных оценочных методик в управлении персоналом является внедрение новых компьютерных тестов.От-метим сразу, что и у нас, и за рубежом этот процесс идет крайне медленно, хотя и по диаметрально противоположным причинам. За границей рынок тестов — заорганизован и бюрократизирован, у нас — недоорганизован и анархичен.
Вместе с тем новые компьютерные тесты призваны разрешить важнейшую проблему организационной диагностики — проблему фальсификации. Дело в том, что подавляющее большинство психологических тестов разрабатывалось для обслуживания задачи (целевой ситуации), коренным образом отличающейся от оценки персонала. Это задача консультирования. Когда клиент обращается к психологу за консультацией (тем более за психотерапевтической помощью), он сам заинтересован в том, чтобы дать достоверную информацию. Эта практика чрезвычайно развита на Западе (в США психоаналитиков раз в 10 больше, чем индустриальных психологов, работающих в фирмах или в кадровом консалтинге). На эту практику и ориентировались разработчики многих тестов, признанных ныне «классическими».
В ситуации консультирования вполне полезными оказываются популярные словесные тесты-опросники, исследующие особенности характера с помощью разнообразных вопросов. Другое дело — ситуация отбора кандидатов на должность или ситуация аттестации действующих работников, т.е., по существу, ситуация экспертизы. В этом случае достоверная информация нужна не самому испытуемому, а работодателю. Сам испытуемый вольно или невольно стремится отвечать на тест так, чтобы понравиться работодателю и пройти «сито отбора», занять вакантное место. Таким образом, зачастую при отборе личностные опросники не срабатывают, и на смену им приходят принципиально новые компьютерные технологии.
Мы уже отмечали выше, что пока компьютер используется в психодиагностике не слишком эффективно. Чаще всего он применяется как инструмент автоматизации сбора и обработки данных по тем же самым традиционным тест-опросникам. Но от пересадки на компьютер тест-опросник не становится более достоверным.
Постепенно у нас появляются и относительно серьезные и даже оригинальные отечественные компьютерные тестовые системы. Но они также, как правило, основаны на опросном методе. Так, например, крупное кадровое агентство «Триза» использует достаточно известную компьютерную систему российского производства, названную «Служба персонала». Несмотря на широкую рекламу, руководство этой тестовой методики не снабжено необходимыми сведениями о психометрических параметрах построенных тестовых шкал (надежность, валидность, устойчивость тестовых норм и т.п.).
Разработчики компьютерных тест-систем, как правило, акцентируют внимание пользователей на их разнообразных вторичных достоинствах: скорость сбора и обработки информации, возможность создания базы данных, обилие развернутых текстовых заключений, хороший интерфейс. Вопрос же о достоверности чаще всего остается за кадром. Вместе с тем некоторые свойства компьютерных тестов значительно повышают достоверность получаемой с их помощью информации. К ним относятся:
-
адаптивность: в традиционных опросниках не используется главное достоинство компьютеров — возможность изменения тестовых воздействий на основе быстрого анализа ответов. В психометрической науке этот метод тестирования называется «адаптивным» (в том смысле, что программа адаптируется, приспосабливается к данному конкретному испытуемому). Обычно в западной тестологии адаптивное тестирование применяется для оперативного подбора заданий оптимальной трудности (если испытуемый справляется, ему предъявляется более трудная задача, если не справляется — более легкая). Подобная модификация создает совершенно новый тест: прежние нормативы, собранные для бланковой (бумажной) формы теста, не подходят, и задание приходится нормировать (калибровать шкалы) именно в такой компьютерной форме, на основе данных, собранных в режиме диалога с компьютером;
косвенность: здесь речь идет о новых, весьма заманчивых перспективах, выходящих за пределы традиционных словесных тестов, — о различных невербальных (несловесных) и игровых методиках.
Например, человек оценивает фотопортреты, предъявляемые на компьютерном мониторе, в частности, приписывает изображенным людям определенные качества. Специалисты обнаружили, что испытуемые приписывают фотопортретам разные качества в зависимости от характеристик, которыми они (испытуемые) обладают сами. На этом был построен весьма тонкий косвенный тест, позволяющий проверить достоверность данных, получаемых с помощью опросников. Зпхэт тест был назван «стандартизованным проективом», он дает возможность проверить, подтверждаются ли определенные черты испытуемых косвенными данными. Косвенные тесты гораздо легче строить на компьютере, поскольку в процессе подсчета последний позволяет учитывать сотни и тысячи потенциальных статистических комбинаций между ответами и чертами людей;
-
комплексный анализ: чтобы сделать надежный вывод, необходимо применять различные методики, перепроверяющие друг друга. Для грамотного специалиста-диагноста совершенно неприемлемо ставить диагноз, основываясь на данных, полученных из одного-единственного источника информации. В настоящее время разработаны интегративные тестовые компьютерные системы, позволяющие запускать в ходе одного сеанса разнотипные тесты (тестовые батареи) и соотносить их результаты в наглядной форме;
-
игровой подход;
-
проблемная настройка: это свойство лишь отчасти связано с достоверностью самих тестов, но для потребителей тестовой информации оно зачастую выглядит как самое важное. Дело в том, что даже самый наглядный профиль тестовых показателей сам по себе ничего не говорит неспециалисту, так как он не способен увидеть за значениями разных факторов (способностей, черт характера) ответ на интересующий его вопрос: будет или не будет данный человек справляться с порученной ему профессионально-должностной ролью. Специалисты-психологи разработали гибкие компьютерные программы, позволяющие пользователю самому модифицировать и расширять банк «идеальных профилей» исполнителей, сообразуясь с требованиями конкретной производственной ситуации, ожиданиями вышестоящего руководителя и т.п. Главное достоинство компьютера состоит в том, что он может мгновенно просчитать близость между индивидуальными профилями реальных кандидатов и «идеальными профилями» соответствующих вакантных позиций. В результате на экране появляется оптимизированная картина оправданных назначений из числа кандидатов, имеющихся на данный момент;
информационная безопасность: один из серьезных недостатков любого бланкового теста в том, что варианты его легко копируются, тиражируются, а потенциальные испытуемые легко подбирают к нему ключи, и тест перестает работать. Современные методы компьютерной защиты затрудняют процесс бесконтрольного тиражирования тестовой информации. Самое перспективное направление в обеспечении информационной безопасности в этой области состоит в использовании следующего приема: компьютер оперативно формирует вариант (набор заданий, предъявляемый конкретному человеку) прямо в ходе тестового диалога, случайным образом подбирая задания из определенного очень большого банка.
Таким образом, очевидно, что компьютерные тест-системы имеют множество преимуществ. К сожалению, развитие настоящей компьютерной психодиагностики сдерживается в России из-за недостатка финансирования и дефицита компетентных пользователей. Конечно, в наши дни заказов на диагностику стало во много раз больше, чем во времена административно-командной системы, но пока спрос этот остается слишком неквалифицированным и неразборчивым. Сплошь и рядом события развиваются так: заказчик требует от психолога протестировать испытуемого за 15—30 мин, в которые психодиагност успевает «втиснуть» самый короткий (и потому малонадежный) тест. Немудрено, что полученные таким образом результаты оказываются некорректными и заказчик тут же разочаровывается в психологическом тестировании.
Многие заказчики справедливо остерегаются приобретать тесты просто потому, что не знают, как проверить, работают они или нет. В развитых странах национальные ассоциации психологов (или профильные ассоциации тестологов) публикуют результаты независимых проверок на страницах специализированных изданий. В России такая работа, к сожалению, пока не налажена, и специалисты рекомендуют заказчикам применять параллельно и независимо разные тесты, сконструированные по разным принципам независимыми друг от друга производителями.