Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
maklakov_a_g_professionalnyy_psihologicheskiy_o...doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
7.99 Mб
Скачать

Процентное распределение случаев под нормальной кривой

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине, – достаточно часто. Нормальным такое распределение называется еще и потому, что оно очень часто встречалось в естественно-научных исследованиях и рассматривается как «норма» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции. (В литературе нормальное распределение называют еще нормальным распределением Гаусса.)

В психодиагностике принято считать, что если по какому-то признаку получено нормальное распределение, то этот признак (психологическое свойство) объективно существует. В реальных психологических исследованиях это распределение отмечается не всегда. В ряде случае это объясняется недостаточностью объема выборки обследуемых, поскольку известно, что чем больше выборка, тем больше вероятность получить нормальное распределение.

Оценить полученное распределение в отношении его соответствия нормальному возможно несколькими способами. Проще всего построить график и визуально его оценить. Тем более что для этого могут быть использованы компьютерные программы (например, Excel). Поэтому данный метод на практике используется наиболее часто. Однако следует отметить, что этот способ наиболее субъективен.

Другой способ, также весьма простой, но распространенный несколько меньше, чем графический, состоит в расчете процентного соотношения показателей. Все обследуемые ранжируются по соответствующему показателю. Затем оценивается процентное соотношение по каждому из трех интервалов – от -1 σ до +1 σ; от -2σ до +2σ; от 3σ до +3σ (см. рисунок).

В ряде случаев, например при разработке или апробации методик, производятся математические расчеты, оценивающие асимметрию выборки и характеризующие степень соответствия нормальному распределению. Для этого используется специальная формула:

Для симметричного распределения А = 0, что характерно и для нормального распределения показателей. Чем ближе значение показателя А к нулю, тем больше соответствие полученного распределения нормальному. Вычислить показатель асимметрии можно, используя математические программы компьютерной обработки данных.

По материалам: Бурлачук Л. Ф., Морозов С. М. Словарь-справочник по психодиагностике. СПб.: Питер, 1 999; Силоренко Е. В. Методы математической обработки в психологии. СПб.: Речь, 2006.

Суть данного метода основывается на предположении о том, что большинство людей обладают психологическими качествами, присущими всем, причем у разных людей эти качества будут различаться по степени развития. Соответственно если тест действительно измеряет реально существующее психологическое качество, то, согласно законам статистики, результаты выполнения этого теста значительным множеством людей будут близки к нормальному распределению Гаусса. Таким образом, чем ближе распределение результатов теста к нормальному распределению, тем выше способность теста ранжировать обследуемых по степени развития соответствующих качеств, а следовательно, выше и показатели диагностической валидности теста.

Еще одним обязательным для проверки критерием является конвергентная валидность. Как правило, для проверки конвергентной валидности проводится обследование группы испытуемых с использованием набора тестов, в состав которого помимо оцениваемого теста входят тесты, предназначенные для изучения одного и того же качества. После проведения обследования полученные результаты подвергаются статистической обработке. Прежде всего проводится корреляционный анализ. Если коэффициент корреляции достигает уровня статистической значимости, то можно полагать, что изучаемый тест достаточно валиден по критерию конвергенции.

Следующий этап проверки конвергентной валидности – анализ полученных результатов проверочного обследования с использованием t-критерия Стъюдента. Для этого в группе обследуемых выделяются две подгруппы, которые имеют наиболее высокие и более низкие показатели по одному из вспомогательных тестов, используемых в процедуре проверки. Затем проводится сопоставление результатов выполнения проверяемого теста представителями этих контрастных подгрупп с использованием t-критерия Стьюдента. Если в результате такого анализа t-критерий будет близок к достоверному или достоверным, то можно полагать, что конвергентная валидность проверяемого теста достаточна высока. Кроме этого, можно провести и обратную проверку, т. е. разделить обследуемых по результатам выполнения проверяемого теста на две подгруппы с наиболее высокими и более низкими результатами и проанализировать с помощью t-критерия, какие результаты обследуемые показали по вспомогательным тестам. Если и в этом случае результаты будут близкими к достоверным или достоверные, то можно полагать, что валидность проверяемого теста доказана.

Не менее значима и проверка теста в отношении его надежности. Косвенным подтверждением надежности теста являются результаты проверки конвергентной валидности методики. Если результаты выполнения теста близки к результатам параллельных тестов, которые использовались для оценки того же самого психического качества, то можно полагать, что тест надежен. Однако основное требование, предъявляемое к показателю надежности, заключается в повторимости показателей, т. е. к тому, насколько совпадут результаты выполнения теста с его же показателями, если провести повторное обследование через некоторое время. Подобный тип надежности принято называть ретестовой надежностью. Это один из наиболее значимых для решения задач профотбора типов надежности, поскольку очень важно, чтобы кандидаты в разное время показывали по одному и тому же тесту близкие результаты. Например, если кандидат на замещение вакантной должности сегодня показывает по тесту одни результаты, а завтра или через неделю – другие либо совершенно противоположные, то вряд такой тест может быть использован в мероприятиях профотбора.

Процедура проверки теста в отношении ретестовой надежности относительно проста. Дважды, через определенный промежуток времени, проводится обследование одной и той же группы испытуемых с использованием проверяемого теста. Затем проводится статистический анализ результатов теста с помощью корреляционного анализа. При использовании интервальных шкал применяется коэффициент корреляции производных моментов Пирсона, а для шкал порядка используется коэффициент ранговой корреляции Спирмена.

Корреляционный анализ – комплекс методов статистического исследования взаимозависимости между переменными, связанными корреляционными отношениями. Корреляционными (лат. correlatio – соотношение, связь, зависимость) считаются такие отношения между переменными, при которых выступает преимущественно нелинейная их зависимость, т. е. значению любой произвольно взятой переменной одного ряда может соответствовать некоторое количество значений переменной другого ряда, отклоняющихся в ту или иную сторону от среднего.

Корреляционный анализ выступает в качестве одного из вспомогательных методов решения теоретических задач психодиагностики и включает в себя комплекс наиболее широко применяемых статистических процедур при разработке тестовых и других психодиагностических методик, определения их надежности, валидности. Корреляционный анализ является одним из основных методов статистической обработки эмпирического материала в прикладных психодиагностических исследованиях.

Существующие процедуры корреляционного анализа позволяют определить степень значимости связи, установить меру и направление влияния одного из признаков (X) на результирующий признак (Y) при фиксированном значении отдельных переменных (корреляция частная), выявить степень и направленность связи результирующего признака (Y) с совокупностью переменных x, х → x (корреляция множественная). Корреляционному анализу подлежат как количественные, так и качественные признаки (к первым относятся переменные, измеряемые в интервальной шкале и шкале отношений, ко вторым – не имеющие единиц измерения, оцениваемые шкалами наименований и порядковыми шкалами).

В психологии обычно используются два типа корреляционного анализа. Для установления взаимосвязи между признаками, измеряемыми в интервальных шкалах, используется критерий Пирсона. В отношении установления взаимосвязи между качественными показателями используется критерий Спирмена. Следует отметить, что существуют разные формы корреляционного анализа. Однако в любом случае не следует проводить корреляционный анализ между признаками, измеряемыми в интервальных или абсолютных шкалах, и признаками, имеющими качественные характеристики, поскольку первые характеризуют выраженность признака, а вторые – лишь его наличие или степень присутствия.

По материалам: БурлачукЛ. Ф., Морозов С. М. Словарь-справочник по психодиагностике. СПб.: Питер, 1999.

Чем выше коэффициент корреляции результатов первого и второго обследования, тем выше ретестовая надежность проверяемого теста. Если же коэффициент корреляции не достигает уровня статистической значимости, то такой тест не может быть рекомендован для использования в мероприятиях ППО.

Несмотря на простоту проведения этого типа проверки надежности теста, существует проблема, которую надо учитывать. Это проблема заключается во времени, которое должно пройти между первым и вторым обследованием. Интервал между двумя обследованиями не должен быть чрезмерно большим или, наоборот, чрезмерно малым. Слишком малый интервал способствует формированию навыка, что может привести к завышению показателей. В то же время слишком большой интервал может привести к занижению результатов, поскольку увеличивается вероятность воздействия посторонних факторов. Например, могут наступить вполне закономерные возрастные изменения или произойти такие жизненные события, которые самым существенным образом отразятся на индивидуально-психологических особенностях кандидатов. Каков же должен быть временной интервал между первым и вторым обследованием?

В некоторых и весьма редких случаях авторы теста сами указывают интервал, в течение которого не следует проводить повторное обследование из-за вероятности возникновения эффекта научения. Однако, к сожалению, чаще всего такая информация отсутствует. Поэтому, выбирая временной интервал между двумя обследованиями при проверке ретестовой надежности теста, следует исходить из того, что чем больше в тесте заданий или вопросов, тем меньше может быть интервал. Например, если в тесте 30 заданий, то временной интервал должен составлять примерно три или четыре недели. Соответственно в зависимости от конструктивных особенностей теста временной интервал должен составлять от двух недель до двух месяцев (см. главу 6).

В большинстве случаев при проверке диагностических возможностей теста достаточно проведения тех проверок, о которых было сказано выше. Однако бывают случаи, когда специалист, оценивая возможность использования теста в мероприятиях профотбора, вынужден проверять гомогенность методики, которая характеризует надежность теста в отношении внутренней согласованности заданий или вопросов. Обычно при проверке теста на гомогенность используется несколько приемов. Например, разбиение вопросов или заданий теста по признаку их четности или нечетности (имеется в виду их порядок), метод определения надежности расщеплением и создание отдельных субтестов. После этого проверяется связь четных вопросов с нечетными (см. главу 6). Однако методики, которые планируется использовать при проведении профотбора, подвергаются проверке в отношении гомогенности несколько иначе и лишь тогда, когда в этом есть необходимость.

Эта необходимость обычно возникает в том случае, когда тест содержит несколько показателей, каждый из которых оценивает какое-то психическое качество, но, кроме этого, имеется еще единый интегральный показатель. Наличие этого интегрального показателя заставляет специалиста ответить на вопрос в отношении его обоснованности. Если тест измеряет сразу несколько качеств и при этом существует интегральный показатель, то речь может идти или о необдуманном своеволии автора, или о реальной структуре психического качества. Поэтому если информация о структуре подобного теста, его надежности и валидности отсутствует, то проверка в отношении внутренней согласованности методики крайне необходима. Рассмотрим несколько примеров использования тестов, имеющих не только несколько независимых шкал, но и интегральный показатель.

К числу подобных тестов на полном основании можно отнести интеллектуальную батарею тестов «КР-3-85», разработанную сотрудниками Военно-медицинской академии Б. Кулагиным и М. Решетниковым. Батарея состоит из шести отдельных шкал, каждая из которых оценивает развитие определенного интеллектуального качества, причем каждая шкала имеет 30 заданий. Путем суммирования результатов всех шести шкал можно получить интегральный показатель общего интеллектуального развития (ОИР). Возникает вопрос о том, насколько обоснованно использование этого показателя? Отражает ли интегральный показатель ОИР какую-то реальную закономерность или общий уровень развития интеллекта?

Проведенный статистический анализ свидетельствует о том, что между показателями по отдельным шкалам и интегральным показателем действительно существует корреляционная зависимость, что само по себе неудивительно. Так как интегральный показатель получен путем простого суммирования, то в значении ОИР представлены показатели всех шести шкал, и чем больше будет вес шкалы в значении интегрального показателя, тем выше корреляционная взаимосвязь. Поэтому простой статистический анализ еще не дает основания считать, что подобное простое суммирование результатов по отдельным шкалам для получения интегрального показателя вполне обоснованно. На данном этапе анализа наличие взаимосвязи между субшкалами и интегральным показателем объясняется статистическими закономерностями и не дает какого-либо психологического объяснения существующих связей. Однако необходимые объяснения могут быть найдены, если проанализировать взаимосвязь между отдельными субшкалами. Оказывается, что между субшкалами действительно существует взаимосвязь. Причем в разных условиях проведения исследования и на разных выборках она проявляется по-разному. Учитывая всю имеющую в настоящее время информацию о возможной структуре интеллекта (о чем уже говорилось в предыдущих главах), можно полагать, что наличие корреляционных связей между отдельными субшкалами вполне естественно.

Таким образом, интегральный показатель по батарее интеллектуальных тестов «КР-3-85» действительно отражает общий уровень интеллектуального развития. Следовательно, если при решении задач профотбора необходимо оценить уровень развития интеллекта, то использование данной батареи тестов – оптимальный выбор. Однако если психолог в мероприятиях профотбора планирует применять не всю батарею тестов, а лишь отдельные методики, то использовать суммарный балл в усеченном варианте интеллектуальной батареи возможно лишь в том случае, когда между субшкалами существуют тесная взаимосвязь. Если же необходимой корреляционной связи между субшкалами нет, то использовать интегральный показатель при усеченном варианте «КР-3-85» нецелесообразно.

Среди методик изучения личности также встречаются тесты, содержащие несколько относительно независимых показателей, которые объединяются в один интегральный показатель. В отличие от исследований, посвященных проблемам интеллекта, в психологии личности четкого представления о структуре личности фактически нет. По сути, любой личностный тест, позволяющий одновременно получить несколько показателей, является экспериментальной моделью личности, поскольку в основе таких методик всегда лежит какая-то концепция, отражающая представление автора(ов) теста о структуре личности. Для профессионального психологического отбора личностные методики, позволяющие получить какой-то интегральный показатель на основании учета промежуточных показателей, которые характеризуют уровень развития профессионально важных качеств, имеют особое значение, поскольку существенно упрощают вынесение итогового заключения о профпригодности.

В начале 1990-х гг. автор данной книги разработал методику, предназначенную для оценки некоторых свойств личности и позволяющую получить интегральный показатель на основе целого ряда промежуточных показателей, каждый из которых характеризует отдельное профессионально важное качество. В дальнейшем данная методика, названная МЛО «Адаптивность», получила широкое распространение в практической деятельности психологов[65]. Теоретическая основа этого теста была рассмотрена в главе 7 этой книги. В краткой форме теоретические предпосылки могут быть представлены в виде следующих утверждений:

1. Адаптация является важнейшим процессом в жизни и деятельности человека.

2. Адаптация – это не только процесс, но и свойство живого организма, заключающееся в обеспечении процесса приспособления к условиям внешней среды.

3. Адаптация осуществляется на нескольких уровнях иерархии человека, в том числе и на личностном (социальном).

4. Существуют личностные качества, которые обеспечивают успех социальной адаптации человека.

Тест «Адаптивность» имеет структуру показателей, которые условно могут быть расположены на нескольких уровнях иерархии. Каждый следующий уровень формируется на основе психологических шкал предшествующего уровня, причем формирование характеристик более высокого уровня осуществлялось на основе результатов факторного анализа. 1 акже следует отметить, что шкалы всех уровней многократно проверялись на валидность и надежность.

В табл. 9.1 представлены результаты факторного анализа первичных шкал теста «Адаптивность».

Таблица 9.1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]