- •Часть 1 -содержательной стороне современной тестологии (особый инте-
- •Часть 1
- •Глава 1. Функции и происхождение
- •Глава 2. Природа психологических тестов
- •Глава 3. Социальные и этические аспекты
- •Часть 2
- •Глава 4. Нормы и интерпретация
- •Глава 6. Валидность.
- •Глава 7. Валидность.
- •Глава 8. Анализ заданий
- •Часть 3
- •Глава 9. Индивидуальные тесты
- •Глава 10. Тесты для специфических
- •Глава II. Групповое тестирование
- •Часть 1. Классификация. Отметьте картинку, не принадлежащую трем остальным,
- •Часть 1. Вербальные способности. Каждое задание начинается с пары связанных
- •Часть II. Математические способности. Каждое задание содержит две величи-
- •Глава 12. Психологические вопросы
- •Часть 1. Содержание психологического тестирова-
Глава II. Групповое тестирование
В то время как индивидуальные тесты, такие, как шкалы Станфорд-Би-
не и Векслера, находят свое основное применение в клинике, групповые
тесты используются преимущественно в системе образования, граждан-
ских службах, в промышленности и армии. Напомним, что массовое те-
стирование началось в CffiABO время первой мировой войны с разра-
ботки армейских тестов альса и бета. Армейский альфа представлял
собой вербальный тест, предИазначенный для отбора и распределения
новобранцев. Армейский бета был неязыковым тестом и предназначался
для людей, не говорящих по-английски и неграмотных. Эти тесты яви-
лись своего рода образцом для последующего развития большого числа
групповых тестов для гражданского населения.
Варианты обоих армейских тестов для гражданского населения ис-
пользуются до сих пор и известны как проверочный альфа, или модифи-
цированная форма 9 (более распространено название альфа 9), и пере-
265 ГРУППОВОЕ ТЕСТИРОВАНИЕ
средством предварительного отбора с последующим использованием
классификационных батарей, предназначенных для распределения воен-
нослужащих по соответствующим армейским службам. AFQT обеспечи-
вает единый показатель, получаемый на основе выполнения равного чис-
ла заданий на выявление словарного запаса, арифметических, техниче-
ских способностей, понимания пространственных отношений.
В этой главе дается обзор используемых в настоящее время ос-
новных типов групповых тестов. Начнем с того, что рассмотрим принци-
пиальное различие между групповыми и индивидуальными тестами. За-
тем обсудим характеристики многоуровневых батарей, охватывающих
широкий диапазон возрастов и уровней развития. И наконец, проанали-
зируем групповые тесты, предназначенные для колледжей и других выс-
ших учебных заведений.
ГРУППОВЫЕ И ИНДИВИДУАЛЬНЫЕ ТЕСТЫ
Преимущества группового тестирования. Групповые тесты
разработаны в первую очередь как средство массового тестирования. По
сравнению с индивидуальными тестами у них есть свои достоинства
и свои недостатки. Позитивной стороной групповых тестов является воз-
можность проводить их одновременно с таким количеством людей, ко-
торые удобно разместятся в имеющемся помещении, и предъявлять их
через микрофон. Благодаря развитию техники группового тестирования
стало доступным проведение программ массового тестирования. Предъ-
явление заданий теста в отпечатанном виде, использование простых от-
ветов, которые легко зафиксировать в тестовой тетради или на бланке
ответов, способствовали тому, что отпала необходимость взаимодей-
ствия экспериментатора и испытуемого один на один.
Еще одной особенностью группового тестирования, облегчившей
проведение массовых исследований, является значительное упрощение
функций проводящего тест. В отличие от большой опытности и обучен-
ности, необходимых экспериментатору, например, при тестировании по
шкале Станфорд-Бине, для предъявления большинства групповых те-
стов от экспериментатора требуется лишь умение читать простые ин-
струкции испытуемым и точно соблюдать время. Конечно, желательно
проводить с экспериментаторами предварительные тренировочные заня-
тия, так как неопытность может стать причиной отклонения от стандар-
тизованной процедуры тестирования и тем самым сказаться на результа-
тах теста. В то же время при групповом тестировании могут быть
обеспечены более единообразные условия, чем при индивидуальном, по-
скольку роль экспериментатора сведена к минимуму. Предъявление те-
стовых заданий в форме звуковых записей, фильмов открывает дальней-
шие возможности для стандартизации процедуры тестирования
и применения его в больших масштабах.
Обработка показателей при групповом тестировании обычно носит
более объективный характер и может быть выполнена простым служа-
щим. Результаты большинства групповых тестов могут обрабатываться
на ЭВМ. Кроме того, независимо от способов обработки групповые
тесты обычно предусматривают специальные бланки ответов и тестовые
тетради, а раз в тестах все ответы заносятся на отдельные бланки, те-
стовые брошюры могут использоваться до тех пор, пока не износятся,
------- ~" "n,,nn -ге-гпппгп ллаТРГШЯТТЯ КПЯНКИ
266 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
ответов занимают меньше места, чем тестовые брошюры, и потому бо-
лее удобны для групп с большим числом испытуемых.
Еще одно преимущество группового тестирования-относительная
легкость и быстрота сбора данных и как следствие более благоприятные
по сравнению с индивидуальным тестированием условия для установле-
ния норм. Для большинства современных стандартизованных групповых
тестов нет ничего необычного в том, что их нормативные выборки вклю-
чают от 100000 до 200000 человек, в то время как даже наиболее тща-
тельно разработанные индивидуальные шкалы при стандартизации
с трудом собирают данные для 2000-4000 случаев.
Групповые тесты существенно отличаются от индивидуальных как
по форме, так и по расположению заданий. Хотя в групповых тестах мо-
гут использоваться местоименные вопросы, требующие произвольных
ответов (они особенно часто встречались в первых групповых тестах), все
же на сегодняшний день более типичным является применение вопросов
с множественным выбором заранее подготовленных ответов. Введение
такой формы было вызвано необходимостью соблюдать принцип еди-
нообразия и объективности при обработке результатов как машинным,
так и ручным способом. Что касается расположения заданий, то в отли-
чие от тестов типа шкал Вине, в которых задания располагаются по воз-
растным уровням, в групповых тестах задания обычно группируются по
сходству содержания в отдельные, проводимые в определенное время суб-
тесты. Внутри каждого субтеста задания, как правило, расположены по
возрастающей трудности. Такое расположение обеспечивает испытуемо-
му возможность попробовать свои силы в каждом типе заданий (напри-
мер, на словарный запас, арифметику, пространственные взаимосвязи
и т.д.) и завершить выполнение самых легких пунктов каждого вида до
того, как начнутся более трудные, на которые может понадобиться боль-
ше времени.
Однако практическая трудность, встречающаяся при использовании
раздельных субтестов, состоит в том, что менее опытные и менее внима-
тельные экспериментаторы могут неправильно организовывать тест во
рремени. Такие ошибки, по-видимому, чаще встречаются и имеют более
серьезные последствия, когда вместо указания общего времени проведе-
ния теста приводится время проведения отдельных заданий. Чтобы отне-
сти отведенный на тест лимит времени с таким расположением заданий,
которое позволило бы испытуемым испробовать все типы задач, в неко-
торых тестах используется спиральное расположение заданий. Одним из
первых примеров такого расположения заданий были самоприменимые
тесты умственных способностей Отиса, в которых, как указывает их на-
звание, предпринята попытка свести роль экспериментатора к минимуму.
Такое же расположение было сохранено и в следующем тесте ум-
ственных способностей Отиса-Леннона, предназначенном для испы-
туемых старше IV класса. В тесте со спиральным расположением зада-
ний наиболее легкие задание каждого типа представлены в самом начале
теста, затем идут следующие по степени трудности задания каждого ти-
па и т.д., примерно так, как это приводится ниже.
Ответ
1. Противоположным ненависти является: а) вражда, б) страх, в) любовь,
г) дружба, д) игра ........................ ()
2. Если 3 карандаша стоят 25 центов, сколько карандашей можно купить на
75 центов?
267 ГРУППОВОЕ ТЕСТИРОВАНИЕ
3. У птицы не всегда бывают: а) крылья, б) глаза, в) ноги, г) гнездо, д) клюв.
4. Противоположным чести является: а) слава, б) бесчестье, в) трусость,
г) страх, д) поражение ....................... ()
Для того чтобы избежать необходимости повторять инструкции для
каждого задания и свести их число к минимуму, в некоторых тестах по
спирали располагаются не единичные задания, а блоки из 5-10 заданий.
Такой прием используется, например, в армейском квалификационном
тесте и тесте способности к обучению Совета по вступительным экзаме-
нам в колледж.
Недостатки группового тестирования. Хотя групповые
тесты обладают некоторыми желательными качествами и отвечают за-
дачам современного тестирования, следует отметить и их ограничен-
ность. При групповом тестировании у экспериментатора гораздо меньше
возможностей добиться взаимопонимания с испытуемым, заинтересо-
вать его и заручиться его сотрудничеством. Любые случайные со-
стояния обследуемого, такие, как болезнь, утомление, беспокойство или
тревожность, которые могут влиять на выполнение заданий, гораздо
труднее выявить в групповом тестировании. В целом лица, незнакомые
с такой процедурой, скорее покажут более низкие результаты в груп-
повых тестах, нежели в индивидуальных. Существуют данные, свидетель-
ствующие о том, что дети с нарушениями эмоциональной сферы лучше
выполняют индивидуальные тесты, а не групповые (Е.М. Bower, 1969;
J. Willis, 1970).
Вместе с тем групповые тесты подвергаются нападкам за ограниче-
ния, налагаемые на ответы испытуемых. Особенно критикуются задания
с множественным выбором ответов и такие стандартные типы заданий,
как аналогии, нахождение сходства и классификация (В. Hoffman, 1962;
L. La Fave, 1966). Правда, используемые при этом доводы не всегда до-
статочно убедительны. Одним из спорных является аргумент, что такие
задания ставят в невыгодное положение тех, кто блестяще и оригиналь-
но мыслит, кто ищет в ответах необычный смысл. Заметим, кстати, что
если это и происходит, то очень редко, о чем говорят анализ заданий
и данные по валидности.
Часть критиков, что характерно для подхода Пиаже (I.E. Sigel, 1963),
указывают на важность анализа ошибок и выяснения причин, которые
побуждают индивида выбирать определенный ответ. Несомненно, груп-
повые тесты почти или совсем не позволяют непосредственно наблюдать
поведение испытуемых и устанавливать источник нетипичного выполне-
ния тестов. По этой и другим причинам в тех случаях, когда принимае-
мое по результатам тестирования решение важно для испытуемого, же-
лательно дополнить результаты группового тестирования либо индиви-
дуальной проверкой неясных случЦв, либо информацией, полученной из
других источников.
Еще одним ограничением традиционного группового тестирования
является его недостаточная гибкость, поскольку каждый обследуемый те-
стируется одинаково по всем заданиям, хотя отводимое для тестирова-
ния время может быть использовано более эффективно, если каждый ис-
пытуемый сосредоточит свои силы на заданиях, соответствующих его
уровню способностей. Более того, такая процедура могла бы помочь из-
бежать CKVK-и ппи выполнении слишком легких запаний. с одной сто-
268 ГЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
роны, а с другой - способствовала бы снятию фрустрации и тревожности
при попытке выполнить задания, превышающие по сложности уровень
способностей индивида. Напомним, что в некоторых индивидуальных те-
стах, таких, как Станфорд-Бине и словарный тест в картинках Пибоди,
выбор заданий осуществляется экспериментатором в зависимости от от-
ветов испытуемого, т.е. в этих тестах обследуемому предъявляются
только задания, соответствующие его уровню способностей.
Использование компьютеров. С тем чтобы объединить не-
которые достоинства индивидуальпото с преимуществами группового
тестирования, стали использовать технические достижения. Основной ин-
терес до сих пор представляли методики приспособления набора заданий
к характеристикам ответа испытуемых. Во все увеличивающейся литера-
туре, посвященной этой проблеме, такой подход обозначался как адап-
тивный, последовательный, разветвленный, дриспособительный, индиви-
дуализированный, программируемый, динамичный или зависящий от
ответа (F.B. Baker, J971; R. Glaser, A.J. Nitko, 1971; D.J. Weiss, N.E. Betz,
1973). Хотя тесты типа <карандаш-бумага> можно рассматривать как
использующие адаптивные процедуры, но сама методика адаптации тре-
бует использования вычислительной техники (Т. A. Cleary, R. L. Linn,
D.A. Rock, 1968; F.M. Lord, 1971).
В адаптивном тестировании применяются весьма разнообразные
процедуры (L.J. De Witt, D.J. Weiss, 1974; К. С. Larkin, D.J. Weiss, 1975;
D.J. Weiss, N.E. Betz, 1973). Простой пример тестирования в две стадии
приведен на рис. 36. В этом гипотетическом тесте все обследуемые про-
ходят отправной тест, состоящий из 10 заданий самой разной степени
трудности. В зависимости от успешности выполнения отправного теста
обследуемому предъявляется один из трех различных по трудности те-
стов, каждый из которых состоит из 20 заданий. Таким образом, испы-
туемый выполняет только 30 зада-
ний, в то время как тест в целом
содержит 70 заданий.
Иной порядок расположения
заданий дается в пирамидальном
тесте, изображенном на рис. 37. В
этом случае все обследуемые начи-
нают с задания средней трудности.
Если ответ испытуемого по зада-
нию правилен, то ему предъявляет-
ся следующее по степени трудно-
сти задание; если неправилен, то
следующее по степени легкости.
Процедура повторяется после каж-
дого выполнения задания до тех
пор, пока испытуемый не выполнит
10 заданий. Это пример 10-стадий-
ного теста, в котором каждому ис-
пытуемому предъявляется 10 из 55
входящих в тест задачи.
Некоторые вариант обеих
моделей адаптивного тестирова-
ния могут использоваться как в
форме <карандаш-бумага>, тяь- и
Рис. 36. Двустодийное адаптивное тестиро-
вание с заданиями трех уровней трудностей.
Каждый обследуемый проходит отправной
тест и 20 заданий одного из трех уровней
трудностей
Уровни трудности Трудный
Отправной тест20 задании
1-
Средний
-
-Легкий
20 заданий
269 ГРУППОВОЕ ТЕСТИРОВАНИЕ
" 12345678910
тестирования .- и u.w
Результать, ++_+++_+++
испытуемого
Рис. 37. Модель пирамидального тестирования. Жирной линией выделен ход тестиро-
вания испытуемого, чьи результаты выполнения заданий приведены в верхней части
рисунка
в виде приспособленных к компьютерам вариантов. Для более сложных
моделей, не предусматривающих заранее установленной системы предъяв-
ления заданий, возможны только формы, приспособленные для машинно-
го использования. В общем, изучение разных подходов показывает, что
адаптивные тесты могут быть столь же надежными и валидными, как
и общепринятые тесты, но при этом их проведение требует гораздо
меньше времени (K.C.Larkin, D.J.Weiss, 1974; D.J.Weiss, N.E.Betz,
1973). Кроме того, адаптивные тесты обеспечивают большую точность
измерения у индивидов верхнего и нижнего уровней измеряемых данным
тестом способностей (F.M. Lord, 1970; 71b; с, D.J.Weiss, N.E.Betz,
1973). К тому же адаптивное тестирование особенно подходит для упо-
минавшихся в гл. 4 индивидуализированный программ обучения. В этих
тауну (hoDM приводятся в работах Д. Вейса, Н. Беца, Л. Девитта
-" <п-п. п i wi.icc 1974).
270 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
случаях учащиеся проходят учебный предмет в удобном для себя темпе
и могут поэтому выполнять значительно отличающиеся по трудности
тестовые задания. Тестирование с использованием вычислительных ма-
шин позволяет прекращать эксперимент, как только ответы испытуемого
показывают, насколько он овладел содержанием предмета.
Наряду с возможностью приспособить тестирование к индиви-
дуальным способностям и потребностям испытуемых вычислительные
устройства могут помочь преодолеть другие недостатки традиционных
групповых тестов (F. В. Baker, 1971; R.GIaser, A.J.Nitko, 1971;
B.F. Green, 1970). Их использование при анализе неверных ответов мо-
жет помочь в конкретных случаях идентифицировать тип ошибок. Спо-
собность компьютеров к немедленной обратной связи позволяет испы-
туемому выбирать ответы до тех пор, пока не найден правильный ответ,
а такая процедура помогает исследовать способ ответов. Еще одна воз-
можность в разработке процедур конкретных ответов и типов заданий-
исследовать способы решения испытуемым проблемной ситуации. На-
пример, исходя из первоначального представления о проблеме, испы-
туемый может запросить у машины информацию, необходимую для ус-
пешного выполнения каждого этапа решения; или испытуемого могут
попросить указать последовательность шагов решения. Проводятся так-
же исследования с использованием некоторых свободных по форме отве-
тов, таких, как подчеркивание соответствующих слов в предложении или
построение ответов, содержащих только одно слово.
МНОГОУРОВНЕВЫЕ БАТАРЕИ
Обзор. В отличие от индивидуальных шкал и разных типов адаптивных
тестов в традиционных групповых тестах одни и те же задания предъ-
являются всем испытуемым, вне независимости от их индивидуальных
ответов. По этой причине любой групповой тест должен содержать зада-
ния относительно ограниченного диапазона трудности, пригодные для
того конкретного возраста или уровня способностей, для которых он
предназначен. Чтобы обеспечить сравнимые меры интеллектуального
развития в более широком диапазоне, созданы серии частично совпадаю-
щих многоуровневых батарей. Таким образом, любой индивид может те-
стироваться на подходящем именно для него уровне, а другие уровни
могут использоваться при повторном тестировании испытуемого в после-
дующие годы или для сравнительных оценок разных возрастных групп.
Частичное совпадение последовательных батарей позволяет адекватно
выявить нижнюю и верхнюю границу возможностей испытуемых для их
возрастного распределения. Конечно, следует иметь в виду, что
сопоставление трудности задания и способностей испытуемого при при-
менении многоуровневых батарей в лучшем случае носит приблизи-
тельный характер. Более того, в отличие от индивидуализированных ме-
тодик, описанных в предыдущем разделе, ссроставление основывается на
предварительных сведениях об испытуемом таких, как его возраст или
класс, в котором он учится, а не на его ответах по тесту.
Многоуровневые батареи особенно удобны в тех случаях, когда
в школе необходимо провести сравнительные исследования через не-
сколько лет. По этой причине уровни обычно обозначаются в соответ-
271 ГРУППОВОЕ ТЕСТИРОВАНИЕ
дусматривают достаточную степень непрерывности содержания или
охватываемых батареей интеллектуальных функций. Тестовые резуль-
таты повсюду выражаются в одной и той же шкале единиц. Норма-
тивные выборки, используемые на разных уровнях, также более эквива-
лентны, чем это имеет место в раздельно стандартизованных тестах.
В табл. 24 приводятся наиболее представительные многоуровневые
батареи и диапазон охватываемых каждым уровнем классов. Следует от-
метить, что диапазоны достаточно узки, большинство уровней включает
от двух до трех классов. Вместе с тем суммарный диапазон батареи в це-
лом простирается от детей, посещающих детский сад, до студентов
колледжа.
Названия батарей также представляют определенный интерес. Для
обозначения по существу одного и того же типа тестов используются та-
кие понятия, как интеллект, общие способности, умственные способно-
сти, умственная зрелость, обучаемость, школьные способности, способ-
ности к обучению в школе и колледже. В рамках психометрического
подхода эти термины выступают как взаимозаменяемые и рассматри-
ваются как синонимы. Заслуживает внимания то обстоятельство, что
в большинстве созданных в последнее время тестов или пересмотренных
вариантов батарей понятие интеллект заменяется более специальными
терминами. Такая замена объясняется тем, что термин <интеллект> при-
обрел слишком много побочных значений и его использование может
привести к неправильному толкованию тестовых показателей. Одна из
самых последних батарей, представленная в табл. 24, называется <Ана-
лиз обучаемости> и предназначена для предсказания успеваемости
в школе и колледже. Разработка этой батареи начиналась с детального
анализа способностей, необходимых для обучения в школе, что отража-
ло растущий интерес к измерению предпосылок интеллектуальных навы-
ков обучения и других видов обычной деятельности. Главной целью та-
ких батарей является оценка готовности индивида к обучению на любой
стадии получения образования.
Большинство батарей, приведенных в табл. 24, основываются на
стандартных IQ или иных сходных стандартных показателях. В неко-
торых из батарей наряду со стандартным IQ используются несколько
типов норм, в том числе процентили, станайны или эквиваленты классов.
В дополнение к суммарному основному показателю в большинстве бата-
рей предусматриваются раздельные показатели по вербальным и количе-
ственным, лингвистическим и нелингвистическим заданиям. Такое разде-
ление позволяет выявить разницу в выполнении индивидом вербальных
и остальных субтестов, что особенно проявляется на более высоких
уровнях. Была также предпринята попытка (например, в СТММ) пред-
ставить нормы для интерпретации показателей по отдельным субтестам
или их сочетаниям. Однако такой практики вряд ли стоит придерживать-
ся, поскольку частичные показатели обычно весьма ненадежны и слиш-
ком коррелируют друг с другом, чтобы на их основе можно было объяс-
нить индивидуальные различия в выполнении субтестов. Большинство
обсуждаемых в этой главе типов тестов пригодны скорее для оценки об-
щего интеллектуального развития, нежели для установления различий
в способностях. Чтобы пояснить границы применимости современных
многоуровневых батарей, рассмотрим разные уровни каждой из трех ба-
тя пей. Выбранные уровни типичны для применяемых в начальных, сред-
"".пт гпответственно.
272 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
Таблица 24
Представительные многоуровневые батареи
Батарея Уровни классов
rill
Анализ обучаемости (ALP) 1, 11-111, IV-VI, VII-IX, Х-XII
Калифорнийский тест умственной зрелости, Д/с-1, 1,5-111, IV-VI, VII-IX, IX-XII,
вариант 1963 г. (СТММ) XII-XVI
Тест познавательных способностей (CAT) д/с-1, 11-111, III, IV, V, VI, VII, VIII-IX
X-XI, XII
Тест умственных способностей Хенмона--
Нельсона, вариант 1973 г. д/с-2, III-VI, VI-IX, 1Х-Х11
Тесты Кюльманна-Андерсона: измерение д/с, 1, II, III-IV, IV-V, V-VII, VII-IX,
обучаемости в школе и колледже IX-XIII
Тест умственных способностей Отиса-Лен-
нона д/с, 1-1,5, 1,6111,9, IV-VI, VII-IX, X-XII
Тест способностей к обучению в школе
и колледже (SCAT), серии II IV-VI, VIII-IX. X-XII, XII-XIV
Короткий тест способностей к обучению
(SRA) д/с-1, 11-111, IV-VI, VII-VIII, IX-XII
Начальный уровень. Доказано, что применение групповых тестов
можно начинать с детей, посещающих детский сад и с первоклассников.
В дошкольном возрасте индивидуальные тесты предпочтительней, по-
скольку в этом возрасте важен непосредственный контакт с испытуемы-
ми, и к тому же используются устные задания и тесты действия. Однако
уже детям 5-6 лет можно предъявлять отпечатанные тесты, но группы
должны быть небольшими, 10-15 человек. Но и при таком тестировании
экспериментатор должен по-прежнему уделять значительное внимание
каждому ребенку, иначе он не сможет быть уверенным, что дети следуют
инструкции. Экспериментатор должен следить, чтобы правильно перево-
рачивались страницы тестовой тетради и соблюдались другие правила
тестирования. При необходимости экспериментатор вместе с одним-дву-
мя помощниками может проводить исследование и с численно больши-
ми группами.
В групповых тестах начального уровня каждому ребенку дается те-
традь с напечатанными картинками и схемами, составляющими задания
теста, инструктирование ведется устно и обычно сопровождается пока-
зом. Часто включаются предварительные упражения, в которых испы-
туемые пробуют выполнить один или два типа заданий и эксперимента-
тор или куратор проверяют ответы, чтобы быть уверенными, что
инструкция понята правильно. Ребенок отмечает свои ответы в тестовой
тетради цветным или простым карандашом. Большинство тестов тре-
буют лишь умения правильно отметить картинку из данного набора изо-
бражений. Некоторые тесты предполагают умение нарисовать линии, со-
единяющие две точки. Разумеется, тесты начального уровня не требуют
от обследуемых умения читать или писать.
Из табл. 24 видно, что некоторые из приведенных в ней батарей
включают тесты начального уровня. Чтобы пояснить характер этих те-
стов, рассмотрим начальный уровень тестаумственных способностей
Отиса-Леннона. Этот тест, опубликованный в 1967-1969 гг., на всех
273 ГРУППОВОЕ ТЕСТИРОВАНИЕ
уровень фактически сам распадается на два подуровня: начальный 1 (для
детей, посещающих детский сад) и 2 (для первоклассников в первые пол-
года обучения). Эти два уровня идентичны по содержанию и различают-
ся лишь по способам указания ребенком своих ответов. На начальном
уровне 1 ответы отмечаются обведением в кружок выбранного варианта,
и поэтому тест приходится обрабатывать вручную. На начальном уровне
2 используется тетрадь, подготовленная к машинной обработке резуль-
татов тестирования, ребенок отмечает в ней свой ответ, закрашивая рас-
положенный под изображениями небольшой овал (см. рис. 38).
По каждому заданию теста экспериментатором дается устная ин-
струкция. Экспериментатор контролирует также время (около 15 с), необ-
ходимое для выполнения каждого задания. Для проведения всего теста
требуется от 25 до 30 мин. Тест проводится по частям, с коротким пере-
рывом между 1 и II частью; часть 1 состоит из 23 заданий на классифи-
кацию, часть II содержит 32 задания на измерение способностей обра-
зовывать понятия и понимать количественные отношения, общей
осведомленности и умения следовать указаниям. Примеры заданий раз-
личных типов представлены на рис. 38.
Нормы для всех уровней батареи Отиса-Леннона были установ-
лены на тщательно отобранной репрезентативной выборке из 200000
учащихся всех 50 штатов. Показатели могут быть выражены в стан-
дартных IQ с а = 16. Соотнесением с возрастными и классными норма-
ми могут быть также найдены ранги процентилей и станайны. Как было
установлено для начального уровня, правильно построенные тесты обыч-
но имеют удовлетворительную надежность и валидность по критерию.
Для начального уровня 2 батареи Отиса-Леннона данные о надежности
были получены на основе повторного, проводившегося через 2 нед тести-
рования 1047 первоклассников взаимозаменяемой формой теста. Коэф-
фициент надежности оказался равным 0,87. Коэффициент надежности,
определенный методом расщепления, оказался равным 0,90 (для выборки
из 14 044 первоклассников). Проведенное год спустя катамнестическое ис-
следование 144 учащихся дало корреляции с показателями более высоко-
го уровня батареи на уровне 0,80. Коэффициенты, характеризующие те-
кущую и прогностическую валидности теста, вычисленные по результа-
там теста достижений и годовым оценкам, приблизительно равнялись
0,50.
Уровень средних клас с о в. Групповые тесты интеллекта, пред-
назначенные для детей IV класса и старше, весьма сходны как по своему
содержанию, так и по построению. Поскольку учащиеся этой категории
грамотны, преобладают тесты с вербальным содержанием, большинство
тестов включают также арифметические задачи или иные числовые
тесты. Некоторые батареи снабжены нелингвистическими тестами для
оценки тех же способностей у детей, не знающих английского языка, не
умеющих читать или обладающих какими-либо пробелами в образова-
нии.
В качестве примера тестов для средних классов рассмотрим несколь-
ко промежуточных уровней из теста познавательных способностей. Пол-
ная серия рассчитана на два начальных уровня (от детского сада до III
класса) и на различные уровни образования (от III до XII класса). По-
следние содержат восемь уровней (А-Н), представленных в одной тетра-
"" -iwTveMbie, относящиеся к разным уровням, выполняют разные на-
~~"" """"" ппазОМ. ЧТО боЛЬШИНСТВО
274
ТЕСТЫ ОВЩР.ГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ