Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анастази.doc
Скачиваний:
71
Добавлен:
10.02.2015
Размер:
2.23 Mб
Скачать

Глава II. Групповое тестирование

В то время как индивидуальные тесты, такие, как шкалы Станфорд-Би-

не и Векслера, находят свое основное применение в клинике, групповые

тесты используются преимущественно в системе образования, граждан-

ских службах, в промышленности и армии. Напомним, что массовое те-

стирование началось в CffiABO время первой мировой войны с разра-

ботки армейских тестов альса и бета. Армейский альфа представлял

собой вербальный тест, предИазначенный для отбора и распределения

новобранцев. Армейский бета был неязыковым тестом и предназначался

для людей, не говорящих по-английски и неграмотных. Эти тесты яви-

лись своего рода образцом для последующего развития большого числа

групповых тестов для гражданского населения.

Варианты обоих армейских тестов для гражданского населения ис-

пользуются до сих пор и известны как проверочный альфа, или модифи-

цированная форма 9 (более распространено название альфа 9), и пере-

265 ГРУППОВОЕ ТЕСТИРОВАНИЕ

средством предварительного отбора с последующим использованием

классификационных батарей, предназначенных для распределения воен-

нослужащих по соответствующим армейским службам. AFQT обеспечи-

вает единый показатель, получаемый на основе выполнения равного чис-

ла заданий на выявление словарного запаса, арифметических, техниче-

ских способностей, понимания пространственных отношений.

В этой главе дается обзор используемых в настоящее время ос-

новных типов групповых тестов. Начнем с того, что рассмотрим принци-

пиальное различие между групповыми и индивидуальными тестами. За-

тем обсудим характеристики многоуровневых батарей, охватывающих

широкий диапазон возрастов и уровней развития. И наконец, проанали-

зируем групповые тесты, предназначенные для колледжей и других выс-

ших учебных заведений.

ГРУППОВЫЕ И ИНДИВИДУАЛЬНЫЕ ТЕСТЫ

Преимущества группового тестирования. Групповые тесты

разработаны в первую очередь как средство массового тестирования. По

сравнению с индивидуальными тестами у них есть свои достоинства

и свои недостатки. Позитивной стороной групповых тестов является воз-

можность проводить их одновременно с таким количеством людей, ко-

торые удобно разместятся в имеющемся помещении, и предъявлять их

через микрофон. Благодаря развитию техники группового тестирования

стало доступным проведение программ массового тестирования. Предъ-

явление заданий теста в отпечатанном виде, использование простых от-

ветов, которые легко зафиксировать в тестовой тетради или на бланке

ответов, способствовали тому, что отпала необходимость взаимодей-

ствия экспериментатора и испытуемого один на один.

Еще одной особенностью группового тестирования, облегчившей

проведение массовых исследований, является значительное упрощение

функций проводящего тест. В отличие от большой опытности и обучен-

ности, необходимых экспериментатору, например, при тестировании по

шкале Станфорд-Бине, для предъявления большинства групповых те-

стов от экспериментатора требуется лишь умение читать простые ин-

струкции испытуемым и точно соблюдать время. Конечно, желательно

проводить с экспериментаторами предварительные тренировочные заня-

тия, так как неопытность может стать причиной отклонения от стандар-

тизованной процедуры тестирования и тем самым сказаться на результа-

тах теста. В то же время при групповом тестировании могут быть

обеспечены более единообразные условия, чем при индивидуальном, по-

скольку роль экспериментатора сведена к минимуму. Предъявление те-

стовых заданий в форме звуковых записей, фильмов открывает дальней-

шие возможности для стандартизации процедуры тестирования

и применения его в больших масштабах.

Обработка показателей при групповом тестировании обычно носит

более объективный характер и может быть выполнена простым служа-

щим. Результаты большинства групповых тестов могут обрабатываться

на ЭВМ. Кроме того, независимо от способов обработки групповые

тесты обычно предусматривают специальные бланки ответов и тестовые

тетради, а раз в тестах все ответы заносятся на отдельные бланки, те-

стовые брошюры могут использоваться до тех пор, пока не износятся,

------- ~" "n,,nn -ге-гпппгп ллаТРГШЯТТЯ КПЯНКИ

266 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

ответов занимают меньше места, чем тестовые брошюры, и потому бо-

лее удобны для групп с большим числом испытуемых.

Еще одно преимущество группового тестирования-относительная

легкость и быстрота сбора данных и как следствие более благоприятные

по сравнению с индивидуальным тестированием условия для установле-

ния норм. Для большинства современных стандартизованных групповых

тестов нет ничего необычного в том, что их нормативные выборки вклю-

чают от 100000 до 200000 человек, в то время как даже наиболее тща-

тельно разработанные индивидуальные шкалы при стандартизации

с трудом собирают данные для 2000-4000 случаев.

Групповые тесты существенно отличаются от индивидуальных как

по форме, так и по расположению заданий. Хотя в групповых тестах мо-

гут использоваться местоименные вопросы, требующие произвольных

ответов (они особенно часто встречались в первых групповых тестах), все

же на сегодняшний день более типичным является применение вопросов

с множественным выбором заранее подготовленных ответов. Введение

такой формы было вызвано необходимостью соблюдать принцип еди-

нообразия и объективности при обработке результатов как машинным,

так и ручным способом. Что касается расположения заданий, то в отли-

чие от тестов типа шкал Вине, в которых задания располагаются по воз-

растным уровням, в групповых тестах задания обычно группируются по

сходству содержания в отдельные, проводимые в определенное время суб-

тесты. Внутри каждого субтеста задания, как правило, расположены по

возрастающей трудности. Такое расположение обеспечивает испытуемо-

му возможность попробовать свои силы в каждом типе заданий (напри-

мер, на словарный запас, арифметику, пространственные взаимосвязи

и т.д.) и завершить выполнение самых легких пунктов каждого вида до

того, как начнутся более трудные, на которые может понадобиться боль-

ше времени.

Однако практическая трудность, встречающаяся при использовании

раздельных субтестов, состоит в том, что менее опытные и менее внима-

тельные экспериментаторы могут неправильно организовывать тест во

рремени. Такие ошибки, по-видимому, чаще встречаются и имеют более

серьезные последствия, когда вместо указания общего времени проведе-

ния теста приводится время проведения отдельных заданий. Чтобы отне-

сти отведенный на тест лимит времени с таким расположением заданий,

которое позволило бы испытуемым испробовать все типы задач, в неко-

торых тестах используется спиральное расположение заданий. Одним из

первых примеров такого расположения заданий были самоприменимые

тесты умственных способностей Отиса, в которых, как указывает их на-

звание, предпринята попытка свести роль экспериментатора к минимуму.

Такое же расположение было сохранено и в следующем тесте ум-

ственных способностей Отиса-Леннона, предназначенном для испы-

туемых старше IV класса. В тесте со спиральным расположением зада-

ний наиболее легкие задание каждого типа представлены в самом начале

теста, затем идут следующие по степени трудности задания каждого ти-

па и т.д., примерно так, как это приводится ниже.

Ответ

1. Противоположным ненависти является: а) вражда, б) страх, в) любовь,

г) дружба, д) игра ........................ ()

2. Если 3 карандаша стоят 25 центов, сколько карандашей можно купить на

75 центов?

267 ГРУППОВОЕ ТЕСТИРОВАНИЕ

3. У птицы не всегда бывают: а) крылья, б) глаза, в) ноги, г) гнездо, д) клюв.

4. Противоположным чести является: а) слава, б) бесчестье, в) трусость,

г) страх, д) поражение ....................... ()

Для того чтобы избежать необходимости повторять инструкции для

каждого задания и свести их число к минимуму, в некоторых тестах по

спирали располагаются не единичные задания, а блоки из 5-10 заданий.

Такой прием используется, например, в армейском квалификационном

тесте и тесте способности к обучению Совета по вступительным экзаме-

нам в колледж.

Недостатки группового тестирования. Хотя групповые

тесты обладают некоторыми желательными качествами и отвечают за-

дачам современного тестирования, следует отметить и их ограничен-

ность. При групповом тестировании у экспериментатора гораздо меньше

возможностей добиться взаимопонимания с испытуемым, заинтересо-

вать его и заручиться его сотрудничеством. Любые случайные со-

стояния обследуемого, такие, как болезнь, утомление, беспокойство или

тревожность, которые могут влиять на выполнение заданий, гораздо

труднее выявить в групповом тестировании. В целом лица, незнакомые

с такой процедурой, скорее покажут более низкие результаты в груп-

повых тестах, нежели в индивидуальных. Существуют данные, свидетель-

ствующие о том, что дети с нарушениями эмоциональной сферы лучше

выполняют индивидуальные тесты, а не групповые (Е.М. Bower, 1969;

J. Willis, 1970).

Вместе с тем групповые тесты подвергаются нападкам за ограниче-

ния, налагаемые на ответы испытуемых. Особенно критикуются задания

с множественным выбором ответов и такие стандартные типы заданий,

как аналогии, нахождение сходства и классификация (В. Hoffman, 1962;

L. La Fave, 1966). Правда, используемые при этом доводы не всегда до-

статочно убедительны. Одним из спорных является аргумент, что такие

задания ставят в невыгодное положение тех, кто блестяще и оригиналь-

но мыслит, кто ищет в ответах необычный смысл. Заметим, кстати, что

если это и происходит, то очень редко, о чем говорят анализ заданий

и данные по валидности.

Часть критиков, что характерно для подхода Пиаже (I.E. Sigel, 1963),

указывают на важность анализа ошибок и выяснения причин, которые

побуждают индивида выбирать определенный ответ. Несомненно, груп-

повые тесты почти или совсем не позволяют непосредственно наблюдать

поведение испытуемых и устанавливать источник нетипичного выполне-

ния тестов. По этой и другим причинам в тех случаях, когда принимае-

мое по результатам тестирования решение важно для испытуемого, же-

лательно дополнить результаты группового тестирования либо индиви-

дуальной проверкой неясных случЦв, либо информацией, полученной из

других источников.

Еще одним ограничением традиционного группового тестирования

является его недостаточная гибкость, поскольку каждый обследуемый те-

стируется одинаково по всем заданиям, хотя отводимое для тестирова-

ния время может быть использовано более эффективно, если каждый ис-

пытуемый сосредоточит свои силы на заданиях, соответствующих его

уровню способностей. Более того, такая процедура могла бы помочь из-

бежать CKVK-и ппи выполнении слишком легких запаний. с одной сто-

268 ГЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

роны, а с другой - способствовала бы снятию фрустрации и тревожности

при попытке выполнить задания, превышающие по сложности уровень

способностей индивида. Напомним, что в некоторых индивидуальных те-

стах, таких, как Станфорд-Бине и словарный тест в картинках Пибоди,

выбор заданий осуществляется экспериментатором в зависимости от от-

ветов испытуемого, т.е. в этих тестах обследуемому предъявляются

только задания, соответствующие его уровню способностей.

Использование компьютеров. С тем чтобы объединить не-

которые достоинства индивидуальпото с преимуществами группового

тестирования, стали использовать технические достижения. Основной ин-

терес до сих пор представляли методики приспособления набора заданий

к характеристикам ответа испытуемых. Во все увеличивающейся литера-

туре, посвященной этой проблеме, такой подход обозначался как адап-

тивный, последовательный, разветвленный, дриспособительный, индиви-

дуализированный, программируемый, динамичный или зависящий от

ответа (F.B. Baker, J971; R. Glaser, A.J. Nitko, 1971; D.J. Weiss, N.E. Betz,

1973). Хотя тесты типа <карандаш-бумага> можно рассматривать как

использующие адаптивные процедуры, но сама методика адаптации тре-

бует использования вычислительной техники (Т. A. Cleary, R. L. Linn,

D.A. Rock, 1968; F.M. Lord, 1971).

В адаптивном тестировании применяются весьма разнообразные

процедуры (L.J. De Witt, D.J. Weiss, 1974; К. С. Larkin, D.J. Weiss, 1975;

D.J. Weiss, N.E. Betz, 1973). Простой пример тестирования в две стадии

приведен на рис. 36. В этом гипотетическом тесте все обследуемые про-

ходят отправной тест, состоящий из 10 заданий самой разной степени

трудности. В зависимости от успешности выполнения отправного теста

обследуемому предъявляется один из трех различных по трудности те-

стов, каждый из которых состоит из 20 заданий. Таким образом, испы-

туемый выполняет только 30 зада-

ний, в то время как тест в целом

содержит 70 заданий.

Иной порядок расположения

заданий дается в пирамидальном

тесте, изображенном на рис. 37. В

этом случае все обследуемые начи-

нают с задания средней трудности.

Если ответ испытуемого по зада-

нию правилен, то ему предъявляет-

ся следующее по степени трудно-

сти задание; если неправилен, то

следующее по степени легкости.

Процедура повторяется после каж-

дого выполнения задания до тех

пор, пока испытуемый не выполнит

10 заданий. Это пример 10-стадий-

ного теста, в котором каждому ис-

пытуемому предъявляется 10 из 55

входящих в тест задачи.

Некоторые вариант обеих

моделей адаптивного тестирова-

ния могут использоваться как в

форме <карандаш-бумага>, тяь- и

Рис. 36. Двустодийное адаптивное тестиро-

вание с заданиями трех уровней трудностей.

Каждый обследуемый проходит отправной

тест и 20 заданий одного из трех уровней

трудностей

Уровни трудности Трудный

Отправной тест20 задании

1-

Средний

-

-Легкий

20 заданий

269 ГРУППОВОЕ ТЕСТИРОВАНИЕ

" 12345678910

тестирования .- и u.w

Результать, ++_+++_+++

испытуемого

Рис. 37. Модель пирамидального тестирования. Жирной линией выделен ход тестиро-

вания испытуемого, чьи результаты выполнения заданий приведены в верхней части

рисунка

в виде приспособленных к компьютерам вариантов. Для более сложных

моделей, не предусматривающих заранее установленной системы предъяв-

ления заданий, возможны только формы, приспособленные для машинно-

го использования. В общем, изучение разных подходов показывает, что

адаптивные тесты могут быть столь же надежными и валидными, как

и общепринятые тесты, но при этом их проведение требует гораздо

меньше времени (K.C.Larkin, D.J.Weiss, 1974; D.J.Weiss, N.E.Betz,

1973). Кроме того, адаптивные тесты обеспечивают большую точность

измерения у индивидов верхнего и нижнего уровней измеряемых данным

тестом способностей (F.M. Lord, 1970; 71b; с, D.J.Weiss, N.E.Betz,

1973). К тому же адаптивное тестирование особенно подходит для упо-

минавшихся в гл. 4 индивидуализированный программ обучения. В этих

тауну (hoDM приводятся в работах Д. Вейса, Н. Беца, Л. Девитта

-" <п-п. п i wi.icc 1974).

270 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

случаях учащиеся проходят учебный предмет в удобном для себя темпе

и могут поэтому выполнять значительно отличающиеся по трудности

тестовые задания. Тестирование с использованием вычислительных ма-

шин позволяет прекращать эксперимент, как только ответы испытуемого

показывают, насколько он овладел содержанием предмета.

Наряду с возможностью приспособить тестирование к индиви-

дуальным способностям и потребностям испытуемых вычислительные

устройства могут помочь преодолеть другие недостатки традиционных

групповых тестов (F. В. Baker, 1971; R.GIaser, A.J.Nitko, 1971;

B.F. Green, 1970). Их использование при анализе неверных ответов мо-

жет помочь в конкретных случаях идентифицировать тип ошибок. Спо-

собность компьютеров к немедленной обратной связи позволяет испы-

туемому выбирать ответы до тех пор, пока не найден правильный ответ,

а такая процедура помогает исследовать способ ответов. Еще одна воз-

можность в разработке процедур конкретных ответов и типов заданий-

исследовать способы решения испытуемым проблемной ситуации. На-

пример, исходя из первоначального представления о проблеме, испы-

туемый может запросить у машины информацию, необходимую для ус-

пешного выполнения каждого этапа решения; или испытуемого могут

попросить указать последовательность шагов решения. Проводятся так-

же исследования с использованием некоторых свободных по форме отве-

тов, таких, как подчеркивание соответствующих слов в предложении или

построение ответов, содержащих только одно слово.

МНОГОУРОВНЕВЫЕ БАТАРЕИ

Обзор. В отличие от индивидуальных шкал и разных типов адаптивных

тестов в традиционных групповых тестах одни и те же задания предъ-

являются всем испытуемым, вне независимости от их индивидуальных

ответов. По этой причине любой групповой тест должен содержать зада-

ния относительно ограниченного диапазона трудности, пригодные для

того конкретного возраста или уровня способностей, для которых он

предназначен. Чтобы обеспечить сравнимые меры интеллектуального

развития в более широком диапазоне, созданы серии частично совпадаю-

щих многоуровневых батарей. Таким образом, любой индивид может те-

стироваться на подходящем именно для него уровне, а другие уровни

могут использоваться при повторном тестировании испытуемого в после-

дующие годы или для сравнительных оценок разных возрастных групп.

Частичное совпадение последовательных батарей позволяет адекватно

выявить нижнюю и верхнюю границу возможностей испытуемых для их

возрастного распределения. Конечно, следует иметь в виду, что

сопоставление трудности задания и способностей испытуемого при при-

менении многоуровневых батарей в лучшем случае носит приблизи-

тельный характер. Более того, в отличие от индивидуализированных ме-

тодик, описанных в предыдущем разделе, ссроставление основывается на

предварительных сведениях об испытуемом таких, как его возраст или

класс, в котором он учится, а не на его ответах по тесту.

Многоуровневые батареи особенно удобны в тех случаях, когда

в школе необходимо провести сравнительные исследования через не-

сколько лет. По этой причине уровни обычно обозначаются в соответ-

271 ГРУППОВОЕ ТЕСТИРОВАНИЕ

дусматривают достаточную степень непрерывности содержания или

охватываемых батареей интеллектуальных функций. Тестовые резуль-

таты повсюду выражаются в одной и той же шкале единиц. Норма-

тивные выборки, используемые на разных уровнях, также более эквива-

лентны, чем это имеет место в раздельно стандартизованных тестах.

В табл. 24 приводятся наиболее представительные многоуровневые

батареи и диапазон охватываемых каждым уровнем классов. Следует от-

метить, что диапазоны достаточно узки, большинство уровней включает

от двух до трех классов. Вместе с тем суммарный диапазон батареи в це-

лом простирается от детей, посещающих детский сад, до студентов

колледжа.

Названия батарей также представляют определенный интерес. Для

обозначения по существу одного и того же типа тестов используются та-

кие понятия, как интеллект, общие способности, умственные способно-

сти, умственная зрелость, обучаемость, школьные способности, способ-

ности к обучению в школе и колледже. В рамках психометрического

подхода эти термины выступают как взаимозаменяемые и рассматри-

ваются как синонимы. Заслуживает внимания то обстоятельство, что

в большинстве созданных в последнее время тестов или пересмотренных

вариантов батарей понятие интеллект заменяется более специальными

терминами. Такая замена объясняется тем, что термин <интеллект> при-

обрел слишком много побочных значений и его использование может

привести к неправильному толкованию тестовых показателей. Одна из

самых последних батарей, представленная в табл. 24, называется <Ана-

лиз обучаемости> и предназначена для предсказания успеваемости

в школе и колледже. Разработка этой батареи начиналась с детального

анализа способностей, необходимых для обучения в школе, что отража-

ло растущий интерес к измерению предпосылок интеллектуальных навы-

ков обучения и других видов обычной деятельности. Главной целью та-

ких батарей является оценка готовности индивида к обучению на любой

стадии получения образования.

Большинство батарей, приведенных в табл. 24, основываются на

стандартных IQ или иных сходных стандартных показателях. В неко-

торых из батарей наряду со стандартным IQ используются несколько

типов норм, в том числе процентили, станайны или эквиваленты классов.

В дополнение к суммарному основному показателю в большинстве бата-

рей предусматриваются раздельные показатели по вербальным и количе-

ственным, лингвистическим и нелингвистическим заданиям. Такое разде-

ление позволяет выявить разницу в выполнении индивидом вербальных

и остальных субтестов, что особенно проявляется на более высоких

уровнях. Была также предпринята попытка (например, в СТММ) пред-

ставить нормы для интерпретации показателей по отдельным субтестам

или их сочетаниям. Однако такой практики вряд ли стоит придерживать-

ся, поскольку частичные показатели обычно весьма ненадежны и слиш-

ком коррелируют друг с другом, чтобы на их основе можно было объяс-

нить индивидуальные различия в выполнении субтестов. Большинство

обсуждаемых в этой главе типов тестов пригодны скорее для оценки об-

щего интеллектуального развития, нежели для установления различий

в способностях. Чтобы пояснить границы применимости современных

многоуровневых батарей, рассмотрим разные уровни каждой из трех ба-

тя пей. Выбранные уровни типичны для применяемых в начальных, сред-

"".пт гпответственно.

272 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

Таблица 24

Представительные многоуровневые батареи

Батарея Уровни классов

rill

Анализ обучаемости (ALP) 1, 11-111, IV-VI, VII-IX, Х-XII

Калифорнийский тест умственной зрелости, Д/с-1, 1,5-111, IV-VI, VII-IX, IX-XII,

вариант 1963 г. (СТММ) XII-XVI

Тест познавательных способностей (CAT) д/с-1, 11-111, III, IV, V, VI, VII, VIII-IX

X-XI, XII

Тест умственных способностей Хенмона--

Нельсона, вариант 1973 г. д/с-2, III-VI, VI-IX, 1Х-Х11

Тесты Кюльманна-Андерсона: измерение д/с, 1, II, III-IV, IV-V, V-VII, VII-IX,

обучаемости в школе и колледже IX-XIII

Тест умственных способностей Отиса-Лен-

нона д/с, 1-1,5, 1,6111,9, IV-VI, VII-IX, X-XII

Тест способностей к обучению в школе

и колледже (SCAT), серии II IV-VI, VIII-IX. X-XII, XII-XIV

Короткий тест способностей к обучению

(SRA) д/с-1, 11-111, IV-VI, VII-VIII, IX-XII

Начальный уровень. Доказано, что применение групповых тестов

можно начинать с детей, посещающих детский сад и с первоклассников.

В дошкольном возрасте индивидуальные тесты предпочтительней, по-

скольку в этом возрасте важен непосредственный контакт с испытуемы-

ми, и к тому же используются устные задания и тесты действия. Однако

уже детям 5-6 лет можно предъявлять отпечатанные тесты, но группы

должны быть небольшими, 10-15 человек. Но и при таком тестировании

экспериментатор должен по-прежнему уделять значительное внимание

каждому ребенку, иначе он не сможет быть уверенным, что дети следуют

инструкции. Экспериментатор должен следить, чтобы правильно перево-

рачивались страницы тестовой тетради и соблюдались другие правила

тестирования. При необходимости экспериментатор вместе с одним-дву-

мя помощниками может проводить исследование и с численно больши-

ми группами.

В групповых тестах начального уровня каждому ребенку дается те-

традь с напечатанными картинками и схемами, составляющими задания

теста, инструктирование ведется устно и обычно сопровождается пока-

зом. Часто включаются предварительные упражения, в которых испы-

туемые пробуют выполнить один или два типа заданий и эксперимента-

тор или куратор проверяют ответы, чтобы быть уверенными, что

инструкция понята правильно. Ребенок отмечает свои ответы в тестовой

тетради цветным или простым карандашом. Большинство тестов тре-

буют лишь умения правильно отметить картинку из данного набора изо-

бражений. Некоторые тесты предполагают умение нарисовать линии, со-

единяющие две точки. Разумеется, тесты начального уровня не требуют

от обследуемых умения читать или писать.

Из табл. 24 видно, что некоторые из приведенных в ней батарей

включают тесты начального уровня. Чтобы пояснить характер этих те-

стов, рассмотрим начальный уровень тестаумственных способностей

Отиса-Леннона. Этот тест, опубликованный в 1967-1969 гг., на всех

273 ГРУППОВОЕ ТЕСТИРОВАНИЕ

уровень фактически сам распадается на два подуровня: начальный 1 (для

детей, посещающих детский сад) и 2 (для первоклассников в первые пол-

года обучения). Эти два уровня идентичны по содержанию и различают-

ся лишь по способам указания ребенком своих ответов. На начальном

уровне 1 ответы отмечаются обведением в кружок выбранного варианта,

и поэтому тест приходится обрабатывать вручную. На начальном уровне

2 используется тетрадь, подготовленная к машинной обработке резуль-

татов тестирования, ребенок отмечает в ней свой ответ, закрашивая рас-

положенный под изображениями небольшой овал (см. рис. 38).

По каждому заданию теста экспериментатором дается устная ин-

струкция. Экспериментатор контролирует также время (около 15 с), необ-

ходимое для выполнения каждого задания. Для проведения всего теста

требуется от 25 до 30 мин. Тест проводится по частям, с коротким пере-

рывом между 1 и II частью; часть 1 состоит из 23 заданий на классифи-

кацию, часть II содержит 32 задания на измерение способностей обра-

зовывать понятия и понимать количественные отношения, общей

осведомленности и умения следовать указаниям. Примеры заданий раз-

личных типов представлены на рис. 38.

Нормы для всех уровней батареи Отиса-Леннона были установ-

лены на тщательно отобранной репрезентативной выборке из 200000

учащихся всех 50 штатов. Показатели могут быть выражены в стан-

дартных IQ с а = 16. Соотнесением с возрастными и классными норма-

ми могут быть также найдены ранги процентилей и станайны. Как было

установлено для начального уровня, правильно построенные тесты обыч-

но имеют удовлетворительную надежность и валидность по критерию.

Для начального уровня 2 батареи Отиса-Леннона данные о надежности

были получены на основе повторного, проводившегося через 2 нед тести-

рования 1047 первоклассников взаимозаменяемой формой теста. Коэф-

фициент надежности оказался равным 0,87. Коэффициент надежности,

определенный методом расщепления, оказался равным 0,90 (для выборки

из 14 044 первоклассников). Проведенное год спустя катамнестическое ис-

следование 144 учащихся дало корреляции с показателями более высоко-

го уровня батареи на уровне 0,80. Коэффициенты, характеризующие те-

кущую и прогностическую валидности теста, вычисленные по результа-

там теста достижений и годовым оценкам, приблизительно равнялись

0,50.

Уровень средних клас с о в. Групповые тесты интеллекта, пред-

назначенные для детей IV класса и старше, весьма сходны как по своему

содержанию, так и по построению. Поскольку учащиеся этой категории

грамотны, преобладают тесты с вербальным содержанием, большинство

тестов включают также арифметические задачи или иные числовые

тесты. Некоторые батареи снабжены нелингвистическими тестами для

оценки тех же способностей у детей, не знающих английского языка, не

умеющих читать или обладающих какими-либо пробелами в образова-

нии.

В качестве примера тестов для средних классов рассмотрим несколь-

ко промежуточных уровней из теста познавательных способностей. Пол-

ная серия рассчитана на два начальных уровня (от детского сада до III

класса) и на различные уровни образования (от III до XII класса). По-

следние содержат восемь уровней (А-Н), представленных в одной тетра-

"" -iwTveMbie, относящиеся к разным уровням, выполняют разные на-

~~"" """"" ппазОМ. ЧТО боЛЬШИНСТВО

274

ТЕСТЫ ОВЩР.ГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ