Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
копьютерное тестирование.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
249.86 Кб
Скачать

Диктант

Диктант может заменить опрос по теме, заданной для повторения. Его продолжительность обычно 10-20 минут. Он представляет собой систему вопросов, связанных между собой.

Организация самостоятельных работ

При изучении важно, чтобы учащиеся не только знали теоретический материал, но и умели применять его к решению задач и упражнений, обладали бы рядом навыков (вычислительными навыками, умениями преобразовывать выражения и т.д.). Эти умения и навыки могут быть по настоящему проверены только в письменной работе. Обычно самостоятельные работы проводятся после коллективного решения задач новой темы и предшествуют контрольной работе по этой теме.

Организация контрольных работ Контрольная работа может быть кратковременной и долговременной.

  • Перед проведением контрольной работы необходимо определить объект контроля, цель предстоящей работы и средства контроля. Они должны быть сообщены учащимся;

  • В зависимости от вида заданий нужно продумать, каким образом ученик должен их оформить;

  • Учитель должен продумать что он отнесет к недочетам, а что к ошибкам, из этого будет складываться оценка. Критерии оценки хотя бы в общих чертах должны быть известны учащимся;

  • Контрольная работа должна быть посильной для всех учащихся без исключения. Сильным ученикам нужно дать задания труднее;

  • Каждой контрольной работе должна предшествовать самостоятельная работа с аналогичными упражнениями;

2. Машинные средства проверки

Для контроля знаний учащихся используют персональный компьютер. Для контроля знаний учащихся удобно применять типовые расчеты, которые включают наиболее характерные задания базового курса.

В дальнейшем будем говорить о машинных средствах контроля знаний, и, в частности, о тестировании с применением средств вычислительной техники.

Глава II Компьютерное тестирование и обработка тестирования.

Идея компьютерного тестирования напрямую проистекает от идеи программированного контроля знаний. Программированный контроль знаний, в свою очередь, явился неизбежной реакцией на некоторые проблемы прежде всего высшего образования в России. Собственно, примерно те же проблемы распространяются и на школьное образование, но последнее, в силу традиционной косности, очень слабо восприимчиво к новым технологиям.

Основной проблемой любого образования (и не только российского, кстати), является отсутствие четкого контроля за качеством усвоения материала. Причем если в школьной практике учитель еще более-менее имеет возможность с определенной периодичностью проверять уровень текущих знаний ученика, то в ВУЗе преподаватель целый семестр выдает материал и лишь в конце семестра убеждается в уровне его усвоения. Само собой, в системе высшего образования подразумевается, что студенты должны в достаточной степени заниматься и самостоятельным образованием, однако, это предполагаемое самостоятельное получение знаний остается целиком и полностью на совести студента, и преподаватель абсолютно не может знать, кто именно из студентов хоть что-то делает самостоятельно. С получением большим числом обучаемых доступа в Internet положение усугубилось еще и тем, что теперь даже сдача рефератов не подразумевает абсолютно никакой работы с информацией; частенько студенты даже не считают нужным целиком прочесть то, что распечатывают из Сети.

Необходимость систематического контроля за усвоением материала сомнений не вызывает. Прежде всего это давало бы экономию времени преподавателя, который при отсутствии обратной связи вынужден или повторять положения, которые студентами давно усвоены, или излагать положения, основанные на фактах, плохо усвоенных студентами. Во вторую очередь, систематический контроль за уровнем знаний учащихся стимулирует повышение качества обучения за счет усиления акцента на трудных для усвоения положениях и повышения ответственности обучаемых за результаты самостоятельной работы (в случае, естественно, когда преподаватель в этом заинтересован).

Важным моментом систематического программированного контроля знаний является его объективность, что обусловлено переносом акцента с карательной функции на информативную. Только в таком случае учащийся не будет бояться контроля и изобретать способы получения повышенной оценки, и только в таком случае преподаватель будет получать реальную картину знаний учащегося.

Технически программированный контроль знаний прост - учащимся выдается некий бумажный носитель (расцвет программированного контроля вызвал к жизни релейно-ламповых «электронных» монстров, которые можно видеть на экзаменах по сдаче на водительские права), на котором записаны вопросы и варианты ответов, один (или несколько) из которых являются правильными. Учащемуся остается лишь расставить крестики против правильных ответов.

Подобная технология позволила совершить качественный скачок в осуществлении обратной связи между преподавателем и студентом. Программированный контроль, состоящий из 8-10 вопросов, проводится за очень короткий срок - от 5 до 10 минут, и при этом преподаватель может получить полноценную информацию об усвоении пройденного материала всей учебной группой одновременно. Кроме того, техническая реализация программированного контроля позволила полностью избежать списывания, давая возможность предложить каждому учащемуся свой вариант программированной карты.

Недостатком программированного контроля в его до-компьютерном виде являлась высокая трудоемкость создания программированных карт, которые (в идеале) требовались на каждое занятие, и сложность их последующей обработки. С появлением компьютерных технологий у преподавателей появилась возможность резко снизить трудоемкость и подготовки контроля, и обработки результатов. Выделяют пять общих требований к тестам:

  • валидность;

  • определенность (общепонятность);

  • простота;

  • однозначность;

  • надежность.

Валидность теста – это адекватность. Различают содержательную и функциональную валидность: первая – это соответствие теста содержанию контролируемого учебного материала, вторая – соответствие теста оцениваемому уровню деятельности.

Выполнение требования определенности (общедоступности) теста необходимо не только для понимания каждым учеником того, что он должен выполнить, но и для исключения правильных ответов, отличающихся от эталона.

Требование простоты теста означает, что тест должен иметь одно задание одного уровня, т.е. не должен быть комплексным и состоять из нескольких заданий разного уровня. Необходимо отличать понятие «комплексный тест» от понятия “трудный тест”. Трудность теста принято характеризовать числом операций P, которое надо выполнить в тесте: P < 3 – первая группа трудности; P = 3-10 – вторая группа трудности. Не следует также смешивать понятия простоты-комплексности и легкости-трудности с понятием сложности.

Однозначность определяют как одинаковость оценки качества выполнения теста разными экспертами. Для выполнения этого требования тест должен иметь эталон. Для измерения степени правильности используют коэффициент K = P1 / P2 , где P1 – количество правильно выполненных существенных операций в тесте или батарее тестов; P1 – общее количество существенных операций в тесте или батарее тестов. Существенными считают те операции в тесте, которые выполняются на проверяемом уровне усвоения. Операции, принадлежащие к более низкому уровню в число существенных не входят. При K 0.7 считают, что деятельность на данном уровне усвоена.

Понятие надежности тестирования определяют как вероятность правильного измерения величины K [0,. Количественный показатель надежности r 1]. Требование надежности заключается в обеспечении устойчивости результатов многократного тестирования одного и того же испытуемого. Надежность теста или батареи тестов растет с увеличением количества существенных операций P.

Итак, при реализации систем компьютерного тестирования необходимо, на мой взгляд, придерживаться именно этих пяти требований к создаваемым тестам. Но проблема компьютерного тестирования стоит намного острее. Реализация в системах тестирования описанных выше пяти требования к тестам не означает того, что созданный комплекс будет отвечать всем требованиям преподавателя и учащегося.

Большинство программных продуктов не дают возможности преподавателю и студенту, учителю и ученику отойти в реальном учебном процессе от традиционных методик: лекционного курса, конспекта, очного контроля знаний, контрольных работ, зачетов, экзаменов. Недостаток этот можно определить следующим: компьютерный курс является авторским по определению, и поэтому обеспечивает высокое качество образования только при соответствующем сопровождении автором (который, в большинстве случаев, не обладает достаточными знаниями в области информационных технологий). Хотя отдельные компоненты компьютерного обучающего, контролирующего или обучающе - контролирующего курса могут использоваться как независимые учебные модули другими преподавателями (а также и при самостоятельном освоении темы), максимальный эффект, скорее всего, может быть достигнут только во взаимодействии с автором- разработчиком курса.

Если же в образовательный процесс, основанный на авторском мультимедиа курсе, включается другой преподаватель, возникает опасность конфликта личностей, так как на едином образовательном поле сталкиваются не только различные способы методической организации учебного процесса, но и разные личностные подходы.

Что касается проверки качества знаний, неформальный характер процесса оценивания знаний требует применения трудно поддающихся обработке преподавателем компьютерных тестов, необходима активная обратная связь, помогающая оценить правильность усвоения материала, должна быть четко выражена определенность и результативность.

Именно неформальность знаний как таковых, и процесса проверки знаний в частности, породило множество проблем в области компьютерного тестирования, таких как необъективность оценивания, трудность понимания учащимися подготовленных вопросов, медленная работа компьютерных систем, и т.п.

Применение компьютерного тестирования для контроля знаний. Мотивационный эффект.

 Наиболее рациональными путями, обеспечивающими экономию времени, является интенсификация учебного процесса, изменение общей организации обучения и переход от групповых форм занятий к индивидуальным, автоматизированным.

При использовании тестовых заданий, можно отметить проявление следующих положительных и довольно явно выраженных изменений в поведении учащихся: а) повысится активность работы на занятиях;

б) усилится интерес к освоению существующего программного обеспечения и разработке новых программ;

в) появится дух состязательности;

г) увеличится количество положительных эмоций в ходе занятия;

д) появится устойчивое стремление «победить» компьютер, доказав при этом наличие твёрдых знаний предмета;

е) усилится интерес к самостоятельной подготовке.

Технологии и системы тестирования.

Проблема автоматизированного проектирования педагогических тестов, видимо, в ближайшее время не может быть корректно и достаточно полно разрешенной, в частности, из-за ситуационного многообразия и отсутствия четких критериев автоматизации такой плохо формализуемой проблемы. Тем не менее, попытаемся изложить основные принципы автоматизированной разработки тестов и тестирования.

Технология компьютеризированного тестирования должна обладать основными характеристиками:

  1. наличие интерактивной инструментальной среды;

  2. мультипредметное применение;

  3. адекватное отражение конструируемой модели предметной области в процессе тестирования;

  4. возможность выбора алгоритма тестирования;

  5. интегрируемость в различные образовательные технологии;

  6. профилируемость;

  7. масштабируемость;

  8. доступность;

  9. дружественность пользовательского интерфейса;

  10. ведение базы тестовых многоуровневых заданий;

  11. настраиваемое планирование и управление;

  12. нацеленность на достижение более высоких результатов и повышение мотивации.

 Компьютерные тесты обладают рядом преимуществ по сравнению с традиционными    тестами:

  • Повышается интенсивность обучения. Стала возможна проверка большого объема учебного материала.

  • Обеспечивается высокая объективность оценивания результатов.

  • Усиливается доля самостоятельной работы.

  • Работа за компьютером приучает к точности.

  • Компьютерные тесты обеспечивают быструю и качественную обратную связь. Результаты работы сразу становятся известны: сколько заданий верно, оценка. Ученик сразу увидит ошибки и может их исправить.

Компьютерное тестирование обладает также рядом преимуществ, которые позволяют:

  • Применять новые адаптивные алгоритмы тестового контроля;

  • Использовать в тестах мультимедийные возможности компьютеров;

  • Уменьшить объем бумажной работы и ускорить подсчет результатов;

  • Упростить администрирование и проводить тестирование круглый год;

  • Обеспечить комфортные условия работы для каждого тестируемого;

  • Повысить секретность и оперативность передаваемой информации, снизить затраты на организацию и проведение тестирования.

Методические основы создания компьютерных тестов.

Составление компьютерных тестов является довольно сложным делом. Очень важно научиться отличать профессионально сделанный добротный тест от популярно-развлекательного журнального опросника. Настоящий, действенный, валидный и эффективно работающий тест - это завершенный продукт, обладающий определенными свойствами и характеристиками и отвечающий современным методическим требованиям. Тест обладает составом, целостностью и структурой. Он состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов. Целостность теста проявляется во взаимосвязи заданий, включенных в тест. Ни одно из заданий не может быть изъято из теста без ущерба для него. Структура же его проявляется в способе связи заданий между собой.

Создание теста предполагает тщательный анализ содержания учебной дисциплины, классификацию учебного материала, установление межтематических и межпредметных связей, укрупнение дидактических единиц с последующим представлением этих единиц через элементы композиции задания.

Тесты бывают двух видов:

Традиционные. Традиционные тесты представлены в виде системы заданий возрастающей трудности, имеющие специфическую форму, позволяющие качественно и эффективно измерить уровень и оценить структуру подготовленности студентов.

При этом в зависимости от того, по скольким учебным дисциплинам включены в тест задания, традиционные тесты разделяют на гомогенные (проверяющие знания по одному предмету) и гетерогенные (по нескольким предметам).

Нетрадиционные. Нетрадиционные тесты представлены интегративными, адаптивными и критериально-оценочными тестами.

Критериальные - нацелены на общую итоговую диагностику подготовленности выпускника учебного заведения. В одном тесте предъявляются знания из двух и более учебных дисциплин. Проведение подобного тестирования проводится, как правило, при интегративном обучении.

Адаптивные тесты позволяют регулировать трудность предъявляемых заданий в зависимости от ответов тестируемого. При успешном ответе компьютер выдает следующее задание, более трудное по сравнению с предыдущим, а в случае неудачи - более легкое.

Критериально-оценочные тесты предназначены для того, чтобы узнать, какие элементы содержания учебной дисциплины усвоены, а какие - нет. При этом они определяются из так называемой генеральной совокупности заданий, охватывающей всю дисциплину в целом.

Существуют три основные формы тестовых заданий:

  1. Задания с выбором одного или нескольких правильных ответов. Среди этих заданий выделяются такие разновидности, как:

    1. Выбор одного правильного ответа по принципу: один - правильный, все остальные (один, два, три и т.д.) - неправильные.

    2. Выбор нескольких правильных ответов.

    3. Выбор одного, наиболее правильного ответа.

  2. Задания открытой формы.

Задания сформулированы так, что готового ответа нет; нужно сформулировать и вписать ответ самому, в отведенном для этого месте.

  1. Задания на установление соответствия, где элементам одного множества требуется поставить в соответствие элементы другого множества.

  2. Задания на установление правильной последовательности (вычислений, действий, шагов, операций, терминов в определениях).

Для компьютерного контроля знаний, осуществляемого в виде тестов, больше всего подходят задания с выбором одного правильного ответа. Среди этих тестов наиболее распространенными в настоящее время являются тесты с возможностью выбора правильного ответа из:

  1. двух предложенных вариантов ответа;

  2. трех предложенных вариантов.

Выбор формы зависит от:

  1. цели тестирования;

  2. содержания теста;

  3. технических возможностей;

  4. уровня подготовленности преподавателя в области теории и методики тестового контроля знаний.

Каждая из форм позволяет проверить специфические виды знаний. Проверять с помощью тестов имеет смысл актуальные знания, которые студенты должны уметь применять на практике. Проверяются знания, находящиеся в оперативной памяти, то есть, не требующие обращения к справочникам, словарям, картам, таблицам и т.п. Приведем классификацию видов и уровней знаний, разработанную В. Аванесовым:

  1. Знание названий, имен.

  2. Знание смысла слов, названий и имен.

  3. Знание фактов.

  4. Знание определений.

  5. Сравнительные, сопоставительные знания.

  6. Знание противоположностей, противоречий, антонимов и т.п. объектов.

  7. Ассоциативные знания.

  8. Классификационные знания.

  9. Причинные знания, знание причинно-следственных отношений, знание оснований.

  10. Процессуальные, алгоритмические, процедурные знания.

  11. Технологические знания.

  12. Вероятностные знания.

  13. Абстрактные знания.

  14. Методологические знания.

При разработке компьютерного теста очень важно продумать уровень его трудности в целом и отдельных тестовых заданий. Традиционно вопросы располагаются в порядке возрастающей трудности. Больше всего в процентном отношении составляется вопросов средней трудности. При подборе заданий необходимо ориентироваться на общий уровень подготовленности тестирующихся. Так, например, при прохождении тестирования слабой по подготовленности группы студентов, трудные задания теста «не работают», так как ни один учащийся не может на них ответить. У сильной группы студентов не будут "работать" слабые задания и т.п.

Самым лучшим можно считать тест, в котором заложено широкое содержание, и оно охватывает более глубокие уровни знаний.

Разработчики тестов должны придерживаться следующих принципов: Тест должен соответствовать целям тестирования;

  • Нужно определить значимость проверяемых знаний в общей системе проверяемых знаний;

  • Должна быть обеспечена взаимосвязь содержания и формы теста;

  • Тестовые задания должны быть правильными с точки зрения содержания;

  • Должна соблюдаться репрезентативность содержания учебной дисциплины в содержании теста;

  • Тест должен соответствовать уровню современного состояния науки;

  • Содержание теста должно быть комплексным и сбалансированным;

  • Содержание теста должно быть системным, но, вместе с тем, вариативным.

Разработка заданий в тестовой форме проводится на основе ряда обоснованных требований в рамках единой методики. В рамках методики, принятой в мировой практике, к таким требованиям относят следующие:

1) в тексте задания должна быть устранена всякая двусмысленность или неясность формулировок;

2) основная часть задания формулируется предельно кратко (как правило, не более одного предложения);

3) все варианты ответа к одному заданию должны быть приблизительно одинаковой длины;

4) из текста задания необходимо исключить все вербальные ассоциации, способствующие выбору правильного ответа с помощью догадки.

Содержание заданий и всего теста в целом должно удовлетворять определенным критериям, задающим систему нормативных требований к качеству содержания теста: 1) критерий полноты отображения материала учебной программы; 2) критерий соответствия содержания теста знаниям и умениям, на проверку которых тест направлен; 3) критерий соответствия теста требованиям Образовательного стандарта по дисциплине; 4) критерий качества содержания тестовых заданий.

Помимо критериев в классической тестологии выделяют следующие принципы отбора содержания тестового материала: 1) значимость; 2) научная достоверность; 3) соответствие содержания теста уровню современного состояния науки; 4) репрезентативность; 5) возрастающая трудность учебного материала; 5) вариативность содержания; 6) системность содержания; 7) комплексность и сбалансированность содержания теста; 8) взаимосвязь содержания и формы; 9) соответствие цели.

Методы измерения качества тестов опираются на теорию корреляций, главными параметрами которой являются надежность и валидность. Надежность - устойчивость результатов теста, получаемых при его применении. Валидность - пригодность теста, т.е. способность качественно измерять то, для чего он создан по замыслу авторов. Определение надежности и валидности тестов проводится путем статистической обработки результатов массового тестирования по различным группам испытуемых.

Под длиной теста понимается количество заданий, входящих в тест. Классическая теория тестов утверждает: чем длиннее тест, тем он надежнее. Но практика аудиторного тестирования показывает, что если тест очень длинный, то ухудшается мотивация и внимание. Оптимальная длина теста – 30-60 заданий. Каждый тест имеет оптимальное время тестирования - время от начала процедуры тестирования до момента наступления утомления. Разброс по характеристикам порога наступления утомления довольно большой - от 20 до 100 минут в одной возрастной группе. Основные причины утомления: возраст, мотивация, монотонность выполняемой работы, индивидуальные особенности испытуемых.

Минимальная продолжительность тестирования зависит от форм, количества и трудности заданий. Например, для выполнения простого тестового задания закрытой формы с выбором одного элемента из предложенных достаточно 10-15 секунд.

С развитием информационных технологий и коммуникаций методы тестирования вышли на новый уровень: тестирование с использованием персональных компьютеров и on-line тестирование с использованием Internet. Применение информационных технологий для оценивания качества обучения дает целый ряд преимуществ перед проведением обычного контроля. Прежде всего – это возможность организации централизованного контроля, обеспечивающего охват всего желаемого контингента учащихся. Далее, компьютеризация позволяет сделать контроль более объективным, не зависящим от субъективности преподавателя.

Развитие информационных технологий способствовало разработке и внедрению в практическое использование различных программных комплексов тестирования.

Анализ современной научно-методической литературы] а также информации из сети Internet позволяет сформулировать основные признаки, которыми должен обладать современный программный комплекс тестирования:

  1. Основное требование для современной контролирующей системы заключается в абстрагировании от содержания, уровня сложности, тематики, типа и предметной направленности отдельных тестовых заданий. Подобная стандартизация позволяет не прибегать для создания каждого очередного теста и обработки его результатов к услугам программистов, а, освоив определенную систему, наполнять ее содержательную часть по различным дисциплинам на основе общих принципов. Высокая степень абстрагированности от конкретного учебного материала, отобранного для составления теста, определяет свойство универсальности;

  2. Контролирующая система должна состоять из подсистем следующего назначения: создание тестов (формирование банка вопросов и заданий, стратегий ведения опроса и оценивания), проведение тестирования (предъявление вопросов, обработка ответов), мониторинг качества знаний обучаемых на протяжении всего времени изучения темы или учебной дисциплины на основе протоколирования хода и итогов тестирования в динамически обновляемой базе данных. Наличие независимых, но взаимосвязанных, компонентов (подсистем): создания теста, мониторинга результатов, проведения тестирования определяет свойство модульности;

  3. Данные в контролирующей системе должны храниться централизованно на удаленном сервере. Доступ к данным осуществляется через локальную сеть. Наличие единого банка данных вопросов для каждой запущенной копии программы определяет свойство централизованности;

  4. Контролирующая система должна разграничивать права пользователей по типичным ролям (учащийся, преподаватель) для предотвращения доступа тестируемых к правильным ответам теста и т.п. – свойство защищенности;

  5. Контролирующая система может обладать возможностью настройки на проведение диагностирования с применением различных моделей диагностики для получения результатов, определённых ведущей идеей диагностирования, например, применение адаптивной модели тестирования – свойство адаптивности;

  6. В контролирующей системе должна проводиться математическая обработка результатов тестирования, в частности, расчет трудности заданий теста – свойство обработки результатов теста.

Перечислены основные требования, предъявляемые к современному программному комплексу тестирования. Также современную систему диагностирования должны определять следующие признаки: режимы тестирования, типы вопросов, используемых в тесте, случайная выборка заданий, ограничение времени тестирования, импортирование тестовых заданий из документа MicroSoft Word.

Таким образом, в настоящее время определение трудности заданий теста является одним из требований, предъявляемых к современному программному комплексу тестирования.

Обработка результатов теста с определением трудности заданий теста необходима для научного подхода к составлению тестов.

С этой точки зрения интересной моделью обработки тестов, ориентированных на критерий, является однопараметрическая модель Раша [4, 10], которая позволяет:

  • формировать тест из заданий различной степени трудности;

  • делать достаточно объективный вывод о способности тестируемого на основании количества решенных задач;

  • делать вывод о вероятности решения того или иного задания определенного уровня трудности.

Для автоматизации расчетов интерпретации результатов тестирования разработана программа, которая обладает следующими возможностями:

  • удобный интерфейс, снабженный комментариями и подсказками;

  • ввод первоначальных данных о тесте - количество учащихся, количество вопросов теста;

  • конструирование матрицы заданий - элементами матрицы являются результаты ответов на вопросы теста, вопрос теста оценивается как правильно или неправильно;

  • расчет трудности заданий:

  • a. за единицу измерения взят логит;

  • b. в качестве диапазона значений взят интервал от -3.5 до 3.5.

  • построение шкалы логитов, на которой изображается трудность заданий;

  • проведение анализа шкалы логитов, который заключается: a. в определении заданий с одинаковой трудностью; b. если шкала не равномерно заполнена, то предлагает удалить задания с определенной трудностью.

  • расчет способности каждого учащегося:

  • a. за единицу измерения взят логит;

  • b. в качестве диапазона значений взят интервал от -3 до 3;

  • c. шкала была переведена в обычную порядковую четырехбалльную шкалу оценивания. Для разметки диапазонов оценок использовались экспериментальные данные 105 респондентов;

  • d. по произведенным расчетам среднее значение ( ) оценки диапазонов равно 0.2, а среднее квадратичное отклонение составило 2 единицы;

  • e. шкала оценок поcтроена следующим образом:

f. корреляция между оценкой, выставленной учителем и полученной с помощью разработанной компьютерной программы составляет K=0.72, что является свидетельством существования значимой корреляционной связи. Следовательно, программа может быть использована для выставления традиционных оценокучащимся в процессе их обучения.

  • построение шкалы способностей учащихся;

  • построение характеристической кривой, позволяющей прогнозировать с какой вероятностью будет выполнено задание определенной трудности;

  • сохранение данных графиков и таблиц в файл формата MicroSoft Word.

Например, при проверке 20 учащихся с помощью теста, состоящего из 14 заданий, были получены следующие результаты:

  1. Шкала логитов, представленная ниже на форме, заполнена неравномерно, тест состоит из заданий средней степени трудности, отсутствуют задания с высокой и низкой степенью трудности, у заданий 3, 11 и 10, 14 трудность одинаковая;

  1. По результатам тестирования рассчитаны способности учащихся, оцененные в четырехбалльной системе:

  1. На основании построенной характеристической кривой можно спрогнозировать решение того или иного задания с определенной степенью сложности:

Невысокие требования к программному и аппаратному обеспечению делают программу доступной для школ с различным уровнем аппаратного о программного обеспечения. В частности, данная программа апробируется на факультете информатики, факультете учителей начальных классов Челябинского Государственного Педагогического Университета, МОУ №94 г. Челябинска.

Таким образом, в настоящее время методы тестирования в нашей стране представляют собой важное, перспективное и развивающееся направление для реформирования системы образования.

Одним из главных вопросов для тестирования является обработка результатов теста, в частности, расчет трудности заданий. Для такой обработки результатов теста может быть использована однопараметрическая модель тестов Г.Раша. Компьютерная программа, созданная на основе данной модели, позволяет автоматизировано и объективно:

  1. Проводить обработку теста за счет определения трудности заданий, таким образом, что тест формируется из заданий различной степени трудности.

  2. Интерпретировать результаты тестирования, делая вывод о способности учащихся.

  3. Прогнозировать решение того или иного задания определенного уровня трудности.