Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сакман Г. Решение задач в системе человек - ЭВМ пер. с англ

.pdf
Скачиваний:
9
Добавлен:
25.10.2023
Размер:
13.88 Mб
Скачать

100

Глава 4

3. Индивидуальные различия перекрывают различия, вызываемые использованием вычислительных систем разных типов.

4. Большинство студентов предпочитают «мгновенную» пакетную обработку разделению времени. Однако сведения о наличии у ис­ пытуемых опыта общения с системами обоих типов ие приводят­ ся. Предпочтение, отдаваемое студентами пакетной обработке, может быть вызвано лучшим знакомством с этим режимом.

дачах, системах использования вычислительной маши­ ны в открытом и закрытом режимах, порядке проведе­ ния экспериментов, оценках деятельности пользовате­ лей, а также основные результаты.

4.2. Методологические проблемы

В настоящем разделе проводится сравнительный ана­ лиз методологий, использованных во всех шести экспе­ риментальных исследованиях, с целью выяснения тех­ нических особенностей и ограничений, характерных для каждого из них. Последовательно рассматриваются все основные элементы экспериментальной работы — испы­ туемые, задачи, характеристики вычислительной систе­ мы, порядок проведения эксперимента и оценки дея­ тельности пользователей.

Во всех шести исследованиях в общей сложности участвовали 213 испытуемых. В основном это были сту­ денты и стажеры, и лишь одна выборка представляла высококвалифицированную группу программистов [20]. В работах с малыми выборками использовались доволь­

но

эффективные планы экспериментов, что обеспечива­

ло

оптимальность по извлекаемой информации.

 

При отборе испытуемых с точки зрения эксперимен­

тальной ситуации весьма существенное значение имеет фактор, который еще не рассматривался. Этим факто­ ром является опыт общения испытуемых с вычисли­ тельными машинами и возникшее у них в результате пристрастие к системам с разделением времени или к системам с пакетной обработкой. Так, например, ис­ пытуемые, участвовавшие в исследовании Эриксона [12], в основном были подготовлены для програм­ мирования, ориентированного на открытый режим ис­ пользования вычислительной системы. В то же время

Сопоставление открытого и закрытого режимов

101

Шацофф, Цзяо и Уайиг отмечают, что опыт их испытуе­ мых в основном связан с пакетной обработкой, поэтому, работая в процессе эксперимента в режиме разделения времени, они использовали процедуры, ориентированные на пакетную обработку. В остальных исследованиях при­ нимали участие испытуемые, имевшие известный опыт работы с вычислительными системами как в открытом, так и в закрытом режимах. Экспериментальный отбор испытуемых, которые были бы в равной степени знако­

мы с открытым и

закрытым режимами вычислитель­

ных систем и имели

опыт работы с ними, очень сложен.

В таких случаях производят специальный отбор испытуе­ мых одинаковой квалификации в сочетании с интенсив­ ным практикумом на системе при равном внимании к обоим режимам, что обеспечивает повышение квалифи­ кации испытуемых до определенного уровня. В рассмат­ риваемых здесь работах этот прием использовался лишь эпизодически.

В эксперименты были включены весьма разнообраз­ ные проблемы, связанные с программированием и реше­ нием задач: математические задачи, разного рода голо­ воломки, процедуры классификации и трансляции. Хотя многие из них типичны для процесса программирования, их едва ли можно считать репрезентативными. Так, сре­ ди них нет задач, предусматривающих обработку боль­ ших информационных массивов, и задач статистическо­ го анализа, т. е. тех типов задач, решение которых' свя­ зано с большим объемом вычислений и требует значительного объема памяти. Задачи такого типа с большей эффективностью обычно решаются в режиме пакетной обработки. С другой стороны, в число экспе­ риментальных задач не входят и такие, для решения которых требуются длинные программы, например про­ граммы, используемые в' системах, ориентированных на воспроизведение графической информации или снабжен­ ных экранными пультами. Эти задачи лучше решать в режиме разделения времени. Все задачи предполагали индивидуальное, а не групповое решение. Самым же главным, вероятно, является отсутствие эмпирических нормативов, позволяющих оценить репрезентативность различных задач, связанных с обработкой данных.

102

Глава

4

Уровень сложности большинства исследований колеб­

лется от самого

простого до

относительно высокого.

Время, необходимое испытуемым для выполнения экс­ периментальной задачи, изменяется от нескольких до 60 часов. Более длинные задачи позволяют получить не­ которое представление о значительных затратах рабо­ чей силы при проведении такого рода исследований и выявляют общую тенденцию использовать в качестве

испытуемых

студентов

или

стажеров.

 

Рассмотрение

возможностей реализации открытого

и закрытого

режимов

обнаруживает основные

дилем­

мы, предстающие

перед

экспериментаторами,

стараю­

щимися обеспечить одинаковые и несмещенные условия для объективного сравнения режимов разделения вре­ мени и пакетной обработки. В двух исследованиях (фирма «Систем девелопмент корп.»), которые были описаны в предыдущей главе, режим разделения вре­ мени осуществляется реально, а пакетную обработку приходилось моделировать на машине Q-32, ориентиро­

ванной на работу в системе

TSS. В исследовании

Смит основная система была

рассчитана на пакет­

ную обработку, а разделение времени было представ­ лено эффективной моделью посредством обеспечения «мгновенного» времени обращения (несколько минут). В этом смоделированном открытом доступе не исполь­ зовались технические средства, позволяющие вести диа­ лог или устанавливать какое-либо другое непосредст­ венное взаимодействие с вычислительной системой. Хотя исследование Смит посвящено главным образом сопо­ ставлению режима обычной пакетной обработки и ре-' жима пакетной обработки с очень малым временем обращения, оно включено в рассмотрение в связи с тем, что содержит интересные данные, характеризующие ре­ жимы разделения времени и пакетной обработки с точ­ ки зрения темпа работы и обратной связи. Лишь в ра­ ботах Адаме и Кохена, а также Шацоффа, Цзяо и Уайи.- га были обеспечены сопоставимые открытые и закры­

тые

режимы без использования моделирования в любых

формах.

 

Машинный язык — еще одна регулируемая перемен­

ная

эксперимента, вызывающая большие сложности.

Сопоставление открытого и закрытого режимов

103

В трех работах испытуемые пользовались одним и тем же языком, в равной степени применимым и удобным для использования в обоих режимах. В исследовании Эриксона входной язык TINT, предназначенный для ре­ жима взаимодействия, использовался в режиме без вся­

кого, взаимодействия.

В

экспериментах,

проведенных

Грантом и Сакманом

[20], большинство

испытуемых

пользовались языком

JTS,

разработанным

первоначаль­

но для СПО и приспособленным в дальнейшем для СРВ. Шацофф, Цзяо и Уайиг вообще ничего не сообщают

о

языке.

Поскольку они указывают, что их

испытуемые

в

режиме

разделения времени использовали

процедуры

пакетной обработки и, кроме того, были лишь поверх­ ностно знакомы с разделением времени, на нашу долю остаются лишь сомнения в том, что их сравнительный анализ основан на действительно сопоставимых исход­ ных позициях для обоих режимов. Те же претензии, хо­ тя бы отчасти, могут быть предъявлены и к остальным работам.

Трудности в проведении экспериментов увеличивают­ ся еще больше из-за проблем, связанных с временем оборота в режиме пакетной обработки. Время обраще­ ния изменяется от нескольких минут до нескольких ча­ сов, а иногда результат может выдаваться лишь на сле­ дующий день. Грант и Сакман зафиксировали эту пере­

менную,

выбрав для

нее значение, равное 2

ч; Адаме

и Кохен

обеспечили

«мгновенное» обращение.

Хотя по­

добная методика предполагала неукоснительное соблю­ дение заданного времени обращения в ходе эксперимен­ та, очевидно, было бы нереалистично не предусмотреть определенную гибкость в системе обращения работ. Дру­ гие исследователи просто.оставляли своих испытуемых на произвол конкретных операционных систем, обеспечи­ вающих пакетную обработку, и не пытались измерить истинное значение времени обращения для каждого про­ хождения работы.

Помимо этого, во всех исследованиях осталось не­ выясненным, занимался испытуемый в течение времени ожидания при использовании пакетной обработки своей задачей или нет. Для некоторых работ неясно, включа­ лось ли время ожидания в подсчет затрат человеко-ча-

104

Глава 4

сов на решение испытуемыми'экспериментальной задачи. В дальнейших исследованиях следует предусмотреть си­ стематическое изменение и контроль времени оборота системы, а также тщательную регистрацию того, чем в это время занимается испытуемый. Отсутствие контроля за этими составляющими эксперимента, несомненно, увеличивает дисперсию ошибки в оценках параметров деятельности пользователя и уменьшает достоверность окончательных результатов.

Что касается процедуры проведения эксперимента, то здесь мы обнаруживаем целый ряд планов эксперимен­ та. Самый сложный из них — план типа «греко-латин­ ский квадрат»1 , использовавшийся в работе Шацоффа, Цзяо и Уайига [50]. В работах Смит [57] и Адаме и Кохена [1] проводилось сравнение средних значений оценок параметров соответствующих групп. Об оценках дисперсии или применении статистических критериев значимости в этих работах не сообщается. Чтобы можно было получить надежные результаты по выборке, со­ стоящей из четырех испытуемых, как в работе [50], экс­ периментальная процедура должна быть наиболее эф­ фективной со статистической точки зрения. Различия в средних, полученные в работе Смит по выборке, вклю­ чающей 127 испытуемых, соответственно более достовер­ ны. Как бы то ни было, можно только сожалеть об отсутствии статистических критериев и невнимании к рассеянию данных. В результате подобные приемы сни­ жают технико-экономическую эффективность экспери­ ментов, не позволяют однозначно интерпретировать ко­ личественные результаты и лишают широкие круги ис­ следователей и пользователей важной информации, относящейся к проблеме индивидуальных различий.

Результаты

трех

экспериментальных исследований,

в которых

использовались планы эксперимента

типа

«латинский квадрат»-, обрабатывались

с помощью дис­

персионного

анализа

и корреляционных

методов.

Это

позволило

не

только

воспользоваться

 

статистическими

1 Греко-латинский квадрат — план эксперимента, в котором че­ тыре фактора располагаются таким образом, что каждый уровень любого фактора лишь один раз сопоставляется с каждым уровнем трех остальных факторов. — Прим. перев.

Сопоставление открытого и закрытого режимов

105

критериями при сопоставлении открытого и закрытого

режимов, но

и получить

ценную

информацию

о задачах

и различиях

в

индивидуальной

деятельности

пользова­

телей. Работа

Гранта и

Сакмана оказалась

единствен­

ной, в которой для анализа деятельности испытуемого применялся факторный анализ.

Экспериментальная процедура предусматривала предварительную группировку испытуемых на основании результатов анкетного опроса. В трех эксперименталь­ ных исследованиях, выполненных по плану типа «латин­ ский квадрат», производили расслоение выборок (напри­ мер, квалифицированные программисты, особо успеваю­ щие студенты и стажеры), а предъявление испытуемым различных экспериментальных ситуаций было рандомизировано и проводилось в соответствии с планом экс­ перимента. Мотивационное регулирование по существу ограничивалось выставлением отметок студентам и рас­ пределением заданий при участии в работе квалифици­ рованных программистов. Личное соперничество, воз­ можно, побуждало большинство испытуемых проявлять большее упорство при работе с предложенными зада­ чами и не высказывать свои соображения о стратегии и тактике решения задач, по крайней мере в экспери­ ментах с малыми выборками. Подобные мотивационные ограничения менее ощутимы в работе Смит, отличаю­ щейся выборкой большого объема.

Процедуры регистрации обычно включают машинную регистрацию машинного времени, регистрацию испытуе­ мыми числа человеко-часов, затраченных на выполне­ ние экспериментальных задач, анкеты, предназначенные для отбора и сопоставления испытуемых, а также для сбора наблюдений и оценок, связанных с установлени­ ем преимуществ вычислительной системы определенного типа и с самооценкой испытуемых. Во всех трех иссле­ дованиях квалификация программистов проверялась с помощью анкетных тестов. Щацофф, Цзяо и Уайиг при­ влекали к работе студентов, получивших отметку А за выполнение «теста оценки способностей в области обра­ ботки данных», практикуемого фирмой IBM (IBM. data processing aptitude test). В двух экспериментальных ра­ ботах, выполненных фирмой «Систем девелопмент

106

Глава 4

корп.», к испытуемым применялся «основной тест квали­ фикации программиста» (ВРКТ). Машинная регистра­ ция, очевидно, более объективна, чем другие процедуры, в то время как регистрация, осуществляемая самими ис­ пытуемыми, подвержена намеренным и непреднамерен­ ным искажениям. В четырех работах с малыми выбор­ ками было проще'наблюдать за деятельностью испытуе­ мых, контролировать результаты их саморегистрации и тактично устранять возникающие несоответствия. В ис­ следованиях с большими выборками контроль экспери­ ментаторами деятельности отдельных испытуемых был менее непосредственным. Как правило, ошибки или сме­ щения, которые могут появиться в результате самореги­ страции испытуемых, подробно не обсуждаются.

Последняя методологическая проблема связана с оценками, используемыми в эксперименте. Во всех рабо­ тах используются две основные оценки эффективности деятельности испытуемых — число человеко-часов и ма­ шинное время, затрачиваемое на выполнение экспери­ ментального задания. Оценка машинного времени пред­ ставляет собой наиболее явный критерий. Оценка числа человеко-часов существует в разных модификациях, и ее составляющие квалифицируются не всегда одинаково. Например, в двух работах, выполненных фирмой «Си­ стем девелопмент корп.», и в исследовании Адаме и Кохена время составления программы рассматривается отдельно от времени ее отладки. В остальных работах используется общая оценка затрат времени (в человекочасах) на выполнение экспериментального задания, ко­ торая различными способами разделяется на составляю­ щие. Сравнение получаемых оценок затрудняется тем, что в разных условиях они определяются по-разному.

В трех исследованиях, предусматривающих использо­ вание планов эксперимента типа «латинский квадрат», некоторое внимание уделялось анализу индивидуальных различий в деятельности пользователей. Хотя изучение индивидуальных различий и не ставилось вначале основ­ ной целью исследований, применение дисперсионного анализа к экспериментальным данным, полученным в каждой работе, позволило выявить многие различия, оп­ ределяемые человеческой природой объекта исследования,

Сопоставление открытого и закрытого режимов

107

В работах, выполненных фирмой «Систем девелоп-

мент корп.», в качестве оценок эффективности

деятель­

ности пользователя использовались окончательный раз­ мер программы и время ее прохождения. Удивительно, что эти объективные, легко регистрируемые и естествен­ ные оценки эффективности программирования отсутст­ вуют в двух других исследованиях. Было бы очень по­

лезно выяснить, в каком

из режимов — открытом

или

закрытом — составлялись

программы, оказавшиеся

бо­

лее эффективными по двум этим критериям.

 

Оценки эффективности

деятельности, использован­

ные в работе Шацоффа и др. [50], включают сравни­ тельные оценки стоимости открытой и закрытой систем, в которых учитываются как человеческий, так и машин­ ный факторы. Эти оценки расходов были получены на основе экспериментального измерения затрат времени пользователей и машинного времени, которые затем бы­ ли использованы в качестве эмпирических параметров при построении простейших стоимостных моделей.

В двух исследованиях фирмы «Систем девелопмент корп.» была предпринята попытка выяснить взаимосвязь между результатами анкетных тестов и эффективностью выполнения экспериментальных заданий, для чего при

анализе индивидуальных различий

учитывались оценки

за «основной тест квалификации

программиста». По­

скольку объемы выборок были малыми, а корреляцион­ ные связи между успешным выполнением анкетных тес­ тов и практическим решением задач обычно оказывают­ ся умеренными или слабыми, к таким тестам в лучшем случае можно относиться как к очень предварительной рекогносцировке.

Итак, каковы же основные методологические харак­ теристики, достоинства и упущения этих шести экспери­ ментальных исследований с точки зрения выбора испы­ туемых, задач, оснащения вычислительной системы, экс­ периментальной процедуры и оценок эффективности деятельности испытуемых? Испытуемыми в основном были студенты и программисты-стажеры, и только в од­ ном исследовании участвовал персонал, достаточно ква­ лифицированный в области обработки данных. В экс­ периментах использовался обширный набор заданий,

108

Глава 4

включающий много типов задач и процедур обработки данных, успешное выполнение которых требовало мно-; гочасовой работы, однако задания определенного типа, одинаково характерные как для режима пакетной обра­ ботки, так и для режима разделения времени, отсутст­ вовали. Трудно оценить, насколько в принципе показа­ тельны эти задачи для процесса обработки данных и хорошо ли они приспособлены для объективного срав­ нения открытого и закрытого режимов использования вычислительных систем. Одна из самых неприятных проблем возникает из-за необходимости обеспечивать сопоставимость систем с разделением времени и с па­ кетной обработкой; много проблем создает подбор под­ ходящей вычислительной машины и эквивалентных языков. И наконец, такая переменная, как время обра­ щения, имеющее для режима пакетной обработки решаю­ щее значение, обычно не подвергалась систематическому контролю.

Экспериментальные процедуры характеризуются са­ мыми различными уровнями сложности, причем их кри­ тические проблемы по большей части связаны с наблю­ дением и регистрацией деятельности пользователей. Раз­ нообразие оценок эффективности деятельности, исполь­ зованных уже на этом раннем этапе исследований, не может не произвести впечатления, так как охватывает

множество показателей, характеризующих

функциониро­

вание систем

человек — машина. Однако

несколько ра­

зочаровывает

малочисленность оценок

эффективности

деятельности испытуемого и работы программ, регист­

рируемых

автоматически. В особенности это относится

к

режиму

открытого

доступа. Необходимо

разработать

и

использовать при

экспериментальном

исследовании

самых разнообразных задач пользователей более мощ­ ные экспериментальные методики, ориентированные на непосредственную регистрацию в темпе изучаемого про­ цесса, например регенеративный метод регистрации деятельности пользователей. Этот метод обеспечивает полную фиксацию в реальном времени всего процесса взаимодействия пользователя с вычислительной маши­ ной и тем самым дает возможность «проигрывать» этот процесс заново в процессе анализа (см. работу [44]).

Сопоставление открытого и закрытого режимов

109

4.3. Проблемы, связанные с интерпретацией результатов

Что же среди результатов четырех предварительных исследований представляет собой достоверную законо­ мерность, какие факты не поддаются однозначной интер­ претации и в чем состоят пробелы и недостатки? Были рассмотрены шесть типов оценок эффективности дея­ тельности, содержащихся в экспериментальных данных: время, затрачиваемое испытуемым, машинное время, за­ траты на вычислительную систему, система предпочте­ ния пользователя, индивидуальные различия и специ­ альные оценки.

Результаты четырех из шести исследований свиде­ тельствуют о том, что разделение времени (или его мо­ дельный эквивалент) позволяет пользователю затрачи­ вать на разработку программ и решение задач меньше времени, чем в режиме пакетной обработки (или его модельном эквиваленте). В работах Шацоффа, Цзяо и Уайига [50], а также Адаме и Кохена [1] обнаружи­ вается противоположная тенденция. В первой из них об­ щее время выполнения экспериментального задания ока­ зывается более коротким при использовании режима раз­ деления времени. С другой стороны, в работе Эриксона [13] было установлено наибольшее относительное преимущество режима разделения времени в отношении эффективности деятельности (почти 2 : 1 по затрате чело­ веко-часов для программистов-стажеров). В этом иссле­ довании предусматривалось использование в обоих ре­ жимах языка, снабженного развитой системой интерпре­ тации и ориентированного на режим взаимодействия пользователя с вычислительной системой, что обеспечи­ вало определенное преимущество режиму разделения времени. Учитывая оба экстремальных результата, можт но считать, что при использовании разделения времени

проявляется тенденция

к уменьшению

общего времени

и числа человеко-часов,

затрачиваемых

на разработку

программ и решение задач. Степень этого повышения эф­

фективности деятельности

не

очень велика — значение

медианы

временных затрат

испытуемых, подсчитанное

по: всем

шести исследованиям,

для режима разделения

Соседние файлы в папке книги из ГПНТБ