
книги из ГПНТБ / Васкан, Р. Д. Принципы и средства автоматизированной обработки геологоразведочной информации
.pdfРис. 9. Зависимость количества переданных данных от продолжительности и скорости передачи данных
томатически сформирует сигнал для повторения неверно при нятого блока.
Собственно повторение ошибочного блока, в котором при пе редаче появилась ошибка, может производиться автоматически или вручную, сразу после его обнаружения или в конце пере дачи. Решение этих вопросов зависит от конкретных задач, которые должна обеспечить система ПД.
Общим для второго метода является необходимость на од ной (приемной) или обоих сторонах передачи, как правило, иметь ЗУ для ОБ данных вместе с контрольной информацией. Размер такого ЗУ находится в прямой зависимости от размера ОБ. В то же время при уменьшении размера ОБ возрастает удельный вес контрольной информации, поэтому, например, по значная передача используется довольно редко.
Длина сообщения определяет, каким образом осуществляет ся его повторение. Например, сообщение длиной примерно до 500 бит, очевидно, проще повторять целиком без обнаружения искаженных знаков. Большие сообщения нецелесообразно пов торять целиком, так как вероятность появления ошибки в них будет находиться в прямой зависимости от их размера и поте-
50
ри времени на повторение будут велики. Поэтому длинные сообщения обычно делятся на блоки длиной от нескольких де сятков до нескольких сотен бит, а при обнаружении ошибки отдельные блоки повторяются целиком.
При всех способах передачи, основанных на методе повто рения сообщения, всегда должна предусматриваться возмож ность при появлении долговременной (интенсивной) помехи автоматически останавливать источник данных (передатчик) для выяснения и по возможности устранения их причин.
Определяющим при выборе метода защиты данных, по-ви димому, будут специальные требования, предъявляемые к си стеме ПД, и качество используемых каналов связи.
Различают три вида передачи данных:
1) симплексный, когда данные передаются только в одном направлении (при нем подтверждение о приеме отсутствует),
2)полудуплексный, когда данные могут передаваться попе ременно в обоих направлениях,
3)полнодуплексный, когда данные могут передаваться од новременно в обоих направлениях.
Выбор того или иного вида в значительной степени опреде ляет общие затраты на систему ПД.
Кроме того, качество системы ПД должно соответствовать качеству всей системы обработки данных. Например, не следует применять высококачественную защиту при передаче, если из вестно, что при сборе данных нет той же степени защиты от ошибок, и наоборот.
При наличии больших объемов данных, которые требуется передавать в течение одного сеанса, целесообразно применение больших скоростей передачи, чтобы ограничить время занято сти канала связи. В этом случае фактор срочности, как прави ло, отступает на задний план.
Коммутируемые и выделенные каналы применяются в за висимости от интенсивности передач, объема сообщений и необ ходимой скорости передачи. Большая интенсивность передач требует выделенных каналов, при умеренной интенсивности
можно применять коммутируемые телефонные |
каналы, а при |
малой интенсивности — телеграфные каналы. |
Коммутируемые |
каналы подвержены помехам сильнее, чем выделенные, поэто му они требуют более интенсивной защиты от искажений, т. е. объем сообщений будет косвенно оказывать влияние на выбор метода коррекции ошибок. Например, для коротких сообщений, передаваемых по выделенной сети, вообще может не потребо ваться специальная защита от помех, хотя безусловно такое со четание будет встречаться крайне редко.
На выбор метода защиты от искажений большое влияние оказывает также срочность и назначение сообщений.
Срочными сообщениями считаются такие, обработка которых должна начинаться непосредственно после их получения и на
4* |
51 |
основе которых, как правило, принимаются'важные решения. Срочные сообщения требуют передачи в минимальное время (с максимально возможной скоростью). Действительно, иногда для выбора метода решающими оказываются организационные при чины, не выражаемые количественно. Например, хотя переда ваемое количество данных позволяет применить медленный метод, но фактор срочности ввиду важности информации, име ющий первостепенное значение, заставляет использовать ско ростной метод. Это говорит о том, что ПД нельзя рассматри вать в чистом виде и что она является важной составной частью всей системы обработки данных.
Все упомянутое должно быть принято во внимание при вы боре технических средств и построении конкретной системы ПД. Особого внимания при этом заслуживают важнейшие, опреде ляющие факторы, а именно: объем передаваемой информации, происхождение и назначение данных, а также длина и сроч ность сообщений.
Для решения всех задач аппарата министерства, связанных с необходимостью ПД, внутренняя связь, вероятно, будет обес печиваться с помощью специальной и коммутируемой внутрен ней сети на базе телефонных каналов и частично с помощью городской коммутируемой телефонной сети. Внешняя связь в основном будет обеспечиваться, по крайней мере в ближайшем будущем, с помощью коммутируемой городской и междугород ней телефонной сети, так как работы по созданию в нашей стране единой автоматизированной системы связи подготавли вают для этого все необходимое.
Для нормального функционирования всякой системы ПД необходимо наличие единых стандартных скоростей передачи, стандартных кодов и одинаковых режимов работы аппаратуры, в том числе и одинаковых методов обеспечения надежной за щиты информации при ее передаче. Стандартными скоростями передачи данных по телефонным каналам связи являются: 600 или 1200 бод для коммутируемых каналов и 2400 или 4800 для выделенных каналов.
Для получения более высоких скоростей передачи исполь зуются специальные высокочастотные каналы, а при их отсут ствии специальная аппаратура, работающая параллельно (од новременно) по нескольким обычным телефонным каналам. Например, сейчас такой метод применяется для передачи па раллельно по нескольким телефонным каналам содержания центральных газет из Москвы в ряд крупных городов Совет ского Союза.
В настоящее время в нашей стране и за рубежом разрабо тано большое количество специальной АПД для самых различ ных условий применения.
Однако, учитывая большое разнообразие решаемых в Мини стерстве геологии СССР задач, а главное большое число его
52
внешних связей, необходимо иметь в системе оперативной обра ботки управленческой и плановой информации универсальную аппаратуру передачи данных, способную работать с различны ми типами абонентской АПД и имеющую малые потери при переходе от одного метода работы к другому.
Наиболее типичными представителями такой АПД являются ЭВМ, в которых имеется различное периферийное оборудова ние, а задачу сопряжения с каналами связи и различной спе циальной АПД можно решать при помощи математических средств. Практически для этих целей удобно применять миниЭВМ (особенно с длиной машинного слова в 8 или 16 бит). По существу работа такой ЭВМ будет эквивалентна работе авто номного мультиплексорного канала большой ЭВМ.
Другим аналогичным применением мини-ЭВМ. для обеспе чения ПД будет ее работа в качестве концентратора данных при обеспечении функционирования большого числа различных терминальных устройств.
Наконец, важным является требование, чтобы система ПД входила в систему обработки данных как ее органическая часть.
Использование однотипных и простых в обслуживании ми ни-ЭВМ для решения задач сбора, предварительной обработки и накопления данных, а также и для задач передачи данных поэтому является вполне оправданным в условиях центральных органов управления.
Подытоживая, можно сказать, что для системы оперативной обработки данных в качестве типовых технических средств можно рекомендовать использование многоблочных пишущих и вычислительных автоматов развивающегося типа для предвари тельной подготовки и частичной обработки исходных данных, а также мини-ЭВМ для их накопления, повторной обработки и обслуживания электрических каналов связи.
Учитывая большое разнообразие специализированных уст ройств обработки данных, будем рассматривать их в следую щем разделе одновременно с анализом вопроса о совершенство вании системы оперативной обработки данных в министерстве.
ВОПРОСЫ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ ОПЕРАТИВНОЙ ОБРАБОТКИ ДАННЫХ
Общие положения
Составной частью любой автоматизированной системы уп равления является ее информационное обеспечение, задачей которого является фррмирование, обработка и передача всех данных, необходимых для ее функционирования. Основными элементами информационного обеспечения системы оперативной обработки данных являются:
— язык системы и ее терминология,
53
—перечень задач, которые в ней будут решаться,
—классификация и взаимосвязь этих задач,
—система классификации и кодирования данных,
—методы обеспечения достоверности данных,
—унифицированная терминология (словарь),
—система рабочей документации (формы входных данных,
формы выдачи результатов обработки, различные инструкции
ит. п.),
—технологическая схема обработки данных,
—инструментарий для описания технологических процессов обработки данных в системе и т. п.
В перечень задач, которые будут решаться в системе опе ративной обработки данных, необходимо включить все задачи (расчеты) малой и средней трудоемкости, поскольку она долж на обеспечить механизацию и автоматизацию работ на рабочих местах специалистов и в специализированных подразделениях.
В практике обработке информации предшествует этап ко дирования в соответствии с принятой классификацией для об легчения ее поиска и межсистемного обмена. При этом инфор мация оказывается формализованной, т. е. в виде данных, и представляется в более компактной форме. •
При кодировании экономической информации код должен отвечать следующим требованиям *:
—отражать логические связи между классами данных,
—коды должны быть короткими и простыми **,
—методика кодирования должна учитывать развитие систе мы, к которой применяется классификация,
—алфавитом кода должно быть «известное» упорядоченное множество.
В. С. Немчинов считал, что «тщательное изучение потоков экономической информации и способов кодирования ее, несом ненно, принесет большой народнохозяйственный эффект уже в ближайшие годы. Существующая ныне система организации информации явно устарела. Она отвлекает тысячи людей на бесконечное переписывание документов. К тому же передача современной информации требует слишком много времени, и
поэтому она не может быть оперативно использована***. Учитывая, что система оперативной обработки данных дол
жна обязательно «вживляться» в существующую ныне уже сло жившуюся систему управления, основная проблема при этом будет возникать при решении вопроса о выборе системы ко
* Экономическая семиотика. Под ред. акад. Н. П. Федоренко. — Серия «Оптимальное планирование и управление». М., «Наука», 1970, с. 165.
** При этом применение «очень» 'коротких кодов увеличивает так назы ваемый поисковый шум, а слишком длинных создает трудности, аналогичные существующим в УДК.
*** Н е м ч и н о в В. С. Собр. соч., т. 3. М., изд-во АН СССР, 1961—1962 гг.,
с. 118.
64
дирования каждого отдельного экономического показателя. Од нако для нахождения любого показателя временно можно ис пользовать существующее строгое расчленение всей отраслевой информации на ограниченное число разделов, отдельных таб лиц и регламентацию структуры каждой таблицы в рамках рассматриваемой системы управления. Благодаря этому знание раздела, номера таблицы, а также номера строки и графы поз воляет однозначно определить местонахождение любого эконо мического показателя в массиве данных, обрабатываемых в существующей системе. Показатели, входящие во вспомогатель ные документы, можно также строго фиксировать в системе оперативной обработки данных. Для этого нужно ввести до полнительные индексы, характеризующие привязку экономиче ских данных во вспомогательных формах к показателям в ос новных формах.
Существующая в геологоразведочной отрасли система ин формации, связанная с рассматриваемым объектом, наряду.со многими рациональными чертами имеет ряд недостатков:
—избыточность документов и данных в них,
—нехватка в документах полезной информации,
—трудность поиска полезной информации,
—опаздывание информации,
—недостаточная достоверность информации,
—многократная повторная обработка,
—малая степень использования первичных данных,
—параллельные потоки и неудобные для АСУ формы пред ставления данных *.
Причины искажения информации и их исключение
При передаче информации некоторая ее часть обычно те ряется из-за шума и помех в каналах связи **.
Во-первых, это помехи в физических каналах связи при передаче информации; во-вторых, ошибки при кодировании и декодировании сообщений; в-третьих, семантический шум, т. е. ошибки в интерпретации сообщений (особенно характерен для систем экономического планирования и управления); в-четвер тых, дезинформация.
Первые две группы помех носят случайный характер. Ве роятность возникновения непреднамеренной ошибки определяет ся «уровнем шума» в канале связи. В системе обработки дан ных в аппарате министерства в качестве шума могут выступать обычные канцелярские погрешности: невнимательность, небреж ность или нечеткость записи, арифметические ошибки и т. д.
*М. А. К о р о л е в . Обработка экономической информации на электрон ных машинах (теоретический аспект). М., «Экономика», 1964, с. 98.
**Е. 3. М а й м и н ас . Процессы планирования в экономике. Информа ционный аспект. Минтис. Вильнюс, 19617, с. 1815.
55
Поэтому на практике в системе экономического планирова ния и управления ко всем этим видам помех применяются ме тоды корректировки, основанные на избыточности информации: дублирование сообщений, различные системы контроля и т. д. Они помогают корректировать помехи, хотя эффективность этих методов в сопоставлении с затратами в системах экономическо го управления еще мало исследована.
Понятие достоверности (верности) данных целесообразно определять на каждом отдельном этапе их обработки в систе ме *.
Достоверные — это те данные, которые наиболее эффектив ны с точки зрения процесса выработки управленческих реше ний.
Исследование проблем контроля верности данных в эконо мических системах можно проводить на трех уровнях: синтак сическом, семантическом и прагматическом.
Примером применения первого уровня контроля верности данных может быть использование избыточных, или корректи рующих, кодов. Появление запрещенных кодовых комбинаций в этом случае обнаруживается контролем и свидетельствует о наличии ошибки.
Семантический уровень контроля основывается на том, что в системе обрабатывается смысловая информация. Отсюда вы текает требование в логичности, непротиворечивости и согла сованности данных.
При прагматическом контроле данных исследуются вопросы ценности, доступности и своевременности информации, влияния ошибок в данных на работу системы управления и на объект уп равления, воздействия данных на субъект, принимающий реше ния **.
Улучшение качества информации может идти несколькими путями:
—ускорением сообщения результатов,
—повышением точности результатов,
—• отделением важных результатов от менее важных для увеличения содержания информации в документах,
— получением новых видов информации для удовлетворения изменяющихся требований управления и устранения дублирова ния в обработке.
Носители информации. Методы хранения информации
При разработке информационного обеспечения системы опе ративной обработки данных особое внимание следует уделять
*Экономическая семиотика. Под ред. акад. Н. П. Федоренко. — Серия «Оптимальное планирование и управление». М., «Наука», 1970, с. 224—225.
**Там же, с. 223—231.
56
выбору носителя основного массива данных, выбору носителя первичных данных и способу их получения, так как они в зна чительной мере определяют дальнейшее построение всей си стемы.
В качестве носителя основного массива данных в системе оперативной обработки данных предлагается использовать стан дартные магнитные ленты (МЛ) *, потому что они обеспечи вают большую плотность записи данных (компактность хране ния больших массивов) и удобны для эффективной организации оперативной обработки данных, как это будет показано ниже.
Для обеспечения надежного хранения данных на МЛ в на стоящее время разработаны и опробованы на практике спе циальные методы. Прежде всего это создание дубликатов, так называемых контрольных копий, которые хранятся в специаль ных условиях (при постоянной температуре и влажности и т. п.) и доступ к которым строго ограничен. На основании этих копий в установленные сроки производится сличение дан ных на рабочих кассетах.
Для удобства восстановления данных на |
рабочих |
кассетах |
в последнее время получил распространение |
метод |
хранения |
данных, известный под названием «смены поколений», существо которого сводится к следующему.
При поступлении исходных данных для выполнения какоголибо расчета они записываются на магнитную ленту, которой присваивается № 1 (или I поколение), и эта лента используется для выполнения расчета. При этом все получаемые результаты и данные о состоянии всех устройств ЭВМ, а также данные, предназначенные для длительного хранения, записываются на другую ленту, которой автоматически присваивается № 2 (или II поколение). При использовании ленты № 2 для выполнения последующих расчетов на ее основе создается аналогично лен та № 3 (или III поколение). Все три ленты хранятся в архиве системы в строго идентифицированном виде. При необходимости выполнения очередного4 расчета на базе данных, помещенных на ленте № 3, точно так же создается лента № 4. После этого лента № 1 аннулируется, а оставшиеся три ленты (№ 2, 3, 4) перекодируются таким образом, чтобы с этого момента они выполняли роль соответственно I, II и III поколений.
Сохранение трех лент, а следовательно, и трех поколений оперативных данных позволяет обеспечивать системе очень вы сокую надежность их хранения. Если, например, при хранении или обработке данных в системе будет обнаружено их искажение на МЛ III поколения, то правильные данные на ней могут быть восстановлены путем повторения расчетов по данным, зафикси рованным на МЛ II поколения. Кроме того, вместе с МЛ разных
* При этом магнитные диски будут использоваться как промежуточная память между МЛ и оперативным ЗУ ЭВМ.
67
поколений должны сохраняться и перфоносители, с которых на каждую из хранящихся МЛ вносились первичные данные. Перфоносители с первичными данными для соответствующих МЛ могут уничтожаться только с аннулированием этих МЛ.
В качестве носителя первичных данных в системе оператив ной обработки данных предлагается использовать стандартную восьмиканальную перфоленту.
Фиксирование первичных данных в рассматриваемой системе будет происходить на перфоленточных автоматах (пишущих и вычислительных) при изготовлении первичных документов в окончательно оформленном виде. Синтаксический вид контроля при этом могут, как правило, осуществлять сами автоматы (па ритетный контроль); семантический и прагматический контроль этих документов — специалисты еще до ввода данных на МЛ. Это позволит дополнительно улучшить их достоверность, что не избежно приведет к улучшению функционирования всей системы.
Интеграция обработки данных и создание системы нормативов
Важнейшим методологическим принципом информационного обеспечения системы оперативной обработки данных является интеграция обработки данных.
Интеграция обработки данных в рассматриваемой системе повлияет на организацию ее информационного обеспечения за счет:
—централизации нормативно-справочного хозяйства (на ос нове централизации обработки и хранения данных),
—возрастания требований к достоверности нормативных данных и своевременности их обновления,
—повышения комплексности использования исходных дан
ных,
—возрастания объема метаинформации *.
На создание эффективной системы нормативов большое влияние будет оказывать правильное решение задачи их свое временного обновления, т. е. необходимо, чтобы все нормативы, использующиеся в системе оперативной обработки данных, со ответствовали реальной информации, с которой работают спе циалисты Министерства геологии.
Представляется, что нужное решение этой задачи придет тог да, когда все документы (особенно первичные) будут обраба тываться по новой технологии в системе оперативной обработки данных. В этом случае каждый специалист будет заинтересован в немедленном внесении в соответствующий документ каждого
* Интегрированные системы обработки данных. Под ред. акад. Н. П. Фе доренко.— Серия «Оптимальное планирование и управление». М., «Наука», 1970, с. 65.
58
изменившегося значения показателя (заинтересован |
в обновле |
|
нии этого документа) во |
избежание утраты такого |
изменения. |
А машинная технология |
корректировки каждого |
документа |
позволит не только автоматически зафиксировать характер из менения, но и его принадлежность и время внесения.
Уже одним этим система оперативной обработки данных бу дет принципиально отличаться от существующей в настоящее время ручной обработки, при которой каждый специалист вно сит текущие изменения по строго индивидуальной системе, удоб ной для него лично. В связи с изложенным попытки создать нормативное хозяйство, реально отражающее действительность, на уровне центральных органов планирования и управления при существующей системе наталкивается на большое количество непредвиденных препятствий, что приводит к значительному возрастанию общей трудоемкости и стоимости таких работ. «Отмечено, что достаточно сложная система для обработки ин формации начинает порождать гигантские объемы новой ин формации. Чтобы автоматизированная система обработки не которых данных (тем более включающая автоматизацию выра ботки некоторых решений) могла успешно действовать, необ ходимо вновь разрабатывать и вводить в систему множество правил, условий, стандартов. В огромной степени повышаются требования к полноте, верности и точности исходных данных, в особенности нормативов и сведений о ресурсах. А поскольку разработка этих данных нигде не автоматизирована, а зависит от искусства исполнителя, то трудовые затраты на эти работы обычно бывают чрезвычайно большими, причем намного боль ше, чем затраты на проектирование самой системы обработки данных» *.
Исследуя проблему поиска данных, будем использовать рас смотренную и рекомендуемую выше систему. В дальнейшем и эта система может совершенствоваться для более высокой степе ни интеграции обработки данных и исключения их дублирования.
Совершенствование всей системы плановой и управленческой документации должно производиться постепенно на основе уни фикации всех форм и документов и отдельных показателей, со держащихся в них. Известный авторам опыт механизированной обработки планово-экономической информации на пишущих ав
томатах |
показывает, |
что этот процесс |
начинается |
немедленно |
и сразу |
же приносит |
положительные |
результаты. |
Например, |
упрощается обработка документов и специалистом, и операто ром: простые приемы позволяют полностью отказаться от таких излишних слов, как «в том числе», «из них» и т. п., полностью иметь в документе все названия и единицы измерения, так как вручную они записываются только один раз, а далее могут не-
* Системы экономической информации. Сб. ст. под. ред. акад. Н. П. Фе доренко. М., «Наука», 1967, с. 52.
59