
- •Введение
- •Начало книгопечатания и создания библиотек для слепых в россии (1806—1920 гг.)
- •Развитие сети библиотек для слепых в россии
- •Обзор тенденций и характера благотворительности в россии времен царствования династии романовых
- •Международная деятельность специальных библиотек для слепых россии
- •Актуальные проблемы формирования и развития фондов специальных библиотек для слепых россии
- •Информационное обеспечение незрячих
- •Исторический экскурс
- •Технологии, используемые в библиотеках и доступные читателям: Лазерные компакт-диски
- •Интернет
- •Компьютерные дискеты
- •Оптическое сканирующее устройство распознавания символов (ocr)
- •Роль библиотекаря в условиях прямого доступа к источникам информации
- •Другие библиотеки
- •Обзор библиотек, использующих передовую технологию
- •Возможности доступа к информации в будущем
- •Специальная библиотека как инновационный центр работы с инвалидами
- •Информационное обслуживание незрячих татар российской федерации на родном языке
- •Термин «доступ» в современном языке информатики
- •Роль изданий по брайлю в системе информационного обеспечения слепых
Термин «доступ» в современном языке информатики
Современная идеология информатизации
В середине восьмидесятых годов нашего столетия произошел качественный скачок в развитии человечества. Мир перешел от «энергетической» эры, в течение которой порядка сотни лет основные затраты цивилизации были направлены на выработку энергии (тепловой, электрической), к эре «информационной», когда общие затраты человечества на выработку, передачу и переработку информации превысили затраты на все другие виды деятельности.
Информатика быстро прогрессирует, и если в восьмидесятых годах еще писали о «вычислениях данных», то уже в 1990 году чаще упоминали об «обработке данных», а сегодня в ходу понятия «сетевое взаимодействие», «сетевая обработка информации», «сети обмена данными». При этом упор делается не столько на вычисления данных, сколько на понятия: «сети», «удаленное взаимодействие», «обмен», «доступ». В настоящее время, с принятием в США концепции «Национальной Информационной Инфраструктуры», все чаще упоминается необходимость создания гигантских хранилищ информации, построенных по подобию знакомых всем библиотек, хранящих не только тексты, но и речь, музыку, видеоизображения.
В современной информатике библиотеки вообще начинают играть особую роль, как наиболее полные хранилища накопленной человечеством информации. На данном этапе речь идет о цифровом кодировании хранимых в библиотеках документов, и обеспечении доступа к ним всех слоев населения, независимо от расстояния и места, через глобальные информационные сети. В соответствии с упомянутой выше концепцией, библиотеки должны стать основными хранилищами текстовой, звуковой, видео информации широкого пользования. Для достижения данной цели необходимо провести глобальную информатизацию всей библиотечной работы. Из пассивного хранилища культурных ценностей библиотека должна превратиться в активный катализатор цивилизации, предоставляющий абонентам возможность общения с авторами, специалистами, творцами. Реализация этой цели станет поворотным пунктом в истории библиотек и всего человечества, хотя для этого необходимо преодолеть серьезные социальные, культурные, экономические и технические трудности.
Предыдущий этап эры информатизации — этап реализации общедоступного сетевого информационного обмена любого абонента, имеющего компьютер, модем и канал, с другим таким же абонентом, — позволяет на следующем этапе осуществить доступ пользователя к новым информационным хранилищам, либо с домашнего компьютера, либо из общественных компьютерных центров. Традиционная форма хранения накопленных знаний в виде текстовых книг с иллюстрациями, как известно, создала для удобства пользователей при поиске нужных им сведений специальные хранилища — библиотеки. Для поиска информации в библиотечном деле придумана и успешно эксплуатируется библиографическая карточка, в которой содержатся выжимки основных сведений о единице хранения — книге. Карточки образуют каталоги, сформированные по тематическим признакам в разделы и подразделы. С их помощью удобно вести поиск, но это занимает достаточно много времени.
Электронные каталоги в технике информатики, позволяющие значительно ускорить поиск нужной информации, строятся аналогичным образом в виде отдельных баз данных. Современное мощное оборудование и программные пакеты позволяют в настоящее время создавать полнотекстовые базы данных и работать с ними. Такие базы данных содержат не только каталог, но и сами издания в виде электронных документов. Однако отсутствие единого подхода при создании каждой базы, отсутствие унифицированного, стандартного каркаса, пригодного для разнообразных электронных документов, привело к катастрофической ситуации, выразившейся в несовместимости разных систем поиска и выдачи данных, а значит, и в недоступности информации о данных, хранящихся в базах. Данная ситуация становится особенно очевидной при международном сетевом информационном взаимодействии.
Выходом из положения стало предложение о создании машиночитаемых документов, размечаемых с помощью дискрипторов, то есть имеющих в своем составе специальные, невидимые глазом метки, которые позволяют удобно производить поиск необходимых документов среди их множества, либо быстро находить в документе требуемый раздел, участок, главу. Иначе говоря, это идея об описании структуры документа с целью его распознавания при чтении. Развивая данные предложения, в конце 60-х годов фирма IВМ разработала Generalized Markup Language (GML), обобщенный язык разметки, который был принят в качестве стандарта Американским национальным институтом стандартизации (ANSI). Дальнейшие усилия института по доработке языка привели к признанию в международном масштабе и появлению «Стандартного обобщения языка разметки» — SGML (Standart Generalized Markup language), который был принят в виде международного стандарта в 1986 году Международной организацией по стандартизации (ISO) —IS 8879.
2. SGML
Описывая язык SGML, мы в первую очередь затронем его основное предназначение. Главная цель языка SGML — сделать произвольный электронный информационный документ доступным. Например, текст, набранный в одном текстовом редакторе, включающий в себя иерархическое деление на главы с соответствующим оформлением, карты, схемы, иллюстрации, как правило, нельзя прочитать в другом текстовом процессоре такого же уровня. Пример — Microsoft World и CHI —Write. Используя язык SGML, вы получаете возможность делать данные документы общедоступными.
Смысл работы языка SGML заключается в следующем: на первоначальный текст наносятся в электронном неотображаемом виде метки, которые описывают структуру документа — образуют его каркас. Язык является аппаратно и программно независимым. Более того, можно сказать, что SGML — мета-язык. Общеизвестно, что все документы, по своему смысловому значению, и, следовательно, по структуре, могут быть разбиты на определенные типы — книга, газета, письмо, факт и т. д. SGML позволяет написать конструкцию, описывающую определенный тип документа, чтобы потом автоматизировать работу и упростить считывание документа устройствами отображения. Такая конструкция называется «Definition Type Document». DTD является шаблоном для нанесения «меток», обеспечивающих последующий поиск, и представляет собой набор правил структурирования конкретного типа документов. К основному текстовому файлу таким образом, добавляется сделанное на языке SGML описание структуры текста и обрамление содержания. Обрамление содержания состоит из взаимоувязанных меток, встречающихся в документе определенное (допустимое) количество раз, имеющих определенные (допустимые) признаки — атрибуты. Данные метки располагаются в строго определенной иерархической последовательности по отношению друг к другу. Данная схема обрамления описана в DTD, которая является как бы шапкой документа. Грубым примером аналогии структуры SGML — документа может служить описательная часть файлов, сделанных в текстовом процессоре Microsoft World. Поисковый аппарат, запрограммированный для языка SGML, сначала отбирает документ из множества по типовой принадлежности, а затем либо отображает его на экране, либо передает по сети пользователю, либо распечатывает и т. д. Это некоторым образом напоминает поиск нужной литературы по классификационным признакам УДК, ББК и т. д.
Как мы отметили вкратце ранее, в DTD содержится полный перечень всех возможных элементов документа (заголовки, аннотации, рефераты, абзацы, сноски и т. д.), задаются правила их взаимного расположения (например, автор размещается перед заглавием, а заглавие, в свою очередь, перед введением, но не наоборот), указываются возможные атрибуты документа (Крупный шрифт для абзаца, Жирный шрифт для заглавия и т. д.), и оговариваются метки-дескрипторы для каждого элемента. Поиск по такому документу напоминает поиск по каталожной карточке.
Элементами текста, обрамляемыми языком SGML, могут быть как целиком книги, журналы, газеты, так и их главы, разделы, параграфы, перечни, таблицы и тому подобное. Каждый элемент имеет тагдескриптор (ключевой определитель), идентифицирующий его и его самого отношение к другим элементам. Правильно организованная структура текста позволяет осуществлять поиск информации с учетом контекста и с проверкой логических условий, а также поиск элементов, совпадающих с заданным образцом.
В настоящее время уже появились документы, снабженные аппаратом поиска нужных глав, разделов, помеченных глав. В данных книгах при помощи SGML описаны шрифты и их цвет, фон и т. д. Все это позволяет удобнее пользоваться предоставляемой информацией. Одним из специальных видов SGML — НТМL предназначен для разметки мультимедийных документов, использующихся в Интернет.
Проанализировав возможность языка SGML, теперь мы можем определить более конкретно термин «доступ». Для библиотеки термин «Доступ» к информации» теперь приобретает специализированное, в некотором роде техническое значение, так как, например, работа с SGML сродни программированию. По смыслу термин «доступ» становится альтернативным термину «комплектование библиотечных материалов». Другими словами, библиотека выполняет свои функции, если она в состоянии удовлетворить запрос читателя, даже если в данный момент она не располагает нужными материалами. Предполагается, что доступ обеспечит библиотеке данные материалы в весьма краткие сроки. Но доступ к информации в конечном счете — цель читателя. Библиотека — лишь средство. Рассуждая таким образом, американские ученые стали думать о расширении круга читателей. Они стали думать о возможности создания электронных документов, пригодных для использования людьми, лишенными зрения. Одна из предпосылок к этому — возможности языка.
3. Создание SGML документов для слепых
Одним из инициаторов работ в данном направлении является доктор Рубинский. Юрий Рубинский — член Международного комитета по созданию документов для «доступа» (ICADD), а также президент и соучредитель одной из фирм, занимающей лидирующее положение по выпуску программного обеспечения для языка SGML и одного из его вариантов НТМL. Идея использования языка SGML для создания электронных документов, для чтения слепыми людьми появилась в 1989, когда выяснились три основополагающие вещи:
1) Существует хорошая связь между структурой маркировки SGML и Брайлем;
2) Существует возможность использования конвертеров для преобразования документов SGML в документы с крупным шрифтом, или звуковые;
3) Существует возможность создания автоматических систем трансформирования документов SGML в документы, пригодные для чтения слепыми людьми.
Создав стандартный протокол преобразования, можно будет автоматически трансформировать тексты, что значительно сократит стоимость и время.
В декабре 1991 года Рубинский стал членом ICADD, и была начата работа над воплощением идеи. Работы ведутся на основе трех основополагающих принципов:
1) технология маркировки текстов должна быть простой и гибкой;
2) должен использоваться только один набор меток; набор меток для не визуального преобразования документа нежелателен;
3) сохраняемый документ должен содержать максимально возможное количество меток, чтобы его распознавание было бы проведено наиболее корректно.
В соответствии с этими принципами перед комитетом ставятся следующие цели:
1) максимальная автоматизация процессов трансформирования текстов;
2) простота технического оснащения (программного обеспечения);
3) уменьшение стоимости изготовления документов для чтении слепыми людьми.
Было выяснено, что можно создать DTD, описывающие документы с большим шрифтом, звукогенерацией, а также брайлевские из уже существующих. Необходимо только добавить дополнительные атрибуты.
Результатом работы ICSDD стало создание 22-х новых атрибутов, используемых для поддержки выходных форматов Брайля, большого шрифта, синтезатора речи. Данные атрибуты были застандартизированы в ISO. Атрибуты можно вводить как при разметке текста, так и зафиксировать их непосредственно в DTD. 2-й способ наиболее предпочтителен, так как ускоряет маркировку, по он предназначен для достаточно однотипных документов.
После выполнения процесса маркировки, документ передается программе конечной переработки, которая создает вид документа, преобразованного из SGML.
В качестве текста доктор Рубинский использовал свою книгу. Были созданы три версии книги. Создание Брайлевской версии заняло около 2-х часов, создание версии со звукогенерацией — около 90 минут, версия «Крупный шрифт» — около двух дней. Было отмечено, что данные сроки относятся к трансформации данного романа, который достаточно однороден по структуре, но по мнению Юрия Рубинского для других вариантов структур сроки не должны значительно увеличиваться.
Как пример важности «доступа» в автоматизации библиотек, можно привести тот факт, что печатная версия книги появилась спустя три месяца после изготовления компьютерных версий.
Исходя из вышесказанного, можно сделать следующие выводы:
«Доступ» в современной информатике начинает играть наиболее важную роль. Получение очевидной и понятной информации, накопленной в таком огромном количестве — дело чрезвычайно важное. Один из путей реализации всеобщего доступа к информации — использование простых стандартных средств обработки документов. Таким средством является SGML.
Библиотека Иностранной литературы изучает возможности использования SGML. Если со стороны других библиотек будет проявлен интерес к данной, очень важной, на наш взгляд, проблеме, мы готовы сотрудничать.
О. Н. ПИЛЮГИН, главный редактор журнала «Литературные чтения»