
- •Е.Г. Гаевская цифровое культурное наследие Учебно-методическое пособие
- •Введение
- •Раздел 1.Проблемы сохранения цифрового наследия
- •Сохранение цифрового наследия: история, направления деятельности и сферы влияния
- •Организация деятельности по сохранению цифрового наследия
- •Основные характеристики программ в области сохранения цифрового наследия
- •Концепция устойчивого развития программы
- •Стратегии организации доступа к материалам цифрового наследия
- •Раздел 2. Жизненный цикл объектов цифрового наследия
- •2.1. Общие подходы к определению жизненного цикла объектов цифрового наследия
- •2.2. Создание объекта цифрового наследия
- •2.3. Отбор объекта для хранения
- •2.4. Хранение материалов цифрового наследия
- •2.5. Контроль за сохранением материалов цифрового наследия
- •2.6. Защита данных
- •2.7. Обеспечение доступа к материалам цифрового наследия
- •Раздел 3. Гуманитарные аспекты проблемы сохранения цифрового культурного наследия
- •3.1. Междисциплинарные аспекты термина «виртуальность»
- •3.2. Виртуальность в контексте истории искусства
- •3.2.1. Классификации технологий виртуальной реальности.
- •3.2.2. Цифровое компьютерное искусство
- •3.2.3. Цифровая графика
- •3.3. Социо-когнитивистские аспекты виртуальности
- •3.4.Теоретические аспекты развития виртуальных музеев
- •Раздел 4. Публикации в Интернет коллекций произведений традиционного изобразительного искусства
- •4.1. Деятельность "Corbis Corporation"
- •4.2. Проект Google-art
- •4.3. Интернет портал Europeana
- •4.4. Проект "Русский музей: виртуальный филиал"
- •4.5. Виртуальный музей Канады
- •4.6. Виртуальный репозиторий учебных ресурсов «Нередица — связь времен»
- •4.8. Наборы презентационных материалов музеев в виртуальном пространстве
- •Раздел 5. Публикации в Интернет коллекций произведений цифрового и гибридного изобразительного искусства
- •5.1. Роль виртуального пространства в социализации участников художественного процесса
- •5.2. Публикации произведений цифровой живописи
- •5.3. Публикации произведений, выполненных в техниках компьютерной графики
- •5.4. Публикации произведений, выполненных в техниках цифровой скульптуры
- •Раздел 6. Электронные экспозиции в музеях
- •6.1. Концептуальные подходы к формированию электронных музейных экспозиций
- •6.2. Аппаратно-программный экспозиционно-выставочный комплекс
- •6.3. Экспозиции, организованные посредством технологий виртуальной реальности
- •6.4. Экспонирование произведений цифрового искусства в рамках музейного и медийного пространства
- •6.5. Сайты музеев
- •Заключение
- •Список информационных источников
- •Раздел 1
- •Раздел 2
- •Раздел 3
- •Раздел 4
- •Раздел 5
- •Раздел 6
- •Раздел 1 Проблемы сохранения цифрового наследия
- •Вопросы для самопроверки
- •Охарактеризовать специфику цифрового наследия по сравнению с культурным и экологическим
- •Раздел 2. Организация деятельности по сохранению цифрового наследия
- •Вопрос 1 Выберите верное определение(я) термина "цифровое наследие"
- •Вопрос 2.Наиболее полное описание жизненного цикла объекта цифрового наследия включает следующие этапы:
- •Вопрос 3.Угрозы утраты объектов цифрового наследия - исключите лишний пункт:
- •Вопрос 4. Исключите неполное(ые) определение(я):
- •Вопрос 5. Работа с создателями объектов цифрового наследия в идеале должна начинаться
- •Вопрос 6. Исключите те факторы, которые не влияют на эффективность сотрудничества с создателями
- •Вопрос 12. Заполните пробел:
- •Вопрос 13. Задание: заполните пробелы:
- •Вопрос 14. Может ли управление правовыми вопросами доступа решаться на основе переговоров создателей информации и программ сохранения?
- •Вопрос 15. Задание на соответствие: определите, в каком случае речь идет о тождественности документа, в каком о целостности документа:
- •Раздел 3 Гуманитарные аспекты проблемы сохранения цифрового наследия
- •Раздел 6
- •Цифровое культурное наследие
- •197198, Санкт-Петербург, ул. Ропшинская д.4
Стратегии организации доступа к материалам цифрового наследия
Вопросы предотвращения утраты наследия включают, по меньшей мере, два аспекта: характеристика жизненного цикла долговременного хранения цифровой информации и изучение рисков, которым подвержены такого рода ресурсы. На стыке этих аспектов разрабатываются стратегии сохранения доступа к ЦН.
К рискам утраты цифрового наследия относятся «устаревание оборудования и программ, обеспечивающих доступ к цифровым материалам, неопределенность в вопросах ресурсного обеспечения, ответственности и методик обеспечения сохранности и сохранения, отсутствие соответствующих законодательных актов». [4, ст. 3]. Список можно дополнить техногенными и природными катастрофами.
Основной проблемой для большинства программ сохранения является то, что замена программного обеспечения и оборудования часто приводит к потере доступа к материалам цифрового наследия. Поэтому необходимо разрабатывать такие стратегии, которые будут обеспечивать доступ к информации в любой момент времени.
Стратегии группируются по признаку ресурсоемкости этапов обработки цифровых материалов, обладающих кратко-,средне- и долгосрочной эффективностью. Кроме того, предлагаются альтернативные, «нецифровые» и «несохраняющие» стратегии.
1.5.1. Долгосрочные стратегии основаны на использовании стандартов для кодирования, структурирования и описания данных, что может позволить им остаться распознаваемыми на протяжении длительного периода времени.
1.5.1.1. Использование стандартов предусматривает употребление открытых, широко распространенных, поддерживаемых или согласованных стандартов и форматов файлов, в отношении которых существует большая вероятность стабильности и длительного срока функционирования. Использование стандартов особенно эффективно, когда заинтересованная организация обладает возможностью влиять на создание форматов, в которых могут быть представлены хранимые материалы. Также оно целесообразно в случае, если доступные и стандартные форматы могут кодировать первоначальные объекты с заданной сложностью и без недопустимой потери основных характеристик. Стандарт должен выбираться с учетом возможности сохранения основных характеристик объекта и ожидаемый долговечности аппаратных средств.
Преимущества использования стандартов заключаются в упрощении процесса сохранения, наличии широкого диапазона инструментов отображения, большой вероятности адекватной интерпретации данных или восстановления инструментария в будущем.
К рискам можно отнести возникновение несогласованности некоторых элементов при конвертировании. Также необходимо учитывать, что могут существовать объекты, которые невозможно сохранить посредством стандартизированных форматов.
1.5.1.2. Извлечение и структурирование данных основано на анализе и маркировке их таким образом, чтобы возможно было описать функции, связи и структуру отдельных элементов. Такой подход применим в случаях, когда в распоряжении программы находятся слабоструктурированные данные или документы, для которых содержание, семантика и зависимости более важны, нежели характеристики отображения.
Этот подход может быть использован, например, в обработке текстов, картографических данных, электронной почты. Так Национальный архив Австралии также использует этот подход в применении к электронной почте с расширением действия на другие форматы [18 с.118].
1.5.1.3. Формирование пакета является распространенным способом взаимоувязки данных и способов обеспечения доступа к ним. В пакет обычно включаются метаданные, описывающие или содержащие ссылки на необходимые инструментальные средства. Также возможен подход, основанный на упаковке файла или предоставлении ссылки на описание программного обеспечения или аппаратных средств с тем, чтобы они могли быть восстановлены в будущем.
Этот метод может быть рекомендован качестве вспомогательного при использовании других стратегий. Примером может служить использование «луковичных отчетов», в которых объекты упакованы непосредственно закодированными в XML метаданными, что делает их независимыми от систем управления (Программа VERS Общественного центра сохранения данных штата Виктория, Австралия). [18 с. 119].
1.5.1.4. Стратегия ограничения диапазона форматов основана на том, что данные могут храниться лишь в ограниченном диапазоне форматов. Такой подход может быть рекомендован для легко стандартизируемых материалов или для массивов с большим числом однородных элементов. Например, государственным архивам и государственным учреждениям, которые регламентируют форматы для предоставления им информации. Также он применим для музеев и ряда научных организаций. Например, археологическая служба Великобритании определяет предпочтительный (но не единственный) диапазон форматов хранения и предоставляет рекомендации по созданию или подготовке материалов для отображения файлов. [18 сс.120-121].
1.5.2. Краткосрочные стратегии, как правило, основаны на решениях, связанных с сохранением технологий и аппаратных средств, используемых для разработки электронного ресурса.
1.5.2.1. Стратегия сохранения технологии и аппаратных средств предусматривает сохранение и поддержание исходного программного обеспечения и оборудования, посредством которых создавались цифровые объекты. Например, сохранение компьютеров с дисководами для дискет, сохранение устаревшего программного обеспечения для обработки современных ему материалов, сохранение старых операционных систем для работы с программным обеспечением, которое работает на современных платформах.
При кажущейся простоте, надежности и привлекательности такого подхода, он имеет серьезные ограничения, связанные с молниеносным темпом устаревания технологий. «Даже с применением активных усилий период обеспечения доступа при использовании такого подхода может составить не более пяти-десяти лет со времени замены технологий исходного формата» [18 с. 123]. В то же время отмечается, что он «может оказаться единственной возможностью продления срока хранения таких цифровых комплексных объектов, как программное обеспечение и объекты мультимедиа» [18 с.124]. Таким образом, возникает повод подумать о создании действующего музея информационной техники.
1.5.2.2. Стратегия использования совместимости и преемственности версий опирается на способность некоторых видов программного обеспечения интерпретировать и представлять объекты, созданные на предыдущих версиях. В случае преемственности новая версия конвертирует документы в собственный формат, а в случае совместимости отображение может быть представлено лишь временным просмотром.
Подавляющему большинству пользователей ПК известно, что веб-броузеры обычно способны к интерпретации и отображению материалов, созданных на более ранних версиях стандарта HTML. Также такие офисные приложения, как текстовые редакторы, электронные таблицы, базы данных обычно позволяют преобразовывать и сохранять в новой версии файлы форматов предыдущих версий. Эта стратегия может быть использована как простое и недолгое решение задачи сохранения документальных объектов в форматах, которые предполагают преемственность версий, пока конвертирование не приводит к нежелательным искажениям оригинала.
1.5.2.3. Перевод предусматривает перенос цифровых материалов с одного поколения аппаратных средств и программного обеспечения на другое. При перемещении преобразовывается логическая форма цифрового объекта так, чтобы он мог быть концептуально представлен на новых аппаратных средствах или программном обеспечении. Обычно метод перевода связан с постоянным преобразованием одного логического формата в другой в соответствии с изменением технологий так, чтобы все обработанные объекты соответствовали преобладающей технологии.
Из-за вероятного кумулятивного эффекта повторных переводов этот подход может использоваться как краткосрочная стратегия. Однако для некоторых типов данных и форматов такой подход может использоваться в качестве долгосрочной стратегии, например, для однородных коллекций типа цифровых изображений и аудио коллекций, которые записываются в широко используемых, стандартизированных и общедоступных форматах.
1.5.3. Среднесрочные стратегии включают ряд компромиссных подходов к решению проблем сохранения объектов цифрового наследия.
1.5.3.1. Многократный перевод основан на использовании средств просмотра, программных инструментов или методов преобразования, которые обеспечивают доступ в момент обращения, используя первоначальный поток данных. При этом первоначальный поток данных интерпретируется и отображается средствами просмотра, инструментами или методами преобразования, вместо использования измененного и переведенного потока данных, что позволяет избежать кумулятивных искажений объема или зависимости от числа переводов.
Использование стратегии оправдано в случае, если стоимость постоянного перевода слишком высока или имеются длительные промежутки между запросами. А также тогда, когда существует уверенность в возможности создания инструментов или средств просмотра, которые интерпретируют формат файла на основе внутренних команд, описаний и методов. При этом технические метаданные и методы доступа должны быть связаны, но сохраняться отдельно от цифровых объектов с тем, чтобы метаданные или методы могли быть модифицированы централизованно. Также должно быть обеспечено постоянное документирование форматов файла и методов их преобразования.
1.5.3.2. Эмуляция предусматривает использование программного обеспечения, которое позволяет одной технологии вести себя подобно другой. Эмуляция используется, например, для того, чтобы разрабатывать и проверять программное обеспечение перед запуском в серию. Существуют эмуляторы различных систем платформ, от эмуляторов отдельных систем, созданных энтузиастами, до коммерческих систем для межплатформенного использования или тестирования программного обеспечения.
Широкое использование эмуляции в сохранении цифрового наследия находится на стадии исследования, поскольку эмуляция представляет собой чрезвычайно дорогостоящий комплексный, трудоемкий и специализированный процесс. Однако определился ряд требований, обеспечивающих защиту объектов цифрового наследия, сохраненных в рамках указанной стратегии.: наличие полной и точной документации на объекты эмуляции; код эмулятора должен разрабатываться с использованием стандартных методов разработки программного обеспечения, включая структуру кода, а также полные комментарии и документацию; код программы эмуляции должен быть написан на базе открытых источников, на стандартном языке программирования с достаточными возможностями долговечности и совместимости. [18 сс.131-132].
1.5.4. Альтернативные стратегии включают нецифровые подходы к хранению информации (создание капсул времени), археологию данных и повторную разработку программного обеспечения.
1.5.4.1. Нецифровые подходы основаны на выборе материалов, которые позволят хранить аналоговые копии максимально долгое время. Для этого в основном используются бумага, магнитная и фотопленки. В связи с тем, что эти носители недолговечны, постоянно ведется поиск более прочных материалов. Поиск таких материалов может быть проиллюстрирован на примерах создания «капсул времени».
В 1971-72 гг. на корпусах космических кораблей «Пионер-10», предназначенного для изучения Юпитера и «Пионер-11», предназначенного для изучения Юпитера и Сатурна, были установлены пластинки из анодированного алюминия, содержащие графические послания от человечества представителям внеземных форм жизни. На пластинках выгравированы силуэты мужчины и женщины на фоне силуэта корабля «Пионер», Солнечная система и траектория «Пионера», схема атома водорода и положение Солнца по отношению к центру галактики к 14 галактическим пульсарам. Автором гравюры является американский астрофизик и популяризатор науки Карл Саган.
«Письма в будущее», отправленные в 1977 г. к Сатурну и Юпитеру на космических аппаратах «Вояджер», представляют собой позолоченные видеодиски в алюминиевых коробках. Они содержат более пространную информацию, чем их предшественники на «Пионерах» и сохранена она посредством цифровых технологий. На диске 116 слайдов, на которых собраны важнейшие научные данные, виды Земли, её материков, различные ландшафты, сцены из жизни животных и человека, их анатомическое строение и биохимическая структура, включая молекулу ДНК.
В двоичном коде сделаны необходимые разъяснения и указано местоположение Солнечной системы относительно 14 мощных пульсаров. В качестве «мерной линейки» указана сверхтонкая структура молекулы водорода (1420 МГц). Кроме изображений на диске записаны звуки: шёпот матери и плач ребёнка, голоса птиц и зверей, шум ветра и дождя, грохот вулканов и землетрясений, шуршание песка и океанский прибой.
Человеческая речь представлена на диске короткими приветствиями на 58 языках народов мира. По-русски сказано: «Здравствуйте, приветствую вас!». Особую главу послания составляют достижения мировой музыкальной культуры. На диске записаны произведения Баха, Моцарта, Бетховена джазовые композиции Луи Армстронга, Чака Берри и народная музыка многих стран.
Хотя послания на «Вояджерах» предназначены не землянам, а представителям внеземных цивилизаций, не исключено, что при освоении человеком космоса они могут быть найдены и далёкими потомками современных жителей Земли.
В 1990-е годы в Лос-Аламосской национальной лаборатории началась разработка технологии HD-Rosetta, заключающаяся в микрогравировке ионными лучами на никеле изображений и документов. Полученные изображения просматриваются оптическими лупами и микроскопами. Двухдюймовый диск может содержать до 200 тысяч страниц графических изображений и текста в аналоговой форме. По заявлениям производителей (Norsam Technologies, Inc, Санта-Фе, Нью-Мексико) такие диски весьма долговечны - срок хранения информации достигает 1000 лет. Наиболее известный проект, связанный с использованием технологии, - изготовление по заказу компании «Нью-Йорк таймс» в 1999 г. шести «капсул времени», которые хранятся в Музее естественной истории США.
Преимущество данной технологии заключается в том, что объекты не подвержены угрозам «технологического старения» и семантических искажений вследствие постоянного процесса цифрового пересохранения. В то же время стоимость обслуживания таких материалов может быть гораздо более высокой, чем надежное обслуживание компьютерных систем.
1.5.4.2. Восстановление данных (археология данных) - предусматривает восстановление данных с поврежденных или разрушенных носителей. Методика рекомендована в случае высокой ценности восстанавливаемых данных, так как требует затраты больших средств и не дает гарантии высокой степени достоверности восстановленной информации.
Примером может служить проект по восстановлению археологической информационной службой Великобритании данных с дисков Археологической службы Ньюгемпского музея [18 с.135]. Множество файлов было признано разрушенными и не подлежащими восстановлению. Из тех, которые были восстановлены, многие были в устаревших форматах и требовали специального программного обеспечения или отображения, или имели несоответствующую документацию, так что содержание данных не могло быть восстановлено с приемлемой точностью.
1.5.4.3. Повторная разработка программного обеспечения может быть использована как самостоятельная стратегия или в большинстве стратегий как способ преобразования программ и обеспечения изменения технологий, подобно преобразованию форматов данных. Однако этот подход требует больших затрат времени и усилий, не говоря уже о том, что повторная разработка в любой форме конечным пользователем как правило запрещена лицензионными соглашениями и серьезно нарушает права интеллектуальной собственности. Поэтому данная стратегия применима только в случае предоставления соответствующих прав, наличии экспертизы, инструментов и исходного кода. Примером ее использования могут служить манипуляции с ресурсами, имеющими открытый исходный код.
1.5.5. Смешанные стратегии. Использование нескольких стратегий в рамках одного проекта является обычной практикой программ сохранения, что обусловлено рядом моментов. Коллекция памятников культуры очень часто содержит разнообразные объекты, для цифрового сохранения которых требуется использование разных технологий. Кроме того, единственная стратегия может с течением времени привести к потере доступа к информации.
Примером смешанной стратегии может служить универсальный виртуальный компьютер, который объединяет отделение данных с правилами их перевода в момент доступа, эмуляцию программных объектов, а также подход «долгосрочного кодирования», основанный на использовании основных стандартов для кодирования данных, включая кодирование в формате УВК.
1.5.5.1. Концепция «универсального компьютера» (УВК) была разработана Раймондом Лори (IBM Almaden, Нидерланды) в 2000 году и заключается в создании промежуточной платформы, позволяющей сохранять документы в их оригинальном формате, без необходимости конвертирования. Подход был протестирован в Национальной библиотеке Нидерландов для сохранения файлов в формате JPEG, электронных таблиц и операционных систем. Специалисты высоко оценивают будущее такого метода хранения информации в связи с его экономичностью и надежностью [18 121].
1.5.6. Малобюджетные стратегии. Названные выше стратегии могут быть использованы в достаточно амбициозных и ресурсоемких проектах. Однако в процесс сохранения цифрового наследия включены и более скромные персонажи - локальные группы, деревенские общины и т.п. Для них предлагается набор стратегий, отвечающий их возможностям. Он подразделяется по принципу снижения затрат и по технологическим решениям, зависящим от типов данных.
Выбор по принципу снижения затрат основан, как правило, на ограничении количества сохраняемых материалов. По отношению к стратегиям доступа это означает надежное сохранение коллекций данных с четкой документацией о первоначальном способе доступа. В будущем возможно использование этой информации для определения приоритетных материалов, которые можно перевести в формат, обеспечивающий ограниченный уровень доступа. При этом необходимо сохранение оригинала для последующего обеспечения более полного доступа на основе, например, таких форм как сохранение материала в немногих, хорошо стандартизированных и широко распространенных форматах, что понизит затраты и ограничит количество специальных инструментов обеспечения доступа [18 с. 137].
Выбор по технологическим решениям, зависящим от типов данных, включает в себя разнообразные подходы. Среди них можно упомянуть стандартизированное кодирование для набора данных; использование метаданных для описания структуры информационного объекта.
Для баз данных сохранение данных и документирование структуры их извлечения, сохранение программного обеспечения, необходимого для доступа к информации; сохранение интерфейса и истории обращений; перевод данных на новые базы данных и интерфейс пользователя.
Для аудио- и графических файлов рекомендуется использование стандартов, позволяющих избежать осложнений при сжатии, переводе на новые стандарты и форматы; для текстовых файлов применимы кодировка (т.е. перевод на стандартные коды и стандарт XML) или перевод на аналоговые носители или в новые форматы; для файлов HTML: сортировка по форматам и перевод на новые стандарты браузеров; для сохранения программы и материалы на основе программ.
Выбор стратегий является сложным вопросом и маловероятно, что будет найдено единственное решение, которое предложит рентабельный способ обеспечения постоянного доступа для всех материалов и объектов. В этой ситуации разумно применять стратегии, учитывающие возможность работы с широким ассортиментом материалов на протяжении длительного периода времени.