
Выбор формата данных.
Пример (из опыта Норвежской национальной библиотеки). Принято решение оцифровывать книги с разрешением 400 dpi и с глубиной цвета 24 бита.
Формат сохранения JPEG2000 без потерь при сжатии. После сканирования сохраняемое изображение не обрабатывается и не редуцируется какими-либо способами.
Обоснование выбора формата JPEG2000 вместо формата TIFF
1. Данный формат позволяет значительно сократить потребность в объеме памяти примерно на 50%
2 Доказано, что формат JPEG2000 может быть преобразован обратно в TIFF абсолютно без каких бы то ни было потерь.
Аргумент против использования JPEG2000 состоит в том, что повреждение хотя бы одного бита может полностью разрушить все изображение, тогда как в формате TIFF оно затронет всего лишь один пиксель.
Организационные меры при долгосрочном хранении позволяют пренебречь такой опасностью.
Сканирование и извлечение метаданных из электронного каталога.
Если книга может быть разобрана на листы, сканирование происходит в 10 раз быстрее.
Для быстрой оцифровки иногда производят разброшюровку книг (обычно в тех случаях, когда в библиотеке имеется не менее трех экземпляров данной книги). После оцифровки разобранный экземпляр обычно уничтожается.
Подготовка книги для сканирования при разброшюровке требует гораздо больше трудозатрат, чем подготовка к ручному сканированию. Для разборки книги требуются специальные операторы (отделение переплета от блока, удаление клея с помощью гидравлического резака). Сканирование переплета – отдельный процесс. Таким образом, для обслуживания одного сканера требуется четыре оператора. Тем не менее, в целом такая технология позволяет снизить стоимость и повысить скорость процесса по сравнению с оцифровкой того же материала ручным способом.
При невозможности разброшюровки сканирование производится ручным способом, причем операторы сканируют одновременно две страницы. Книги, наиболее подверженные разрушению, сканируются под наблюдением специалиста по консервации, и принимаются необходимые консервационные меры до или в связи с оцифровкой.
Перед сканированием все метаданные по книге извлекаются из каталога (BIBSYS) посредством штрих кодов, которым снабжена каждая книга в этом каталоге. Таким образом генерируется цифровой идентификатор-паспорт книги, который вносится в файл XML вместе с метаданными, полученными из каталога. При автоматическом сканировании штрих код и идентификатор-паспорт распечатываются на отдельном листе сразу после сканирования переплета. Этот лист кладется поверх пачки листов разброшюрованной книги. Когда штрих код далее проходит через автоматический сканер, он идентифицируется, и таким образом осуществляется связь между файлом метаданных и сканированным переплетом книги.
При сканировании с переворачиванием страниц переплет и содержание книги сканируются на одной и той же машине. Этот процесс также предусматривает извлечение метаданных из каталога и генерацию файла XML c метаданными, который сопровождает книгу в течение всего цикла.