- •1. Понятие об электронных изданиях. Классификация. Технологии гипертекстовых изданий.
- •2. Аппаратные технологии электронных книг. Понятие электронной книги - ридера. Преимущества и недостатки. Технология жк-мониторов.
- •3. Аппаратные технологии электронных книг. Понятие электронной книги - ридера. Преимущества и недостатки. Технология «электронные чернила».
- •4. Классификация форматов. Бинарные и текстовые файлы. Примеры форматов с описанием.
- •5. Классификация форматов. Графические растровые и векторные форматы. Примеры форматов с описанием.
- •6. Формат pdf. Описание (про PostScript), преимущества, недостатки. Предназначение и особенности формата. По для работы с форматом. Использование в допечатной подготовке.
- •7. Формат pdf. Описание, преимущества, недостатки. Технология pdf mrc сжатия.
- •8. Формат pdf. Описание, преимущества, недостатки. Обобщённая структура формата. Структура файла. Структура документа. Три типа структурированных документов.
- •3 Типа структурирования pdf-файлов:
- •9. Формат DjVu. Описание, преимущества, недостатки. Шесть основных технологий, которые лежат в основе формата. Разрушающие и не разрушающие методы сжатия. Технология разделения на слои.
- •10. Формат DjVu. . Описание, преимущества, недостатки. Технология разделения на слои. Методы сжатия для каждого слоя и их описание. Проблема «инь» при сжатии текстового слоя и методы её решения.
- •11. Формат DjVu. Описание, преимущества, недостатки. Технология разделения на слои. По для работы с форматом.
- •12. Система вёрстки TeX. Применение, достоинства, недостатки. Основные понятия. Команды и их задание в тексте.
- •13. Формат rtf. Структура формата. Управляющие слова и управляющие символы.
- •17. Формат FictionBook. Структура и элементы формата FictionBook.
- •18. Формат ePub. Структура и элементы формата.
- •19. Adobe Digital Publishing Suite. Использование, процесс создания, достоинства, недостатки.
- •20. Adobe InDesigne cs. Возможности, применение, основные функции. Допечатная подготовка и верстка.
13. Формат rtf. Структура формата. Управляющие слова и управляющие символы.
RTF(Rich Text format-«расширенный текстовый формат») представляет собой независимый от платформы текстовый документ, подобно HTML размеченный специальными служебными словами-тегами (управляющие слова и управляющие символы). В силу отсутствия каких-либо исполняемых кодов, он, в частности, не может нести в себе вирусы. Начинается он всегда с последовательности {\rtf, которая служит его отличительным признаком.
RTF — это классический контейнер с вложенными друг в друга контейнерами помельче. Каждый такой контейнер обычно начинается с управляющего слова или символа, предваряемого знаком «обратный слэш». Определен фирмой Microsoft как стандартный формат для обмена текстовыми документами.
С
труктура
формата.
В состав
заголовка файла входит идентификатор
RTF
файла, команда выбора гарнитуры, команда
выбора шрифта по умолчанию и таблица
доступных шрифтов, таблица цветов (RGB)
и таблица стилей.
В теле файла размещаются данные публикации в виде двоичных кодов ASCII. В формате RTF используются только символы, представимые стандартом ASCII, а также MAC- и PC- символьного набора. Кроме текста, файл в RTF-формате содержит команды управления, которые также реализованы с использованием этого стандарта.
Команды управления разделяются на управляющие слова (control words) и управляющие символы (control symbols).
Управляющее слово представляет собой последовательность символов с разделителем (delimiter) в конце:\набор_символов <разделитель>
Перед управляющим словом вводится обратная косая черта “\” (backslash). В качестве разделителей могут использоваться следующие символы:
─ пробел (space), причем этот символ относится к управляющему слову;
─ цифра или знак “-“ (в этом случае параметр завершается разделителем –пробелом или другими символами, кроме цифр и букв);
─ все символы, отличные от цифр и букв (не относятся к управляющему слову).
В формате RTF для задания управляющей последовательности символов используются буквы от “А” до “Z” и от “а” до “z”, а также цифры от “0” до “9”. Национальные символы к управляющей информации не относятся.
В качестве управляющих символов используются отдельные буквы. Перед каждым управляющим символом вводится обратная косая черта “\”:
\управляющий_символ.
В формате RTF существует возможность объединять отдельные последовательности в группы при помощи скобок:{ – начало группы; } – конец группы.
17. Формат FictionBook. Структура и элементы формата FictionBook.
Формат FictionBook, так же известный под наименованием его самой популярной схемы FB2, - это XML формат хранения книг, где каждый элемент книги описывается своими тегами. Данный формат был разработан для использования на специальных электронных книгах. Книги FB2 очень просты для создания. Поддерживает Unicode, графику. Разработан для Windows и PocketPC. Книги в данном формате отлично поддаются каталогизации. Никаких проблем с возможностью конвертирования книг из других форматов.
Общая структура документа проста и похожа на структуру HTML. Однако главная цель этой работы состоит в том, чтобы спроектировать основанный на XML документ, который фокусируется на логической структуре документа, а не на особенностях визуального представления информации. Важная особенность структурной разметки состоит в том, что она явным образом определяет структуру и семантику материала документа. Она не определяет способы отображения документа при просмотре, печати или как-либо иначе. Вместо этого представлены некоторые специальные элементы для различных логических частей книги, таких как: стихи, цитаты и эпиграфы.
Все документы начинаются с корневого элемента FictionBook, под которым могут появляться элементы stylesheet, description, body и binary.
Stylesheet элементы сразу после корня содержат таблицы стилей, их атрибут type содержит MIME тип таблицы стилей. Если в документе используются стили, рекомендуется включать одну text/css таблицу стилей для упрощения конвертации в другие форматы.
Элементы binary также очень просты и содержат закодированные base64 данные, которые могут потребоваться для отображения документа. Они всегда должны содержать id и content-type атрибуты.
Элемент description содержит всю информацию о книге, которая разбивается на четыре главных категории: title-info, document-info, publish-info и custom-info.
Элемент title-info содержит данные о самой книге. Элемент genre определяет жанр книги. Атрибут match используется тогда, когда жанр не может быть точно определён с помощью единственного ключевого слова, например, некоторые книги могут быть одновременно детективами и научной фантастикой. Список авторов хранится в элементе author, который имеет традиционные поля first-name, middle-name, last-name, и добавляет необязательные подэлементы home-page и email. Элемент book-title - это название книги. Элемент annotation содержит описание книги в свободной форме. Поле keywords перечисляет любые подходящие ключевые слова, которые могут быть использованы поисковыми машинами. Элемент date определяет дату написания книги в любом формате, необязательный атрибут value должен содержать дату в понятном компьютеру формате, если он был использован. Элементы src-lang и lang указывают соответственно язык, на котором книга написана, и язык данного документа, если он является переводом оригинала. Элементы translator имеют точно такую же структуру, как и элементы author, описанные ранее, и используются для перечисления переводчиков книги, в случае если книга является переводной.
Информация, непосредственно о данном документе, собрана в элементе document-info, который содержит подэлементы author, program-used, date, src-url, src-ocr, version и history. Элементы author и date имеют тот же тип, что одноимённые элементы из группы title-info. Элемент history имеет тот же тип, что и annotation, и предназначен для перечисления важных изменений, внесённых в документ. Элемент version имеет свободный формат и должен увеличиваться, когда документ меняется.
Блок publish-info используется в случаях, когда документ создан на основе печатного материала и имеет несколько библиографических полей, так как: book-name, publisher, city, year и isbn.
Записи в блоке custom-info должны использоваться для хранения информации, которая не соответствует другим ранее описанным полям. Эти записи должны обязательно содержать атрибут info-type.
Следующая важная часть FictionBook документа - это body, которая содержит сам текст книги. Первый элемент body всегда главный поддокумент данной книги. Последующие элементы body могут быть использованы для хранения сносок, комментариев и другой информации, которая не укладывается в нормальный поток текста. Каждый элемент body может содержать не обязательные элементы title, epigraph и как минимум один section элемент. Есть две разновидности секций. Одна из них содержит только другие подсекции, другая содержит сами параграфы текста.
В текущей версии стандарта FictionBook не допускается смешивание подсекций и параграфов внутри одного и того же контейнера. Каждая секция может иметь несколько не обязательных полей заголовка: title, epigraph, image и annotation. После них должен быть как минимум один параграфный элемент для текстовых секций или как минимум одна подсекция для второго типа секций.
