- •Предисловие
- •1.2. Составные элементы электронного издания
- •1.2.1. Тексты
- •1.2.2. Иллюстративный материал
- •1.2.3. Звуковое сопровождение
- •1.2.4. Анимация и видео
- •1.3. Форматы электронных изданий
- •1.5. Современное состояние и перспективы электронного книгоиздания
- •2.1. Общая характеристика и структура html-документа
- •2.2. Тело документа и оформление его основных фрагментов
- •2.2.1. Тело документа
- •2.2.2. Теги логического форматирования текста
- •2.2.3. Теги физического форматирования текста
- •2.3. Оформление списков терминов и определений
- •2.3.1. Маркированные списки
- •2.3.2. Создание нумерованных списков
- •2.3.3. Списки определений
- •2.3.4. Многоуровневые списковые структуры
- •2.4. Использование графики при оформлении электронного издания
- •2.5. Включение в издание ссылок и комментариев
- •2.6. Оформление таблиц
- •2.7. Фреймовая структура электронного издания
- •2.8. Html-формы
- •2.9. Понятие о динамическом html и его компонентах
- •Глава III. Мультимедийный документ и форматы представления его элементов
- •3.1. Мультимедиа и ее роль в современных информационных технологиях
- •3.2. Форматы представления текстовых блоков электронного издания
- •3.3. Форматы представления графической информации
- •3.4. Форматы представления аудиофайлов
- •3.5. Форматы представления анимации и цифрового видео
- •3.5.1. Анимационные gif-файлы
- •3.5.2. Принципы представления цифрового видео
- •3.5.3. Форматы цифрового видео
- •4. Глава IV. Средства подготовки электронных изданий
- •4.1. Издательские технологии и электронные издания
- •4.2. Подготовка гипертекстовых электронных изданий в doc-формате
- •4.2.1. Подготовка изданий в редакторе ms Word 97
- •4.2.2. Подготовка изданий в редакторе ms Word 2000
- •4.3. Редактирование html-изданий в редакторе ms Word 97
- •4.3.1. Команды секции меню «Формат»
- •4.3.2.Команды секции меню «Вставка»
- •4.4. Общая характеристика типовых html-редакторов первой группы
- •4.5. Общая характеристика wysiwyg-редактора Netscape Composer
- •4.6. Подготовка документов в pdf-формате
- •5. Глава V. Аппаратное и программное обеспечение рабочего места читателя
- •5.1. Требования и рекомендации к аппаратному обеспечению
- •5.1.1. Требования к центральной части или ядру пк
- •5.1.2. Мониторы и требования к ним
- •5.1.3. Cd-rom-накопители для работы с переносимыми изданиями
- •5.2. Назначение и общая характеристика браузеров
- •5.3. Браузер ms Internet Explorer
- •5.3.1. Экранный интерфейс
- •5.3.3. Основные команды меню браузера
- •5.3.4. Ведение журнала обозревателя и команды других секций меню
- •5.4. Программные средства для работы с электронными изданиями в pdf-формате
- •5.5. Программные средства для воспроизведения аудиофайлов
- •Глава VI. Подготовка сетевых и мультимедийных изданий в специализированных программных пакетах
- •6.1. Общая характеристика пакета ms FrontPage 2000
- •6.1.1. Интерфейс пакета
- •6.1.2. Технология подготовки новых Web-сайтов
- •6.2. Назначение и общая характеристика пакета Dreamweaver
- •6.2.1. Интерфейс пакета DreamWeaver
- •6.2.2. Последовательность проектирования сайта в пакете Dreamweaver
- •6.3. Подготовка мультимедийных изданий в пакете Macromedia Director
- •6.3.1. Интерфейс пакета Macromedia Director
- •6.3.2. Основные окна и инспекторы пакета
- •6.3.3. Основные этапы работы над мультимедийным электронным изданием
- •6.4. Дизайн Web-сайтов в пакете Macromedia Flash
- •6.4.1. Общая характеристика и интерфейс пакета
- •6.4.2. Основные понятия и элементы Flash-технологии
- •6.5. Общая характеристика других программных средств для Web-дизайна
- •6.5.1. Другие средства проектирования Web-сайтов
- •6.5.2. Подготовка анимационных фрагментов в пакете 3d Studio Max
- •7. Глава VII. Организация хранения электронных изданий
- •7.1. Организация хранения и поиска электронных изданий
- •7.2. Информационное хранилище издательства
- •7.2.1. Требования к информационному хранилищу издательства
- •7.2.2. Проектирование структуры хранилища электронных изданий
- •7.3. Информационная структура современного издательства
- •7.4. Автоматизация выделения метаданных
- •7.4.1. Метаинформация и ее роль
- •7.4.2. Законы Зипфа и автоматизация извлечения метаданных из электронных изданий
- •7.4.3. Применение программ-экстракторов
- •7.5. Публикация содержимого баз данных на Web-страницах
- •7.5.1. Публикация статических Web-страниц
- •7.5.2. Публикация динамических Web-страниц
- •8. Глава VIII. Распространение электронных изданий
- •8.1. Виртуальный мир книги и его особенности
- •8.1.1. Некоммерческие электронные библиотеки
- •8.1.2. Представительство крупных библиотек в Интернете
- •8.2. Электронные книжные магазины
- •8.3. Технология e-book и развитие электронного книгораспространения
- •8.3.1. Специализированные аппаратные средства для работы с электронными изданиями
- •8.3.2. Современное аппаратное средство e-book
- •8.3.3. Программные средства e-book
- •8.3.4. Стандарт Open e-book
- •8.3.5. Достоинства и недостатки технологии e-book
- •9. Глава IX. Электронные учебники
- •9.1. Достоинства и недостатки электронных учебников
- •9.2. Структура электронного учебника
- •9.3. Основные принципы подготовки электронных учебников
- •9.3.1. Размещение информации на поверхности экрана
- •9.3.2. Проблема ориентации и перемещения пользователя внутри электронного издания
- •9.4. Дистанционное обучение и организация самостоятельной работы студентов
- •9.5. Автоматизированные методы оценки уровня подготовки студента
7.4.3. Применение программ-экстракторов
Выделение метаинформации и ключевых слов из изданий может быть выполнено с помощью специальных программ-экстракторов. Одна из первых таких программ - это Extractor, созданный в Институте Информационных Технологий Национального исследовательского Совета (NRC) Канады. В настоящее время доступна версия 7.0 этой программы.
Extractors качестве исходных данных использует текстовый документ, генерируя на выходе совокупность ключевых слов. Он обрабатывает тексты на английском, французском, японском, немецком, испанском и корейском языках. К сожалению, к русскому языку он пока не адаптирован. Алгоритм работы программы использует метод обучения на примерах. Алгоритм изначально предназначен для моделирования человеческого подхода к выбору ключевых слов. На большинстве платформа время работы программы с 10-страничным документом не превышает секунды. Пример интерфейса и результатов работы программы Extractor 7.0 с документом на английском языке представлен на рис. 7.7.
На рис. 7.7представлен набор ключевые слов и выражений (Key-phrases) и основные фрагменты текста (Highlights). Ключевые слова в основных фрагментах текста автоматически выделяются жирным шрифтом, а наименее важные слова автоматически отображаются в серых (а не черных) тонах.
Разработанная фирмой «Научно-производственный инновационный центр «Микросистемы» отечественная программа-экстрактор Text-Analyst 1.5 позволяет на первых же этапах работы с текстами ответить на естественные вопросы, возникающие по ходу анализа. Интерфейс и заставка программы представлены на рис. 7.8.
Демонстрационная версия этой программы доступна бесплатно на сайте фирмы. Применение программы резко сокращает время, необходимое эксперту для погружения в тематику, и дает множество подсказок и наводящих соображений для тонкого и углубленного анализа как всей информации в совокупности, так и отдельных ее фрагментов. Первые успехи эксперта при работе с анализаторами текстов, как правило, служат основой для постановки более сложных задач анализа и структурирования. И с ними TextAnalyst успешно справляется.
В настоящее время распространяется новая версия TextAnalyst 2.01, которая разработана в качестве инструмента для анализа содержания текстов, смыслового поиска информации, формирования электронных архивов, и предоставляет пользователю следующие основные возможности:
анализа содержания текста с автоматическим формированием семантической сети с гиперссылками - получения смыслового портрета текста в терминах основных понятий и их смысловых связей;
анализа содержания текста с автоматическим формированием тематического древа с гиперссылками - выявления семантической стру ктуры текста в виде иерархии тем и подтем;
смыслового поиска с учетом скрытых смысловых связей слов запро са со словами текста;
автоматического реферирования текста - формирования его смы слового портрета в терминах наиболее информативных фраз;
кластеризации информации - анализа распределения материала текстов по тематическим классам;
автоматической индексации текста с преобразованием в гипертекст;
ранжирования всех видов информации о семантике текста по «степени значимости» с возможностью варьирования детальности ее исследования;
автоматического/автоматизированного формирования полнотекстовой базы знаний с гипертекстовой структурой и возможностями ассоциативного доступа к информации.
Результаты работы программы TextAnalyst 2.01. представлены на рис. 7.9.
В тексте выделены цветом и подчеркнуты термины, которые TextAnalyst 2.01 предлагает использовать в качестве ключевых слов, терминов, отражающих смысловое содержание работы. Пользователь может исключить часть этих слов или добавить другие, что будет учтено программой в дальнейшей работе. По нашему мнению, эта программа может успешно использоваться для автоматизации извлечения метаинформации из загружаемых в хранилище изданий.