Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2007voprosy_GAK_2013_06062013u_mani.docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
2.45 Mб
Скачать
  1. Гипертекстовые и мультимедийные бд. Распознавание образов. Оптимизация и сжатие данных. Стандарты сжатия графических данных, и аудиоинформации. Программные решения.

Гипертекст можно рассматривать как своеобразную базу данных, организуемую в виде открытой, свободно наращиваемой и изменяемой сети, узлы которой соединяются пользователем. От обычной базы данных гипертекст отличается, прежде всего, тем, что в нём отсутствуют заранее заданные ограничения на характер связей и структуру.

В 1987 году фирма Apple выпустила первую для ПК гипертекстовую систему – пакет HyperCard для Macintosh.

Эффективно применять гипертекстовые технологии стало возможным с 1992 года, когда появился WWW и возникли веб-технологии.

Гипертекстовая база данных – текстовая база данных, записи которой содержат связи с другими записями, позволяющими компоновать ансамбли записей на основе их логической связанности. Гипертекстовая база данных состоит из двух типов объектов, представляющих информацию: узлов и дуг устанавливающих явные смысловые и структурные связи между ними.

Гипертекстовые базы данных созданы по многим предметным областям. Практиче­ски ко всем обеспечивается доступ через интернет. Примерами гипертекстовых баз дан­ных являются правовые системы: Гарант, Юсис, Консультант + и др

Мультимедиа (multimedia) – это современная компьютерная информационная технология, позволяющая объединить в компьютерной системе текст, звук, видеоизображение, графическое изображение и анимацию (мультипликацию).

Мультимедийная база данных – база данных, хранящая данные мультимедиа.

Особенности хранения МД.

  1. Файл мультимедиа хранится непосредственно в базе данных.

  2. Файл хранится в файловой системе, а база данных содержит лишь ссылки к этой системе.

Что делает коллекцию мультимедийных документов мультимедийной базой данных?

Мультимедийные файлы и архивы

  • Простой просмотр и извлечение

  • Запросы отсутствуют

  • Используемое программное обеспечение: например, веб-сервер и веб-броузер

  • Пример: Третьяковская галерея – экспозиция (http://www.tretyakovgallery.ru/russian/exposit/)

Мультимедийные базы данных

  • Запросы по содержимому, обновления

  • Управление параллельным выполнением операций, восстановление

  • Используемое программное обеспечение: объектно-ориентированные или объектно-реляционные СУБД

  • Пример: музей Эрмитаж – поиск QBIC по цвету и композиции (http://www.hermitagemuseum.org/fcgi-bin/db2www/qbicSearch.mac/qbic?selLang=Russian)

Мультимедийные типы данных

Векторная графика

Интегрированные документы (текст и изображения)

Интегрированные аудио и видео

Универсальные интегрированные мультимедийные презентации

Требования к модели данных для мультимедиа:

  • Должна поддерживать мультимедийные типы данных (текст, изображения, звук и т.д.); не должно быть обычных файловых ссылок на оптический или иной носитель, что распространено в расширениях реляционной модели или ОО модели данных

  • Должна поддерживать поиск по содержимому любого типа мультимедийных данных (например, поиск по всему тексту, или поиск заданного лица по фотографиям)

Образ - классификационная группировка в системе классификации, объединяющая (выделяющая) определенную группу объектов по некоторому признаку. Каждое отображение какого-либо объекта на воспринимающие органы распознающей системы, независимо от его положения относительно этих органов, принято называть изображением объекта, а множества таких изображений, объединенные какими-либо общими свойствами, представляют собой образы 

Распознавание — отнесение предъявляемых объектов к определённым классам с помощью применения известных правил классификации. Это наиболее типичная задача систем распознавания. Перед тем, как система сможет выполнять данную функцию, предполагается её обучение на множестве примеров — обучающей выборке

объектов распознавания

Примеры задач распознавания образов:

- Распознавание букв;

- Распознавание штрих-кодов;

- Распознавание автомобильных номеров;

- Распознавание лиц и других биометрических данных;

- Распознавание речи.

В целом, можно выделить три метода распознавания образов:

  • Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями, деформациями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д. В случае распознавания звуковых образов, соответственно, происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное несколькими людьми).

  • Второй подход - производится более глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических характеристик. Звуковой образец в этом случае подвергается частотному, амплитудному анализу и т. д.

  • Следующий метод - использование искусственных нейронных сетей (ИНС). Этот метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность. Подробно нейронные сети мы рассматривали в "КИ" N 15, 16, 17 за 2005 г.

Если говорить кратко, то сжатие устраняет из данных избыточность, в терминах же теории информации сжатие увеличивает энтропию сжатого текста.

При сжатии без потерь преобразование данных выполняется так, что с помощью обратного преобразования можно получить данные, полностью совпадающие с исходными. Сжатие с потерями создает такое представление, из которого можно извлечь данные, которые "очень похожи" на исходные. Преимущество сжатия с потерями в том, что оно зачастую позволяет получить более компактное представление данных, чем то, которое получается в результате сжатия без потерь. Чаще всего сжатие с потерями используется для изображений, звуковых и видеофайлов. Сжатие с потерями подходит в этом случае благодаря тому, что человек не воспринимает цифровые изображения и звук с "побитовой" точностью, а скорее оценивает музыку или изображение в "целом".

Применение в СУБД экономного кодирования без потерь информации приводит к ряду положительных результатов. Наиболее очевидным эффектом является уменьшение физического размера базы данных, журнальных и архивных файлов. Но также часто достигается увеличение скорости выполнения запросов и снижение требований к объему оперативной памяти, что отмечается практически во всех работах в данной области знаний. Поэтому эффективная реализация поддержки сжатия данных существенно улучшает качество СУБД.

Существует достаточно много универсальных (обратимых) методов сжатия, однако в их основе лежит сравнительно небольшое количество теоретических алгоритмов, которые мы рассмотрим на примерах.

Метод упаковки. Идея метода упаковки заключается в уменьшении количества бит, отводимых для кодирования каждого объекта, при условии, что в сжимаемом массиве данных присутствует не весь возможный набор объектов, а только его небольшая часть.

Сообщение «КОЛ ОКОЛО КОЛОКОЛА» записанное в кодировке ASCII будет весить

Vascii=8бит • 18 символов = 144 бита, а кодировке Unicode соответственно Vunicode = 16 бит • 18 символов = 288 бит.

Однако данное сообщение содержит всего 5 различных символов, следовательно, каждый символ может быть закодирован тремя битами, например, так: «А» - 000, «К» - 001, «Л» - 010, «О» - 011 и пробел - 111. Тогда объем сообщения будет равен V=18 символов • 3 бит = 54 бита.

Метод Хаффмана.

код Хаффмана является неравномерным и префиксным. Неравномерность означает, что те символы, которые встречаются в сообщении чаще, кодируются более короткими кодами, а символы, которые встречаются редко – более длинными. Префиксность говорит о том, что ни один код не является началом другого кода, что позволяет достичь однозначности при декодировании.

В примере 2 данного раздела мы вычислили объем сообщения «КОЛ ОКОЛО КОЛОКОЛА» при использовании кодировок ASCII (Vascii =144 бита) и Unicode (Vunicode = 288 бит). А код Хаффмана для этой же фразы Vхаффмана=39 бит.

К середине 90-х годов прошлого века были разработаны высокоэффективные методы сжатия

графической, звуковой и видео информации, учитывающей особенности человеческого зрения и слуха.

Характерной чертой этих методов является возможность регулируемого удаления маловажной для че-

ловеческого восприятия информации, за счет чего удается достичь высоких коэффициентов сжатия. Но

т.к. часть данных удаляется (безвозвратно), то полное восстановление исходной информации невоз-

можно.

Наиболее известными методами сжатия с регулируемой потерей информации являются:

• JPEG — метод сжатия графических данных;

• МРЗ — метод сжатия звуковых данных;

• МРЕG — группа методов сжатия видеоданных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]