Второе поколение: Языки манипулирования данными Web

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Краснодарский государственный университет культуры и искусств

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лингвистика .doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

199.17 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1211 12 > Следующая >>>

Второе поколение: Языки манипулирования данными Web

Рассмотренные выше языки интерпретируют страницы Web как атомарные объекты с двумя свойствами: они могут содержать или не содержать некоторые текстовые образцы и они могут указывать на другие объекты. Опыт использования таких языков показывает, что имеется две основные области приложений, для которых они могут быть полезны. Одна из них, рассматриваемая в разделе 4, - создание оболочек (wrapping) для данных, трансформация и реструктуризация данных. Вторая из этих областей - создание и реструктуризация Web-сайтов - обсуждается в разделе 5. В обеих этих областях приложений часто оказывается существенной возможность иметь доступ к внутренней структуре страниц Web из языка запросов, если мы хотим, чтобы декларативные запросы могли оперировать большой частью задачи. Например, задача извлечения множества кортежей из HTML-страниц сайта Internet Movie Database требует синтаксического анализа HTML-страниц и избирательного доступа к некоторым поддеревьям в дереве синтаксического анализа.

В этом подразделе мы опишем языки запросов второго поколения для Web, которые мы называем "языками манипулирования данными Web". Эти языки превосходят языки первого поколения в двух важных аспектах. Прежде всего, они обеспечивают доступ к структуре объектов Web, которыми они манипулируют. В отличие от языков первого поколения, они моделируют внутреннюю структуру документов Web, а также внешние связи, которые их соединяют. Они поддерживают связи для моделирования гиперссылок, а некоторые из них поддерживают также упорядоченные совокупности записей для более естественного представления данных. Во-вторых, эти языки обеспечивают возможности создания новых сложных структур в результате запроса. Поскольку данные в Web обычно являются слабоструктурированными, в этих языках придается особое значение поддержке возможностей для работы со слабоструктурированными данными. Далее кратко описываются три языка этого класса: WebOQL [AM98], STRUQL [FFLS97] и FLORID [HLLS97].

Принципиальная особенность интерфейсов к web

Интерактивные интерфейсы запросов

Все языки, рассмотренные в предыдущих двух подразделах, слишком сложны для непосредственного применения интерактивными пользователями, точно так же, как и SQL. Предполагается, что они, подобно SQL, должны использоваться, главным образом, как инструментальные средства программирования. Однако проводились работы по созданию интерактивных интерфейсов запросов, пригодных для случайных пользователей. Одним из них является Dataguides [GW97] - интерактивное средство запросов для слабоструктурированных данных, основанное на иерархических "выжимках" (summaries) графа данных. Расширения для поддержки запросов в отдельных сложных Web-сайтах рассмотрены в [GW98]. Система, описанная в [HML+98], поддерживает запросы, которые сочетают мультимедийные возможности, например, схожесть с данным эскизом или изображением, возможности работы с текстами, такие как поиск по ключевым словам, а также семантику предметной области.

Приниципиальная особенность интерфейсов к Web ?

Слабоструктури́рованные да́нные (полуструктурированные или плохо структурированные данные) — это форма структурированных данных, не соответствующая строгой структуре таблиц и отношений в моделях реляционных баз данных, тем не менее эта форма данных содержит теги и другие маркеры для отделения семантических элементов и для обеспечения иерархической структуры записей и полей в наборе данных.[1]. Таким образом, такой вид данных можно назвать бессхемным (schemaless), а структуру — самоописываемой.

В слабоструктурированных данных сущности, принадлежащие одному и тому же классу, могут иметь разные атрибуты, даже если классы принадлежат к одной группе. Порядок атрибутов также не важен.

Слабоструктурированные данные становятся важным объектом для исследований по нескольким причинам :

к таким источникам данных, как Веб, удобно обращаться как к базам данных, но Веб нельзя «уложить» в прокрустово ложе какой-либо определённой схемы данных;

желательно иметь предельно гибкий формат для обмена данными между разными базами данных;

даже при работе со структурированными данными может быть удобно представлять их в виде слабоструктурированных данных с целью навигации по ним.

Таким образом, слабоструктурированные данные встречаются всё чаще, поскольку с развитием интернета для полнотекстовых документов и баз данных требуется формат данных, выступающий в качестве информационного посредника. Слабоструктурированные данные часто можно встретить в объектно-ориентированных базах данных.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1211 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.05.2015116.22 Кб33Лекция №2.doc
#
22.05.2015123.39 Кб55Лекция №3.doc
#
22.05.201584.48 Кб24Лекция №4.doc
#
22.05.201561.44 Кб39Лекция №5.doc
#
20.03.201656.83 Кб77Летние календарные праздники и обряды.doc
#
01.05.2025199.17 Кб3Лингвистика .doc
#
01.05.2025129.54 Кб0Лингвистика c 1 по31.doc
#
01.03.2025357.89 Кб1ЛЮБОВЬ - 3 целиком.doc
#
20.03.2016166.34 Кб80Малиотаки ВКР.docx
#
22.05.20152.26 Mб266Маркетинг в рекламе Веселов.doc
#
01.07.2025314.59 Кб0Математика начиная с комбинаторики.docx

Второе поколение: Языки манипулирования данными Web

Принципиальная особенность интерфейсов к web

Приниципиальная особенность интерфейсов к Web ?