Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BD.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
535.54 Кб
Скачать

48.Инвертированный файл. Реализация многоключевого поиска в базе данных с использованием инвертированного файла.

Инвертированный файл - это структурированная индексная информация, в которой хранятся данные о местонахождении каждого элемента данных во всех местах, к примеру, слова или числа, и их расположение в документе или БД.

Инвертированный файл позволяет осуществлять эффективный поиск нужного элемента данных поисковой системой. Инверсный файл является наиболее распространенной структурой данных, применимых в системах поиска документов и информации.

При совершении поиска по поисковому запросу, работа с индексной информацией состоит из этапов поиска каждого слова запроса в словаре, получении для каждого пост-листа, раскодировании их, формировании результатов для пользователя.

Изменения индексной информации делятся на массовые, при которых изменяется большое число документов и имеет смысл полное перестроение индексов, и одиночные, при которых полного перестроения не происходит. Полное перестроение используется при начальной инициализации индекса.

В случае реализации индекса через бинарные деревья эффективно происходит добавление и удаление информации, разбиение длинных пост-листов позволяет эффективно обновлять только нужные их части, не считывая остальные.

49.Транзитивная зависимость атрибутов реляционных отношений. Третья нормальная форма. Привести пример приведения отношения к 3нф.

Транзитивная зависимость наблюдается в том случае, если один из двух неключевых атрибутов зависит от ключа отношения, а другой неключевой атрибут зависит от первого неключевого атрибута.

3 НФ - Отношение будет находиться в третьей нормальной форме, если оно находиться во второй нормальной форме, и каждый неключевой атрибут нетранзитивно зависит от первичного ключа отношения.

Например, если в состав описательных атрибутов отношения Студент включить фамилию старосты группы (Староста), которая определяется только номером группы, то одна и та же фамилия старосты будет многократно дублироваться в разных экземплярах кортежей данного отношения. Для данного отношения характерна аномалия обновления в случае изменения фамилии старосты.

Для устранения транзитивной зависимости неключевых атрибутов необходимо провести расщепление исходного отношения Студент. В результате расщепления часть атрибутов удаляется из исходного отношения и включится в состав других отношений. Графическая интерпретация приведения отношения Студент к третьей нормальной форме показана на рис:

50. Физическая организация данных. Линейный список.

Физическая организация данных - организация данных, учитывающая размещение и связь данных в среде хранения.

Списковые стр-ры.

Наиболее простой формой хранения данных в памяти ЭВМ является одномерный линейный список.

Линейный список – это стр-ра, которую можно определить как линейное упорядочение элементов данных.

Линейный список X рассматривают как последовательность Х[1], Х[2], ..., X[i], ..., Х[n], компоненты которой идентифицированы порядковым номером, указывающим их относительное расположение в X.

Одномерный линейный список, используемый для хранения данных в памяти машины, называют физической структурой хранения данных. Использование линейного списка в качестве физической структуры хранения данных определяется свойствами памяти вычислительной машины.

Связанное представление линейного списка называется связанным списком. Для построения такой стру-ры необходимо задать отношения следования и предшествования элементов с помощью указателей. Указателями служат адреса, хранимые в записях данных, где значение адресной функции можно получить только путем просмотра хранящихся указателей.

Структура линейного списка, представленная с помощью связанного распределения, называется цепной структурой или цепью.

Связанные списки – удобная форма представления динамически изменяющихся линейных структур. Любое произвольное изменение порядка записей не требуют перемещения записей в памяти ЭВМ, достаточно лишь изменить значения полей связи.

Одним из способов является организация связанного линейного списка с пропусками. Линейный список делится на группы узлов, связанные между собой обратными указателями. Вначале осущ-ся доступ по обратным указателям к группе, в кот-й нах-ся требуемый узел, а затем по прямым указателям перебираются узлы группы, пока не будет найден требуемый узел. Вход в список осущ-тся с конца.

Другой способ заключается в построении специального дополнительного линейного списка – индекса. Элементы индекса – значения первых узлов каждой группы и указатели на них.

Для связанных линейных одно- или двунаправленных списков в ряде случаев целесообразно создать специальный узел – голову списка – и хранить его в специальной фиксированной ячейке памяти по адресу β. В этот узел помещается указатель на первый узел списка. В голове списка можно хранить различную служебную информацию, необходимую при обработке списка.

Важной разновидностью представления в памяти линейного списка является циклический список. Циклический список позволяет получить доступ к любому узлу списка, отправляясь от любого заданного узла. Циклические списки называются кольцевыми структурами или кольцами.

Т. о., основой построения связанных списковых структур являются указатели.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]