Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Сергиенко ВКР (1).docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
401.09 Кб
Скачать

Приложение 2. Перевод фрагмента статьи

Быстрая и надежная завязка трасс с использованием множественных структур данных в виде деревьев

Краткий обзор

В данной статье исследуется одна из основных проблем сопровождения целей, а именно проблема завязки трасс (также называемая проблемой объединения отметок). Проблема состоит в выделении совокупностей наблюдений точек, взятых в различные моменты времени, и в объединении тех наблюдений, которые соответствуют желаемой модели, без каких-либо предварительных оценок трассы. Основная сложность решения данной проблемы заключается в стремительном росте числа вариантов потенциальных трасс, подлежащих оценке.

Предлагается новый подход к процедуре завязки трасс, который позволяет производить подробный анализ всех потенциальных трасс. Также предлагается точный алгоритм с использованием множественных k-d деревьев для несложного обнаружения всех объединений отметок. Этот подход сравнивается с упрощенным вариантом метода завязки трасс на основе многомерной гипотезы с использованием структур пространственных данных. Показано, каким образом использование множественных деревьев может обеспечить значительную выгоду.

  1. Введение

Первостепенной задачей сопровождения целей является определение того, какие из наблюдений, взятых в различные моменты времени, соответствуют одному и тому же скрытому объекту. Проблема завязки трассы, или проблема сопровождения состоит в том, чтобы решить эту задачу без каких-либо предварительных оценок трассы. Рисунок 1 иллюстрирует вычислительную задачу, которую мы попытаемся решить. На рисунке показаны наблюдения для пяти моментов времени, взятые через равные интервалы, и наблюдения, полученные в различные моменты времени, которые представлены фигурами различных геометрических форм. Задача­ состоит в том, чтобы на основе предварительных данных (рис. 1А) выделить совокупности наблюдений, которые соответствуют желаемой модели движения (рис. 1В). Сложность решения такой задачи обусловлена многовариантностью подобного поиска.

Рисунок 1. Проблема завязки трасс состоит в том, чтобы найти одну точку в каждый момент времени так, чтобы отобранные точки удовлетворяли модели предполагаемой трассы. Точки, взятые для каждого из пяти различных моментов времени, показаны в виде фигур различных форм (квадрат→ круг→ треугольник→ ромб → плюс). На рисунке В изображены две линейные трассы. Третью трассу, расположенную слева, читателю предлагается найти самостоятельно.

Эта проблема важна в таких областях, как сопровождение целей и обработка изображений, но в данной статье мы остановимся главным образом на задаче обнаружения трасс астероидов. При этом необходимо определить, какие объекты наблюдения соответствуют одному и тому же выверенному объекту из серии наблюдений ночного неба. В дальнейшем эти трассы могут быть использованы для определения ориентировочных орбит, а также для сопоставления наблюдений с известной орбитой и оценки потенциального риска столкновения с астероидом. Использование новой технологии наблюдений и нового оборудования расширило границы и повысило точность постановки задачи, обеспечив возможность сопровождения сотен тысяч астероидов. Новое поколение инструментов исследования космоса, таких, как Большой обзорный телескоп (LSST) и Система телескопов панорамного обзора и быстрого реагирования (PanSTARRS), сконструировано для получения большого объема данных наблюдений, которые могут быть использованы для поиска потенциально опасных астероидов. Кроме того, эти инструменты потенциально позволяют обнаруживать и сопровождать менее яркие объекты. Однако подобные усовершенствования значительно увеличивают число возможных вариантов и ставят задачу поиска несложных алгоритмов.

Ниже представлен новый метод завязки трасс. Вместо того, чтобы трактовать завязку трасс как проблему последовательного принятия решений, мы подробно рассмотрим все возможные методы завязки трасс. Таким образом, мы создадим точный алгоритм завязки трасс. Также мы представим алгоритм множественных деревьев для наиболее удобного нахождения трасс. Мы сравним этот подход с упрощенным вариантом метода завязки трасс на основе множества гипотез, исследующих структуры пространственных данных, а также покажем, каким образом использование множественных деревьев может обеспечить значительную выгоду.

  1. Постановка задачи

Задача завязки трасс состоит в выборе множества точек наблюдений, взятых в различные моменты времени, и в объединении данных тех наблюдений, которые подходят желаемой модели, без каких-либо первоначальных оценок параметров трассы. На рисунке 2 изображен простейший пример, когда рассматривается линейная модель траектории в одномерном пространстве в течение пяти временных тактов. Множества взаимосвязанных наблюдений показаны в виде незаштрихованных кружков вместе с их линейными моделями в виде пунктирных линий.

Рисунок 2. Серия измерений в одномерном пространстве, которые объединены линейными трассами. Незаштрихованные кружки− это наблюдения, которые соответствуют линейным трассам (пунктирные линии).

Формально проблему завязки трасс можно назвать проблемой фильтрации. В каждый момент времени k мы получаем Nk точек как из основного множества отметок трасс, так и из отметок, обусловленных влиянием шумов. Задавая серию наблюдений на K временных шагах, мы хотим получить все совокупности наблюдений, такие, что:

1.в каждой совокупности наблюдений на каждом такте имеется только одно наблюдение;

2.возможно существование единичной трассы, проходящей в пределах заданных пороговых величин для каждого наблюдения.

Таким образом, мы желаем отбросить произведения из Nk возможных серий наблюдений с тем, чтобы уменьшить число совокупностей наблюдений, которые могут быть потенциальными трассами.

Наблюдения включают в себя фактические координаты в пространстве размерности D, каждое из которых отражает i- наблюдение. Эти координаты − зависимые переменные величины трассы. Мы используем обозначение ti для представления независимой переменной i-наблюдения. Хотя во многих примерах, приведенных ниже, запись ti будет соответствовать времени наблюдения, она может быть использована для представления любой независимой переменной.

Второе условие задает ограничение на соответствие наблюдений подходящей модели. Серия наблюдений (xI1 , ··· , xIK) справедлива только, если существует трасса g, для которой выполняется условие:

δL[d] ≤ xIi[d] − g(tIi)[d] ≤ δH[d] ∀d, i (1)

Уравнение 1 устанавливает, что трасса g соответствует серии наблюдений, если она (трасса) находится в пределах некоторых границ [g(tIi)[d]+ δL[d], g(tIi)[d]+ δH[d]] для каждого наблюдения xIi в каждой размерности d. Пороговые значения δL и δH обеспечивают уровень границ для выравнивания. Рисунок 3 показывает пример подходящей тройки измерений с использованием линейной модели для случая существования одной трассы, подходящей через все точки. Эта трасса может проходить в пределах допустимой величины ошибки для каждой точки.

Рисунок 3. Три точки соответствуют линейным трассам.

Данное выше определение осуществимости соответствует области моделей статистических шумов. Например, для всех точек трассы мы можем определить модель произвольных ошибок наблюдений из-за шума и установить порог в виде доверительного интервала с вероятностью 0,95 для случайных ошибок по каждой размерности. Пример этого явления продемонстрирован на рисунке 4. Кроме того, мы можем изменять нижнюю и верхнюю границы δL и δH для учета систематических ошибок и погрешностей, изменяющихся во времени.

Рисунок 4.Произвольное распределение вероятности и результирующие границы. Жирная точка обозначает наблюдаемое радиолокационное измерение, а верхняя и нижняя границы показывают допустимое местоположение для трассы.

Необходимо отметить, что в отличие от адаптивности шумовой модели ошибок измерения, рассмотренные выше критерии не применимы для концепции, известной как шумовой процесс. Это означает, что трасса всегда соответствует модели. Например, линейная модель трассы не может учитывать изменения скорости. Это кратко обсуждается в разделе 8.

Приведенные ниже рассуждения ограничены рассмотрением двух основных типов трасс: линейной и квадратичной. Квадратичная трасса − это просто некоторая квадратичная функция времени:

g(t) = a · t2 + b · t+ c (2),

которая может быть использована для описания физического движения объектов с постоянным ускорением. Линейная трасса− это линейная функция времени:

g(t) = b · t + c (3),

которая может быть использована для описания физического движения объектов с постоянной скоростью. Кроме того, линейная модель может быть использована для изучения таких вопросов, как нахождение линий или границ, описываемых с помощью наблюдений. В дальнейшем, чтобы сохранить последовательность и простоту изложения, мы ограничимся рассмотрением линейной и квадратичной моделей. В то же время большая часть наших рассуждений и представленных ниже методов может быть использована и для других моделей трасс.

  1. Предыдущие работы в этом направлении

Существует множество различных подходов к решению проблемы завязки трасс. Ниже мы кратко охарактеризуем некоторые наиболее общие подходы. Они имеют некоторые отличия от подхода, предлагаемого нами. Во-первых, отличается постановка вопросов. В частности, мы анализируем всю совокупность наблюдений, которые могли бы относиться к какой-либо траектории. Во-вторых, в ходе анализа мы рассматриваем точный алгоритм решения вопроса.

3.1 Последовательная завязка трасс

Одним из общих подходов к решению задачи завязки трасс является последовательная завязка трасс [Блэкмен, Пополи, 1999]. Разрозненные точки рассматриваются как новые трассы и экстраполируются на следующий временной шаг, после чего они объединяются с другими точками, чтобы сформировать более длинные трассы. Существует множество разновидностей подходов такого типа. Одной из общих и наиболее эффективных разновидностей является очень простой вариант завязки трасс на основе многомерной гипотезы. Когда пробная трасса соответствует многомерным наблюдениям в заданный момент времени, формируются многомерные гипотезы (пробные трассы), и решение откладывается на более поздний период времени. Этот процесс показан на рисунке 5.Единичная точка соответствует трем другим точкам во второй момент времени. Эти точки используются для создания трех гипотетических трасс. Процесс продолжается в третий и четвертый моменты времени, при этом «плохие» гипотезы отбрасываются.

Для снижения числа потенциальных точек, близких по расположению, применяется стробирование. Как показано на рисунке 6,соседние точки могут отбрасываться в зависимости от того, попадают ли они в окно или строб вокруг точки предполагаемой трассы. Этот подход также используется в сочетании со структурами kd-деревьев для быстрого поиска перспективных наблюдений около предполагаемой точки трассы [Ульманн 1992, Ульманн 2001].

Существует несколько потенциальных недостатков подхода такого типа, которые проистекают из последовательной природы поиска как такового. Подход не использует экспериментальные данные с более поздних шагов измерения для более раннего принятия решения. Начальные «хорошие пары» могут быть легко отброшены при отсутствии дальнейших точек вдоль трассы. Более того, данный подход не может применяться, если на трассе уже существуют шумы. Метод завязки трасс на основе многомерной гипотезы пытается упростить эту задачу с помощью учета множества потенциальных трасс, но тут возникает другая проблема− возможность высокого коэффициента ветвления, вызывающего значительную вычислительную нагрузку.

Рисунок 5. Сопровождение цели, основанное на многомерной гипотезе, начинается с предполагаемой трассы (А) и последовательно проверяется в более поздние моменты времени. Если множество точек являются потенциальными трассами, тогда может быть предложено несколько гипотез (В и С).

Рисунок 6. Стробирование может быть использовано для исключения точек, которые не могут быть частью текущей трассы. Предполагаемая координата трассы показана на рисунке символом Х. Точки, которые оказываются в пределах строба, закрашены.

Необходимо отметить, что последовательная завязка трасс имеет преимущество использования одновременно для множества трасс. В связи с этим подход позволяет сократить наблюдения, которые «явно» являются точками другой трассы.

Рисунок 7. Наличие шумовых выбросов на предыдущих тактах может значительно снизить количество предполагаемых трасс-кандидатов. Истинные точки трассы показаны в виде не заштрихованных кружков, и наблюдаемые точки показаны в виде заштрихованных кружков.

    1. Методы параметрического пространства

Другой подход к проблеме завязки трасс заключается в поиске трасс в параметрическом пространстве. Один из наиболее известных алгоритмов − это преобразование Хафа [Хаф, 1959].Идея, лежащая в основе этих подходов, заключается в том, что для многих простых моделей отдельные наблюдения соответствуют отдельным областям или кривым в параметрическом пространстве. Пример с линейной моделью показан на рисунке 8.Точки показаны на рисунке 8.A, а соответствующие им линии в параметрическом пространстве− на рисунке 8.B.Если серия наблюдений лежит вдоль линии, тогда соответствующие им линии в параметрическом пространстве будут пересекаться в одной точке. В преобразовании Хафа поиск линий может осуществляться с использованием сетки подсчета количества линий, которые проходят через определенную область параметрического пространства (рисунки 8.С и 8.D).

Существует несколько основных недостатков подхода с использованием параметрического пространства. Во-первых, хранение и использование параметрического представления может потребовать больших вычислительных затрат и перегрузить память ЭВМ. Существует множество возможных пересечений, которые необходимо проверить. Информация, хранимая в сетчатой структуре, может потребовать много свободного места. Во-вторых, уровень дискретизации параметрического пространства может сильно влиять на точность алгоритма.

Рисунок 8.

Если сетка слишком плотная (детальная), тогда небольшое количество шумов может стать причиной пересечений, распространяющихся на несколько клеток и вызывающих ошибки. Если сетка неплотная (слишком грубая), тогда данные могут совпадать и вызывать ложные тревоги. Однако ложные тревоги могут быть исключены с помощью последующей обработки. В дальнейшем этот шаг увеличивает стоимость вычислений.