Геометрия бинарных деревьев поиска - Geometry of binary search trees

В Информатика, один подход к динамическая оптимальность проблема на онлайн-алгоритмы за деревья двоичного поиска включает в себя переформулировку задачи геометрически, с точки зрения увеличения набора точек на плоскости как можно меньшим количеством дополнительных точек, чтобы избежать прямоугольников с двумя точками на границе.[1]

Последовательности доступа и соотношение конкуренции

Как обычно формулируется, проблема онлайн-бинарного дерева поиска включает деревья поиска, определенные по фиксированному набору ключей (1, 2, ..., п). An последовательность доступа это последовательность ... где каждое число Икся является одним из указанных ключей.

Любой конкретный алгоритм для поддержки двоичных деревьев поиска (например, растопленное дерево алгоритм или Структура рабочего набора Иаконо ) имеет Стоимость для каждой последовательности доступа, моделирующей количество времени, которое потребуется для использования структуры поочередного поиска каждого из ключей в последовательности доступа. Стоимость поиска моделируется путем предположения, что алгоритм дерева поиска имеет единственный указатель на двоичное дерево поиска, которое в начале каждого поиска указывает на корень дерева. Затем алгоритм может выполнять любую последовательность следующих операций:

  • Переместите указатель к его левому дочернему элементу.
  • Переместите указатель к его правому дочернему элементу.
  • Переместите указатель на его родителя.
  • Выполнить сингл вращение деревьев на указатель и его родительский элемент.

Поиск требуется в какой-то момент в этой последовательности операций для перемещения указателя на узел, содержащий ключ, а стоимость поиска - это количество операций, выполняемых в последовательности. Общая стоимость стоимостиА(Икс) для алгоритма А о последовательности доступа Икс - это сумма затрат на поиск каждого последующего ключа в последовательности.

Как стандарт в Конкурентный анализ, то конкурентное соотношение алгоритма А определяется как максимальное по всем последовательностям доступа отношение стоимости для А с максимальной стоимостью, которую может достичь любой алгоритм:

В гипотеза динамической оптимальности утверждает, что растопыренные деревья имеют постоянный коэффициент конкурентоспособности, но это остается недоказанным. Геометрический взгляд на бинарные деревья поиска предоставляет другой способ понимания проблемы, которая привела к разработке альтернативных алгоритмов, которые также (предположительно) могут иметь постоянный коэффициент конкуренции.

Перевод в набор геометрических точек

С геометрической точки зрения проблемы дерева двоичного поиска в Интернете, последовательность доступа (последовательность поисков, выполняемых в двоичном дереве поиска (BST) с набором ключей ) отображается на множество точек , где ось X представляет собой пространство клавиш, а ось Y представляет время; к которому набор коснулся узлов добавлен. К коснулся узлы имеем в виду следующее. Рассмотрим алгоритм доступа BST с единственным указателем на узел в дереве. В начале доступа к заданному ключу , этот указатель инициализируется корнем дерева. Каждый раз, когда указатель перемещается на узел или инициализируется для него, мы говорим, что узел был затронут.[2]Мы представляем алгоритм BST для данной входной последовательности, рисуя точку для каждого элемента, к которому прикасаются.

Например, предположим, что на 4 узлах задан следующий BST: StaticBinarySearchTree GeometricalView example.jpgНабор ключей: {1, 2, 3, 4}.

Отображение только последовательности доступа 3, 1, 4, 2.
Геометрический вид алгоритма двоичного дерева поиска.

Пусть 3, 1, 4, 2 - последовательность доступа.

  • При первом доступе затрагивается только узел 3.
  • Во втором доступе касаются узлов 3 и 1.
  • В третьем доступе - затронуты 3 и 4.
  • В четвертом доступе коснитесь 3, затем 1, а затем 2.

Касания представлены геометрически: если предмет Икс затрагивается в операциях для я-й доступ, затем точка (Икс,я) нанесен.

Наборы очков, удовлетворяемые произвольно

Прямоугольник, образованный двумя точками. Этот набор точек нет древесно доволен.
Это пример произвольно выполненного набора баллов.

Набор точек называется древесно удовлетворенный если выполняется следующее свойство: для любой пары точек, которые не лежат на одной и той же горизонтальной или вертикальной линии, существует третья точка, которая лежит в прямоугольнике, натянутом на первые две точки (либо внутри, либо на границе).

Теорема

Набор точек, содержащий точки произвольно удовлетворяется тогда и только тогда, когда он соответствует действительному BST для входной последовательности .

Доказательство

Во-первых, докажите, что набор точек для любого допустимого алгоритма BST выполняется произвольно. и , куда Икс тронут время я и у тронут время j. Предположим по симметрии, что и . Необходимо показать, что в прямоугольнике существует третья точка с углами как и . Также позвольте обозначить наименьший общий предок узлов аи б как раз раньше времени т. Есть несколько случаев:

  • Если , затем используйте точку , поскольку должен был быть тронут, если Икс был.
  • Если , то точка может быть использован.
  • Если ни один из двух вышеупомянутых случаев не выполняется, то Икс должен быть предком у как раз раньше времени я и у быть предком Икс как раз раньше времени j. Потом когда-нибудь k , у должно быть повернуто выше Икс, так что точка может быть использован.

Затем покажите другое направление: для произвольно удовлетворяемого набора точек можно построить действительный BST, соответствующий этому набору точек. Организуйте наш BST в треап, который организован в виде кучи по времени следующего касания. Обратите внимание, что время следующего касания связано со связями и поэтому не определяется однозначно, но это не проблема, если есть способ разорвать связи. Когда время я достигнуто, узлы, которых коснулись, образуют связанное поддерево наверху, благодаря свойству упорядочивания кучи. Теперь назначьте новое время следующего касания для этого поддерева и перегруппируйте его в новый локальный треап. Если пара узлов, Икс и у, расположите границу между затронутой и нетронутой частью treap, тогда, если у нужно коснуться раньше, чем Икс тогда - неудовлетворенный прямоугольник, потому что крайняя левая такая точка будет правым дочерним элементом Икс, нет у.

Следствие

Поиск наилучшего исполнения BST для входной последовательности эквивалентен поиску минимального количества точек надмножества точек (которое содержит входные данные в геометрическом представлении), которое выполняется произвольно. Более общая проблема поиска минимальной мощности произвольно удовлетворяемой надмножества общего набора входных точек (не ограничивается одной входной точкой на у координата), как известно НП-полный.[1]

Жадный алгоритм

Следующее жадный алгоритм строит произвольно выполнимые множества:

  • Проведите точку, установленную горизонтальной линией, увеличивая у координировать.
  • Вовремя я, поместите минимальное количество точек в чтобы поставить точку в древесно доволен. Этот минимальный набор точек определяется однозначно: для любого неудовлетворенного прямоугольника, сформированного с в одном углу добавьте другой угол в .

Предполагается, что алгоритм является оптимальным в пределах аддитивного члена.[3]

Другие результаты

Геометрия двоичных деревьев поиска использовалась для обеспечения алгоритма, который является динамически оптимальным, если любой алгоритм двоичного дерева поиска является динамически оптимальным.[4]

Смотрите также

Рекомендации

  1. ^ а б Демейн, Эрик Д.; Хармон, Дион; Яконо, Джон; Кейн, Дэниел; Пэтрашку, Михай (2009), «Геометрия бинарных деревьев поиска», в материалах 20-го ежегодного симпозиума ACM-SIAM по дискретным алгоритмам (SODA 2009), Нью-Йорк: 496–505, Дои:10.1137/1.9781611973068.55
  2. ^ Демейн, Эрик Д.; Хармон, Дион; Яконо, Джон; Пэтрашку, Михай (2007), «Динамическая оптимальность - почти», SIAM Журнал по вычислениям, 37 (1): 240–251, CiteSeerX  10.1.1.99.4964, Дои:10.1137 / S0097539705447347, МИСТЕР  2306291
  3. ^ Фокс, Кайл (15–17 августа 2011 г.). Верхние границы для максимально жадных деревьев двоичного поиска (PDF). Алгоритмы и структуры данных: 12-й Международный симпозиум, WADS 2011. Конспект лекций по информатике. 6844. Нью-Йорк: Спрингер. С. 411–422. arXiv:1102.4884. Дои:10.1007/978-3-642-22300-6_35.
  4. ^ Яконо, Джон (2013). «В погоне за гипотезой динамической оптимальности». Компактные структуры данных, потоки и алгоритмы. Конспект лекций по информатике. 8066: 236–250. arXiv:1306.0207. Bibcode:2013arXiv1306.0207I. Дои:10.1007/978-3-642-40273-9_16. ISBN  978-3-642-40272-2.