Мягкая куча - Soft heap

В Информатика, а мягкая куча вариант на простом структура данных кучи что имеет постоянный амортизированный временная сложность на 5 видов операций. Это достигается путем тщательного «развращения» (увеличения) ключей не более чем постоянного числа значений в куче. Операции с постоянным временем:

  • Создайте(S): Создать новую мягкую кучу
  • вставлять(S, Икс): Вставить элемент в мягкую кучу
  • объединить(S, S ' ): Объединить содержимое двух мягких куч в одну, уничтожив обе
  • Удалить(S, Икс): Удалить элемент из мягкой кучи
  • findmin(S): Получить элемент с минимальным ключом в мягкой куче

Другие кучи, такие как Куча Фибоначчи достичь большинства этих границ без какого-либо искажения, но не может обеспечить постоянное ограничение по времени для критических Удалить операция. Степень искажения можно контролировать путем выбора параметра ε, но чем ниже он установлен, тем больше времени требуется на вставку (О (log 1 / ε) для коэффициента ошибок ε).

Точнее, гарантия, предлагаемая soft heap, следующая: на фиксированное значение ε от 0 до 1/2, в любой момент времени будет не более ε * n поврежденные ключи в куче, где п количество элементов, вставленных на данный момент. Обратите внимание, что это не гарантирует, что только фиксированный процент ключей В данный момент в куче повреждены: в неудачной последовательности вставок и удалений может случиться так, что все элементы в куче будут иметь поврежденные ключи. Точно так же у нас нет гарантии, что в последовательности элементов, извлеченных из кучи с помощью findmin и Удалить, только фиксированный процент будет иметь поврежденные ключи: в неудачном сценарии из кучи извлекаются только поврежденные элементы.

Мягкая куча была разработана Бернар Шазель в 2000 году. Термин «коррупция» в структуре является результатом того, что Шазель назвал «попутным коллективом» в мягкой куче. Каждый узел в программной куче содержит связанный список ключей и один общий ключ. Общий ключ - это верхняя граница значений ключей в связанном списке. После того, как ключ добавлен в связанный список, он считается поврежденным, поскольку его значение больше никогда не будет актуально ни для одной из операций с программной кучей: сравниваются только общие ключи. Это то, что делает мягкие кучи «мягкими»; вы не можете быть уверены, что какое-либо конкретное значение, которое вы в него вложили, будет повреждено. Целью этих искажений является эффективное снижение информационная энтропия данных, позволяя структуре данных прорваться теоретико-информационный барьеры относительно кучи.

Приложения

Несмотря на свои ограничения и непредсказуемый характер, мягкие кучи полезны при разработке детерминированных алгоритмов. Они использовались для достижения максимальной на сегодняшний день сложности поиска минимальное остовное дерево. Их также можно использовать для простого построения оптимального алгоритм выбора, а также почти сортировка алгоритмы, которые представляют собой алгоритмы, которые помещают каждый элемент в его конечное положение, ситуация, в которой вставка сортировки быстро.

Один из простейших примеров - алгоритм выбора. Скажем, мы хотим найти kth по величине из группы п числа. Сначала мы выбираем коэффициент ошибок 1/3; то есть не более 33% вставленных нами ключей будут повреждены. Теперь вставляем все п элементы в кучу - мы называем исходные значения «правильными» ключами, а значения, хранящиеся в куче, «сохраненными» ключами. На данный момент не более п/ 3 ключи повреждены, то есть не более п/ 3 keys - это «сохраненный» ключ, больший, чем «правильный» ключ, для всех остальных сохраненный ключ равен правильному ключу.

Далее мы удаляем минимальный элемент из кучи п/ 3 раза (это делается по "сохраненному" ключу). Поскольку общее количество выполненных нами вставок по-прежнему равно n, остается не более п/ 3 поврежденных ключа в куче. Соответственно не менее 2п/3 − п/3 = п/ 3 ключей, оставшихся в куче, не повреждены.

Позволять L быть элементом с наибольшим правильным ключом среди элементов, которые мы удалили. Сохраненный ключ L возможно больше, чем его правильный ключ (если L был поврежден), и даже это большее значение меньше, чем все сохраненные ключи оставшихся элементов в куче (поскольку мы удаляли минимумы). Следовательно, правильный ключ L меньше остальных п/ 3 неповрежденных элемента в мягкой куче. Таким образом, L разделяет элементы где-то между 33% / 66% и 66% / 33%. Затем мы разбиваем набор на L с использованием раздел алгоритм от быстрая сортировка и снова примените тот же алгоритм к набору чисел меньше, чем L или набор чисел больше, чем L, ни одно из которых не может превышать 2п/ 3 элемента. Поскольку для каждой вставки и удаления требуется O (1) амортизированного времени, общее детерминированное время равно T (п) = Т (2п/ 3) + O (п). С помощью чехол 3 из основная теорема для повторений "разделяй и властвуй" (при ε = 1 и c = 2/3), мы знаем, что T (п) = Θ (п).

Окончательный алгоритм выглядит так:

функция softHeapSelect (a [1..n], k) если k = 1 затем вернись минимум (a [1..n]) создать (S) за я из 1 к n вставить (S, a [i]) за я из 1 к n / 3 x: = findmin (S) delete (S, x) xIndex: = раздел (a, x) // Возвращает новый индекс точки поворота x    если k еще        softHeapSelect (a [xIndex..n], k-xIndex + 1)

Рекомендации

  • Шазель, Бернар (ноябрь 2000 г.). «Мягкая куча: примерная приоритетная очередь с оптимальной частотой ошибок» (PDF). J. ACM. 47 (6): 1012–1027. CiteSeerX  10.1.1.5.9705. Дои:10.1145/355541.355554.
  • Каплан, Хаим; Цвик, Ури (2009). «Более простая реализация и анализ мягких куч Chazelle». Материалы девятнадцатого ежегодного симпозиума ACM – SIAM по дискретным алгоритмам. Общество промышленной и прикладной математики. С. 477–485. CiteSeerX  10.1.1.215.6250. Дои:10.1137/1.9781611973068.53. ISBN  978-0-89871-680-1.