Д-арная куча - D-ary heap

В d-арная куча или же dкуча это приоритетная очередь структура данных, обобщение двоичная куча в которых узлы имеют d дети вместо 2.[1][2][3] Таким образом, двоичная куча - это 2-куча, а троичная куча это 3-х кучка. По словам Тарьяна[2] и Jensen et al.,[4] d-яркие кучи изобретены Дональд Б. Джонсон в 1975 г.[1]

Эта структура данных позволяет выполнять операции с пониженным приоритетом быстрее, чем двоичные кучи, за счет более медленных минимальных операций удаления. Этот компромисс приводит к увеличению времени работы таких алгоритмов, как Алгоритм Дейкстры в которых операции уменьшения приоритета более распространены, чем операции удаления min.[1][5] Кроме того, d- у кучи лучше кеш памяти поведение, чем двоичные кучи, что позволяет им работать быстрее на практике, несмотря на теоретически большее время работы в худшем случае.[6][7] Как двоичные кучи, d-эрохлы - это структура данных на месте который не использует дополнительного хранилища, кроме необходимого для хранения массива элементов в куче.[2][8]

Структура данных

В d-арная куча состоит из множество из п элементы, каждый из которых имеет связанный с ним приоритет. Эти элементы можно рассматривать как узлы в полном d-арное дерево, перечисленное в порядок обхода в ширину: элемент в позиции 0 массива (используя нумерация с нуля ) образует корень дерева, элементы в позициях с 1 по d его дети, следующие d2 элементы являются его внуками и т. д. Таким образом, родитель элемента в позиции я (для любого я > 0) - это элемент в позиции ⌊(я − 1)/d и его дочерние элементы - это элементы в позициях ди + 1 через ди + d. Согласно куча собственности в минимальной куче каждый элемент имеет приоритет, по крайней мере, такой же, как у его родительского элемента; в максимальной куче каждый элемент имеет приоритет не больше, чем его родительский элемент.[2][3]

Элемент с минимальным приоритетом в min-heap (или элемент с максимальным приоритетом в max-heap) всегда можно найти в позиции 0 массива. Чтобы удалить этот элемент из очереди приоритетов, последний элемент Икс в массиве перемещается на свое место, а длина массива уменьшается на единицу. Тогда пока элемент Икс и его дочерние элементы не удовлетворяют свойству кучи, элемент Икс заменяется одним из его дочерних элементов (тот, у которого наименьший приоритет в минимальной куче, или тот, у которого самый большой приоритет в максимальной куче), перемещая его вниз по дереву, а затем в массив, пока в конечном итоге не будет куча собственностью доволен. Та же процедура перестановки вниз может использоваться для увеличения приоритета элемента в минимальной куче или для уменьшения приоритета элемента в максимальной куче.[2][3]

Чтобы вставить новый элемент в кучу, этот элемент добавляется в конец массива, а затем, когда свойство кучи нарушается, он заменяется его родителем, перемещая его вверх в дереве и раньше в массиве, пока в конечном итоге не появится свойство кучи удовлетворено. Та же процедура перестановки вверх может использоваться для уменьшения приоритета элемента в минимальной куче или для увеличения приоритета элемента в максимальной куче.[2][3]

Чтобы создать новую кучу из массива п items, можно перебирать элементы в обратном порядке, начиная с элемента в позиции п − 1 и заканчивая элементом в позиции 0, применяя процедуру нисходящей замены для каждого элемента.[2][3]

Анализ

В d-арная куча с п элементов в нем, как процедура перестановки вверх, так и процедура перестановки вниз может выполнять до бревноd п = журнал п / бревно d свопы. В процедуре перестановки снизу вверх каждая перестановка включает однократное сравнение элемента с его родительским элементом и занимает постоянное время. Следовательно, время для вставки нового элемента в кучу, уменьшения приоритета элемента в минимальной куче или повышения приоритета элемента в максимальной куче составляет O (журнал п / бревно d). В процедуре обмена вниз каждый обмен включает d сравнения и берет O (d) время: это занимает d − 1 сравнения, чтобы определить минимум или максимум дочерних элементов, а затем еще одно сравнение с родительским, чтобы определить, нужен ли обмен. Следовательно, время для удаления корневого элемента, повышения приоритета элемента в минимальной куче или уменьшения приоритета элемента в максимальной куче составляет O (d бревно п / бревно d).[2][3]

При создании d-арная куча из набора п предметы, большинство предметов находятся в положениях, которые в конечном итоге будут удерживать листья d-ary, и для этих элементов не выполняется свопинг вниз. В большинстве п/d + 1 предметы не являются листами и могут быть заменены вниз хотя бы один раз за O (d) пора найти ребенка, чтобы поменяться ими. В большинстве п/d2 + 1 узлы могут быть переключены вниз два раза, что влечет за собой дополнительные O (d) стоимость второго свопа сверх стоимости, уже учтенной в первом члене, и т. д. Следовательно, общее время создания кучи таким образом равно

[2][3]

Известно, что точное значение вышеприведенного (наихудшее количество сравнений при построении d-арной кучи) равно:

,[9]

где sd(n) - это сумма всех цифр стандартного d-представления n и ed(n) - показатель степени d при факторизации n. Это сводится к

,[9]

для d = 2 и для

,[9]

для d = 3.

Использование пространства d-ари heap с операциями insert и delete-min является линейным, поскольку не использует дополнительного хранилища, кроме массива, содержащего список элементов в куче.[2][8] Если необходимо поддерживать изменения приоритетов существующих элементов, то необходимо также поддерживать указатели с элементов на их позиции в куче, которая опять же использует только линейное хранилище.[2]

Приложения

При работе на график с м края и п вершины, обе Алгоритм Дейкстры за кратчайшие пути и Алгоритм Прима за минимальные остовные деревья используйте min-кучу, в которой есть п delete-min операции и столько же м операции с пониженным приоритетом. Используя d-арная куча с d = м/п, общее время для этих двух типов операций может быть уравновешено друг с другом, что приведет к общему времени O (м бревном/п п) для алгоритма улучшение по сравнению с O (м бревно п) время работы версий этих алгоритмов в виде двоичной кучи всякий раз, когда количество ребер значительно превышает количество вершин.[1][5] Альтернативная структура данных очереди приоритетов, Куча Фибоначчи, дает еще лучшее теоретическое время работы O (м + п бревно п), но на практике d-ary кучи, как правило, не менее, а часто и быстрее, чем кучи Фибоначчи для этого приложения.[10]

На практике 4-кучи могут работать лучше, чем двоичные кучи, даже для операций удаления мин.[2][3] Кроме того, d-ary heap обычно работает намного быстрее, чем двоичная куча, если размер кучи превышает размер компьютерной кэш-память: Двоичная куча обычно требует больше промахи в кеше и виртуальная память ошибки страницы чем d-ary heap, каждый из которых занимает гораздо больше времени, чем дополнительная работа, вызванная дополнительными сравнениями a d-ary heap делает по сравнению с двоичной кучей.[6][7]

Рекомендации

  1. ^ а б c d Джонсон, Д. Б. (1975), «Приоритетные очереди с обновлением и поиском минимальных остовных деревьев», Письма об обработке информации, 4 (3): 53–57, Дои:10.1016/0020-0190(75)90001-0.
  2. ^ а б c d е ж грамм час я j k л Тарьян, Р.Э. (1983), "3.2. d-купы », Структуры данных и сетевые алгоритмы, Серия региональных конференций CBMS-NSF по прикладной математике, 44, Общество промышленной и прикладной математики, стр. 34–38. Обратите внимание, что Тарьян использует нумерацию на основе 1, а не на основе 0, поэтому его формулы для родительского и дочернего узла должны быть скорректированы при использовании нумерации на основе 0.
  3. ^ а б c d е ж грамм час Вайс, М.А. (2007) "d-купы », Структуры данных и анализ алгоритмов (2-е изд.), Addison-Wesley, p. 216, ISBN  0-321-37013-9.
  4. ^ Jensen, C .; Katajainen, J .; Витале, Ф. (2004), Расширенная правда о кучах (PDF).
  5. ^ а б Тарджан (1983), стр.77 и 91.
  6. ^ а б Naor, D .; Martel, C.U .; Матлофф, Н. С. (октябрь 1991 г.), "Производительность структур приоритетной очереди в среде виртуальной памяти", Компьютерный журнал, 34 (5): 428–437, Дои:10.1093 / comjnl / 34.5.428.
  7. ^ а б Камп, Поул-Хеннинг (11 июня 2010 г.), "Ты делаешь это неправильно", Очередь ACM, 8 (6).
  8. ^ а б Mortensen, C.W .; Петти, С. (2005), "Сложность неявных и эффективных по пространству очередей приоритетов", Алгоритмы и структуры данных: 9-й международный семинар, WADS 2005, Ватерлоо, Канада, 15–17 августа 2005 г., Труды, Конспект лекций по информатике, 3608, Springer-Verlag, pp. 49–60, Дои:10.1007/11534273_6, ISBN  978-3-540-28101-6.
  9. ^ а б c Сученек, Марек А. (2012), «Элементарный, но точный анализ наихудшего случая программы строительства кучи Флойда», Fundamenta Informaticae, IOS Press, 120 (1): 75–92, Дои:10.3233 / FI-2012-751.
  10. ^ Черкасский, Борис В .; Гольдберг, Эндрю В.; Радзик, Томаш (май 1996 г.), «Алгоритмы кратчайшего пути: теория и экспериментальная оценка», Математическое программирование, 73 (2): 129–174, CiteSeerX  10.1.1.48.752, Дои:10.1007 / BF02592101.

внешняя ссылка