Иерархии сжатия - Contraction hierarchies

В Информатика, метод иерархии сжатия это техника ускорения для поиска кратчайший путь в график. Наиболее интуитивно понятными приложениями являются автомобильные навигационные системы: пользователь хочет ехать из к используя максимально быстрый маршрут. Оптимизированный здесь показатель - это время в пути. Перекрестки представлены вершины, соединяющие их участки дорог края. Вес края представляет собой время, необходимое для проезда по этому участку дороги. Путь от к - последовательность кромок (участков дороги); кратчайший путь - это путь с минимальной суммой весов ребер среди всех возможных путей. Кратчайший путь в графе можно вычислить с помощью Дейкстры алгоритм; но учитывая, что дорожная сеть состоит из десятков миллионов вершин, это непрактично.[1] Сужение иерархий - это метод ускорения, оптимизированный для использования свойств графов, представляющих дорожные сети.[2] Ускорение достигается за счет создания ярлыков на этапе предварительной обработки, которые затем используются во время запроса кратчайшего пути для пропуска «неважных» вершин.[2] Это основано на наблюдении за высокой иерархией дорожных сетей. Некоторые перекрестки, например, развязки автомагистралей, «более важны» и находятся выше в иерархии, чем, например, перекресток, ведущий в тупик. Ярлыки можно использовать для сохранения предварительно вычисленного расстояния между двумя важными соединениями, так что алгоритму не нужно учитывать полный путь между этими соединениями во время запроса. Иерархии сужения не знают, какие дороги люди считают "важными" (например, шоссе), но им предоставляется граф в качестве входных данных, и они могут назначать важность вершинам с помощью эвристики.

Иерархии сокращения применяются не только к алгоритмам ускорения в автомобильные навигационные системы но также и в веб- планировщики маршрутов, моделирование движения, и оптимизация логистики.[3][1][4] Реализации алгоритма общедоступны как программное обеспечение с открытым исходным кодом.[5][6][7][8][9]

Алгоритм

Алгоритм иерархий сжатия (CH) представляет собой двухэтапный подход к проблема кратчайшего пути состоящий из фаза предварительной обработки и этап запроса. Поскольку дорожные сети меняются довольно редко, можно использовать больше времени (от секунд до часов), чтобы предварительно вычислить некоторые расчеты, прежде чем будет дан ответ на запросы. Используя эти предварительно вычисленные данные, можно ответить на многие запросы, занимая очень мало времени (микросекунды) каждый.[1][3] CH полагаются на ярлыки для достижения этого ускорения. Ярлык соединяет две вершины и не смежные в исходном графе. Вес его ребра - это сумма весов ребер на самом коротком - дорожка.

Рассмотрим два больших города, соединенных автомагистралью. Между этими двумя городами есть множество перекрестков, ведущих в небольшие деревни и пригороды. Большинство водителей хотят добраться из одного города в другой - возможно, в рамках более крупного маршрута - и не свернуть с одного из съездов по пути. На графике, представляющем эту схему дороги, каждый перекресток представлен узлом, а ребра создаются между соседними перекрестками. Чтобы вычислить расстояние между этими двумя городами, алгоритм должен пройти по всем ребрам, складывая их длину. Предварительное вычисление этого расстояния один раз и сохранение его в дополнительном ребре, созданном между двумя большими городами, позволит сэкономить вычисления каждый раз, когда это шоссе должно оцениваться в запросе. Это дополнительное преимущество называется «ярлыком» и не имеет аналогов в реальном мире. Алгоритм сужения иерархий ничего не знает о типах дорог, но может определять, какие ярлыки необходимо создать, используя только граф в качестве входных данных.

Чтобы найти путь от к алгоритм может пропускать серые вершины и использовать пунктирные ярлык вместо. Это уменьшает количество вершин, на которые должен смотреть алгоритм. Вес края ярлыка от к - сумма весов ребер кратчайшего - дорожка.

Фаза предварительной обработки

Алгоритм CH полагается на ярлыки, созданные на этапе предварительной обработки, чтобы уменьшить пространство поиска - то есть количество вершин, которые CH должен просматривать во время запроса. Для этого выполняются итерационные сокращения вершин. При сокращении вершины он временно удален с графика , и ярлык создается между каждой парой соседних вершин, если кратчайший путь из к содержит .[2] Процесс определения, если кратчайший путь между и содержит называется поиском свидетеля. Это может быть выполнено, например, путем вычисления пути из к использование прямого поиска с использованием только еще не свернутых узлов.[3]

Исходный график - это линия (твердый). Пунктирные края представляют собой ярлыки, серые стрелки показывают, какие два края объединены для формирования соответствующего ярлыка. Вершины нарисованы, чтобы представить порядок узлов, в котором вершины сужаются, снизу вверх. Сжимающая вершина вводит ярлык между и с . Стягивания вершин и ввести один ярлык соответственно. Схватки , и не вводят никаких ярлыков и поэтому не отображаются.

Порядок узлов

Вершины входного графа должны быть сжаты таким образом, чтобы минимизировать количество ребер, добавляемых к графу путем сжатия. Поскольку оптимальный порядок узлов равен НП-полный,[10] эвристика используются.[2]

Вверх дном и сверху вниз эвристика существует. С одной стороны, более дешевая с вычислительной точки зрения восходящая эвристика определяет порядок, в котором сужаются вершины в жадный мода; это означает, что порядок не известен заранее, а для сжатия выбирается следующий узел после того, как предыдущее сжатие было завершено. С другой стороны, нисходящая эвристика предварительно вычисляет упорядочение всего узла до того, как первый узел сжимается. Это дает лучшие результаты, но требует больше времени на предварительную обработку.[2]

В вверх дном эвристика, комбинация факторов используется для выбора следующей вершины для сжатия. Поскольку количество ярлыков является основным фактором, определяющим время предварительной обработки и выполнения запросов, мы хотим, чтобы оно было как можно меньше. Таким образом, наиболее важным параметром для выбора следующего узла для сжатия является чистое количество ребер, добавленных при сжатии узла. . Это определяется как куда это количество ярлыков, которые будут созданы, если должны были быть заключены и количество ребер, инцидентных . Используя только этот критерий, линейный путь приведет к линейной иерархии (много уровней) без создания ярлыков. Рассматривая количество соседних вершин, которые уже сжаты, достигается равномерное сжатие и плоская иерархия (меньше уровней). Это может быть сделано, например, путем поддержания счетчика для каждого узла, который увеличивается каждый раз, когда соседняя вершина сжимается. Тогда узлы с более низкими счетчиками предпочтительнее, чем узлы с более высокими счетчиками шириной.[11]

Сверху вниз эвристика, с другой стороны, дает лучшие результаты, но требует больше времени на предварительную обработку. Они классифицируют вершины, которые являются частью многих кратчайших путей, как более важные, чем те, которые необходимы только для нескольких кратчайших путей. Это может быть приблизительный с помощью вложенные разрезы.[2] Чтобы вычислить вложенное рассечение, нужно рекурсивно разделять граф на две части; которые затем разделяются на две части и так далее. То есть найти подмножество узлов которые при удалении с графика отдельный на две отдельные части примерно одинакового размера, так что . Разместите все узлы последний в порядке узлов, а затем рекурсивно вычислить вложенное рассечение для и .[12] Интуиция заключается в том, что все запросы от одной половины графа к другой половине графа должны проходить через небольшой разделитель, и поэтому узлы в этом разделителе имеют большое значение. Вложенные разрезы могут быть эффективно рассчитаны на дорожных сетях из-за их небольших разделителей.[13]

Фаза запроса

На этапе запроса выполняется двунаправленный поиск, начиная с начального узла. и целевой узел на исходном графике, дополненном ярлыками, созданными на этапе предварительной обработки.[2] Самая важная вершина на кратчайшем пути между и будет либо или же сами или важнее обоих и . Следовательно, вершина сведение к минимуму находится на кратчайшем пути путь в исходном графе и держит.[2] Это, в сочетании с тем, как создаются ярлыки, означает, что как при прямом, так и обратном поиске нужно только ослабить ребра, ведущие к более важным узлам (вверх) в иерархии, что сохраняет пространство поиска небольшим.[3] Во всех путях вверх- (вниз-вверх)-вниз внутренний (вниз-вверх) можно пропустить, потому что на этапе предварительной обработки был создан ярлык.

При вычислении кратчайшего пути из к , прямой (оранжевый) и обратный (синий) поиск должен следовать только по ребрам, идущим вверх по иерархии. Найденный путь отмечен красным и использует один ярлык (пунктир).

Поиск пути

Запрос CH, как описано выше, дает время или расстояние от к но не реальный путь. Чтобы получить список краев (дорог) кратчайшего пути, необходимо распаковать взятые ярлыки. Каждый ярлык - это соединение двух ребер: либо двух ребер исходного графа, либо двух ярлыков, либо одного исходного ребра и одного ярлыка. Сохранение средней вершины каждого ярлыка во время сжатия позволяет рекурсивно распаковывать кратчайший маршрут в линейном времени.[2][3]

Индивидуальные иерархии сокращений

Если веса ребер меняются чаще, чем топология сети, CH можно расширить до трехфазного подхода, включив этап настройки между этапом предварительной обработки и этапом запроса. Это можно использовать, например, для переключения между кратчайшим расстоянием и кратчайшим временем или включением текущей информации о дорожном движении, а также пользовательских предпочтений, таких как избегание определенных типов дорог (паромы, шоссе, ...). На этапе предварительной обработки большая часть времени выполнения тратится на вычисление порядка, в котором узлы сжимаются.[3] Эту последовательность операций сжатия на этапе предварительной обработки можно сохранить на тот случай, когда они потребуются позже на этапе настройки. Каждый раз, когда метрика настраивается, сокращения могут быть эффективно применены в сохраненном порядке с использованием настраиваемой метрики.[2] Кроме того, в зависимости от новых весов ребер может потребоваться пересчет некоторых сокращений.[3] Чтобы это сработало, порядок сжатия должен быть вычислен с использованием независимых от метрики вложенных разрезов.[1]

Расширения и приложения

Каналы CH, как описано выше, ищут кратчайший путь от одного начального узла до одного целевого узла. Это называется один к одному кратчайший путь и используется, например, в автомобильных навигационных системах. Другие приложения включают сопоставление GPS следы до участков дороги и ускорение симуляторы дорожного движения которые должны учитывать вероятные маршруты, используемые всеми драйверами в сети. В прогноз маршрута кто-то пытается оценить, куда, вероятно, направится транспортное средство, вычисляя, насколько хорошо его текущее и прошлое положения совпадают с кратчайшим путем от начальной точки до любой возможной цели. Это может быть эффективно сделано с использованием каналов CH.[2]

В один ко многим сценарии, начальный узел и набор целевых узлов даны и расстояние для всех должен быть вычислен. Самым популярным приложением для запросов типа "один ко многим" является поиск по интересующим объектам. Типичные примеры включают поиск ближайшей заправочной станции, ресторана или почтового отделения, используя фактическое время в пути, а не географическое расстояние как метрика.[2]

в многие-ко-многим сценарий кратчайшего пути, набор начальных узлов и набор целевых узлов даны и расстояние для всех должен быть вычислен. Это используется, например, в логистических приложениях.[2] Каналы CH могут быть расширены на запросы "многие ко многим" следующим образом: сначала выполните поиск в обратном направлении вверх от каждого . Для каждой вершины сканированные во время этого поиска, хранится в ведре . Затем выполняется прямой поиск вверх от каждого , проверяя для каждого непустого ведра, улучшает ли маршрут по соответствующей вершине какое-либо наилучшее расстояние. То есть, если для любого .[2][3]

Некоторые приложения даже требуют один ко всем вычислений, т.е. нахождение расстояний от исходной вершины ко всем остальным вершинам графа. Поскольку алгоритм Дейкстры обращается к каждому ребру ровно один раз и, следовательно, работает за линейное время, он теоретически оптимален. Однако алгоритм Дейкстры трудно распараллеливать и не оптимальный кэш из-за плохого расположения. Каналы CH могут использоваться для более оптимального кэширования реализации. Для этого прямой поиск вверх от с последующим сканированием вниз по всем узлам в графе, обогащенном ярлыками. Последующая операция сканирует память линейным образом, поскольку узлы обрабатываются в порядке убывания важности и, следовательно, могут быть помещены в память соответствующим образом.[14] Обратите внимание, что это возможно, потому что порядок, в котором узлы обрабатываются на втором этапе, не зависит от исходного узла. .[2]

В процессе производства автомобильные навигационные системы должны иметь возможность рассчитывать самые быстрые маршруты движения с использованием прогнозируемой информации о дорожном движении и отображать альтернативные маршруты. И то, и другое можно сделать с помощью каналов CH.[2] Первый из них называется маршрутизацией с зависящими от времени сетями, где время прохождения заданного края больше не является постоянным, а скорее зависит от времени суток при входе в край. Альтернативные маршруты должны быть гладкими, значительно отличаться от кратчайших, но не намного длиннее.[2]

CH можно расширить для одновременной оптимизации нескольких показателей; это называется многокритериальный планирование маршрута. Например, можно минимизировать как стоимость поездки, так и время. Другой пример: электрические транспортные средства для которых доступный заряд батареи ограничивает допустимые маршруты, так как батарея не может разряжаться.[2]

Рекомендации

  1. ^ а б c d Диббельт, Джулиан; Штрассер, Бен; Вагнер, Доротея (5 апреля 2016 г.). «Настраиваемые иерархии сжатия». Журнал экспериментальной алгоритмики. 21 (1): 1–49. arXiv:1402.0402. Дои:10.1145/2886843.
  2. ^ а б c d е ж грамм час я j k л м п о п q р Баст, Ханна; Деллинг, Дэниел; Гольдберг, Эндрю В .; Мюллер-Ханнеманн, Маттиас; Пайор, Томас; Сандерс, Питер; Вагнер, Доротея; Вернек, Ренато Ф. (2016). «Планирование маршрутов в транспортных сетях». Разработка алгоритмов. Конспект лекций по информатике. 9220: 19–80. arXiv:1504.05140. Дои:10.1007/978-3-319-49487-6_2. ISBN  978-3-319-49486-9.
  3. ^ а б c d е ж грамм час Гейсбергер, Роберт; Сандерс, Питер; Шультес, Доминик; Веттер, Кристиан (2012). «Точная маршрутизация в больших дорожных сетях с использованием иерархий сокращения». Транспортная наука. 46 (3): 388–404. Дои:10.1287 / trsc.1110.0401.
  4. ^ Деллинг, Дэниел; Сандерс, Питер; Шультес, Доминик; Вагнер, Доротея (2009). «Алгоритмы проектирования инженерных маршрутов». Алгоритмика больших и сложных сетей. Конспект лекций по информатике. 5515: 117–139. Дои:10.1007/978-3-642-02094-0_7. ISBN  978-3-642-02093-3.
  5. ^ «OSRM - машина маршрутизации с открытым исходным кодом».
  6. ^ «Вики - OpenTripPlanner».
  7. ^ «Веб - GraphHopper».
  8. ^ «GitHub - Темпус».
  9. ^ «GitHub - RoutingKit».
  10. ^ Бауэр, Рейнхард; Деллинг, Дэниел; Сандерс, Питер; Шифердекер, Деннис; Шультес, Доминик; Вагнер, Доротея (01.03.2010). «Сочетание иерархических и целенаправленных методов ускорения для алгоритма Дейкстры». Журнал экспериментальной алгоритмики. 15: 2.1. Дои:10.1145/1671970.1671976. ISSN  1084-6654.
  11. ^ Гейсбергер, Роберт; Сандерс, Питер; Шультес, Доминик; Деллинг, Дэниел (2008). МакГеоч, Кэтрин С. (ред.). «Сужение иерархии: более быстрая и простая иерархическая маршрутизация в дорожных сетях». Экспериментальные алгоритмы. Конспект лекций по информатике. Springer Berlin Heidelberg. 5038: 319–333. Дои:10.1007/978-3-540-68552-4_24. ISBN  9783540685524.
  12. ^ Бауэр, Рейнхард; Колумб, Тобиас; Раттер, Игнац; Вагнер, Доротея (13 сентября 2016). "Размер пространства поиска в иерархиях сокращения". Теоретическая информатика. 645: 112–127. Дои:10.1016 / j.tcs.2016.07.003. ISSN  0304-3975.
  13. ^ Деллинг, Дэниел; Гольдберг, Эндрю В .; Разенштейн, Илья; Вернек, Ренато Ф. (май 2011 г.). «Разбиение графа с естественными разрезами». (: unav): 1135–1146. CiteSeerX  10.1.1.385.1580. Дои:10.1109 / ipdps.2011.108. ISBN  978-1-61284-372-8.
  14. ^ Деллинг, Дэниел; Гольдберг, Эндрю В .; Новацик, Андреас; Вернек, Ренато Ф. (2011). "PHAST: деревья кратчайшего пути с аппаратным ускорением". Симпозиум по параллельной и распределенной обработке (IPDPS), 2011 IEEE International: 921–931. Дои:10.1109 / ipdps.2011.89. ISBN  978-1-61284-372-8.

внешняя ссылка

Реализации с открытым исходным кодом