Параллельная база данных - Parallel database

А параллельно база данных система стремится повысить производительность за счет распараллеливание различных операций, таких как загрузка данных, построение индексов и оценка запросов.[1] Хотя данные могут храниться распределенным образом, распределение регулируется исключительно соображениями производительности. Параллельные базы данных улучшают обработку и ввод, вывод скорости за счет использования нескольких Процессоры и диски параллельно. Централизованные и клиент – сервер системы баз данных недостаточно мощны для обработки таких приложений. При параллельной обработке многие операции выполняются одновременно, в отличие от последовательной обработки, при которой этапы вычислений выполняются последовательно. Параллельные базы данных можно условно разделить на две группы, первая группа архитектуры - это многопроцессорная архитектура, альтернативы которой следующие:

Общая архитектура памяти
Где несколько процессоры поделиться основная память (RAM) пространство, но у каждого процессора есть свой диск (HDD). Если несколько процессов выполняются одновременно, скорость снижается, как и у компьютера, когда выполняется много параллельных задач и компьютер замедляется.
Общая дисковая архитектура
Если каждый узел имеет свою собственную основную память, но все узлы совместно используют массовое хранилище, обычно сеть хранения данных. На практике каждый узел обычно также имеет несколько процессоров.
Общая архитектура
Где каждый узел имеет собственное запоминающее устройство, а также основную память.

Другая группа архитектуры называется гибридной архитектурой и включает:

  • Неоднородная архитектура памяти (NUMA), которая включает неравномерный доступ к памяти.
  • Кластер (ничего общего + общий диск: SAN / NAS), который образован группой подключенных компьютеров.

в этом случае коммутаторы или концентраторы используются для соединения разных компьютеров самым дешевым способом, а самый простой способ - используются только простые топологии для соединения разных компьютеров. намного умнее, если переключатели реализованы.

Типы параллелизма

  • Параллелизм запросов[2]
  • Независимый параллелизм - Выполнение каждой операции индивидуально на разных процессорах, только если они могут выполняться независимо друг от друга. Например, если нам нужно объединить четыре таблицы, то две могут быть объединены на одном процессоре, а две другие могут быть объединены на другом процессоре. Окончательное соединение может быть выполнено позже.
  • Параллельность трубопроводов - Выполнение различных операций в трубе. Например, если нам нужно объединить три таблицы, один процессор может объединить две таблицы и отправить записи набора результатов по мере их создания другому процессору. В другом процессоре третья таблица может быть объединена с входящими записями и может быть получен окончательный результат.
  • Внутриоперационный параллелизм - Выполнение отдельных сложных или больших операций параллельно на нескольких процессорах. Например, предложение ORDER BY запроса, которое пытается выполнить для миллионов записей, может быть распараллелено на нескольких процессорах.

Рекомендации

  1. ^ Девитт, Дэвид; Грей, Джим (1992). «Параллельные системы баз данных: будущее высокопроизводительных систем баз данных» (PDF). Коммуникации ACM. 35 (6): 85. CiteSeerX  10.1.1.119.8427. Дои:10.1145/129888.129894.
  2. ^ Кандасами, Сараванакумар. "Параллельная база данных - Параллелизм внутри запроса - Расширенная система управления базами данных". Blogger. Получено 10 сентября, 2017.