IBM Parallel Sysplex - IBM Parallel Sysplex

В вычислениях Параллельный сисплекс это кластер из Мэйнфреймы IBM действуя вместе как единый образ системы с z / OS. Parallel Sysplex, используемый для аварийного восстановления, сочетает в себе совместное использование данных и параллельные вычисления чтобы позволить кластеру из 32 систем разделять рабочую нагрузку для высокая производительность и высокая доступность.

Sysplex

В 1990 г. IBM мэйнфреймы представил концепцию Системный комплекс, обычно называемый Sysplex, с MVS / ESA SPV4.1. Это позволяет использовать авторизованные компоненты до восьми логические разделы (LPAR) для связи и взаимодействия друг с другом с помощью XCF протокол.

Компоненты Sysplex включают:

Общий источник времени для синхронизации часов всех систем-участников. Это может включать в себя таймер Sysplex (модель 9037) или протокол времени сервера (STP).
Глобальная сериализация ресурсов (GRS), который позволяет нескольким системам одновременно обращаться к одним и тем же ресурсам, сериализуя, где это необходимо, для обеспечения монопольного доступа
Механизм межсистемного соединения (XCF ), что позволяет системам обмениваться данными пиринговый
Парные наборы данных (CDS)

В число пользователей (базового) Sysplex входят:

Консольные сервисы - позволяют объединить несколько консолей MCS из разных членов Sysplex, обеспечивая единый образ системы для операций
Automatic Restart Manager (ARM) - политика для прямого автоматического перезапуска неудачных заданий или запущенных задач в той же системе, если она доступна, или в другом LPAR в Sysplex
Sysplex Failure Manager (SFM) - Политика, которая определяет автоматические действия, которые необходимо предпринять при возникновении определенных сбоев, таких как потеря члена Sysplex или при перенастройке систем.
Диспетчер рабочей нагрузки (WLM) - Управление производительностью разнородных рабочих нагрузок на основе политик в одном или нескольких образах z / OS или даже в AIX
Глобальная сериализация ресурсов (GRS) - Связь - позволяет использовать ссылки XCF вместо выделенных каналов для GRS и динамических RNL.
Tivoli OPC - поддержка горячего резервирования для контроллера
RACF (Программный продукт IBM для обеспечения безопасности мэйнфреймов) - общесистемные команды RVARY и SETROPTS
Обмен файлами PDSE
Мультисистема VLFNOTE, SDUMP, SLIP, DAE
Средство измерения ресурсов (RMF) - Отчетность в масштабе всей системы
CICS - использует XCF для обеспечения лучшей производительности и времени отклика, чем использование VTAM для маршрутизации транзакций и доставки функций.
zFS - Использование связи XCF для доступа к данным через несколько LPAR

Параллельный сисплекс

Схематическое изображение параллельного сисплекса

Параллельный сисплекс был представлен с добавлением Сцепное устройство (CF) с соединительными звеньями для высокоскоростной связи, с поддержкой операционной системы MVS / ESA V5.1, вместе с моделями мэйнфреймов в апреле 1994 года.^[1]

Средство связи (CF) может находиться на выделенном автономном сервере, сконфигурированном с процессорами, которые могут запускать управляющий код средства связи (CFCC), в качестве интегральных процессоров на самих мэйнфреймах, настроенных как ICF (внутренние средства связи), или, реже, как обычные LPAR. CF содержит структуры Lock, List и Cache для помощи в сериализации, передаче сообщений и согласованности буфера между несколькими LPAR.^[2]

Основная цель Parallel Sysplex - предоставить возможности совместного использования данных, позволяя нескольким базам данных выполнять прямое чтение и запись в совместно используемые данные. Это может дать преимущества

Помогите устранить единые точки отказа в сервере, LPAR или подсистемах
Доступность приложения
Единый образ системы
Динамическая балансировка сеанса
Динамическая маршрутизация транзакций
Масштабируемая емкость

Базы данных, работающие на сервере System z, которые могут воспользоваться этим, включают:

DB2
Система управления информацией IBM (IMS).
VSAM (VSARM / RLS)
IDMS
Адабас
DataCom
Oracle

Другие компоненты могут использовать средство сопряжения, чтобы помочь с управлением системой, производительностью или снижением требований к оборудованию. Называется «Совместное использование ресурсов» и использует:

Каталог - общие каталоги для повышения производительности за счет сокращения операций ввода-вывода для набора данных каталога на диске.
CICS - Использование CF для предоставления возможностей совместного использования и восстановления для именованных счетчиков, таблиц данных или переходных данных
DFSMShsm - балансировка рабочей нагрузки для рабочей нагрузки миграции данных
GRS Star - снижение производительности ЦП и времени отклика при выделении набора данных.

Tape Switching использует структуру GRS для обеспечения совместного использования ленточных накопителей между образами z / OS.

Динамическое управление CHPID (DCM) и управление приоритетами ввода-вывода
Контрольная точка JES2 - обеспечивает улучшенный доступ к мультисистемной контрольной точке.
Operlog / Logrec - Объединенные мультисистемные журналы для управления системой
RACF - общий набор данных для упрощения управления безопасностью в Parallel Sysplex
WebSphere MQ - общие очереди сообщений для обеспечения доступности и гибкости
WLM - обеспечивает поддержку Intelligent Resource Director (IRD) для расширения z / OS Workload Manager, помогая управлять ресурсами ЦП и ввода-вывода в нескольких разделах LPAR в Parallel Sysplex. Функции включают управление процессором LPAR, IRD.

Многосистемное управление анклавом для повышения производительности

XCF Star - снижение требований к оборудованию и упрощенное управление трактами связи XCF

Основные компоненты Parallel Sysplex включают:

Сцепное устройство (CF или ICF) оборудование, позволяющее нескольким процессорам совместно использовать, кэшировать, обновлять и балансировать доступ к данным;
Таймеры Sysplex или протокол серверного времени для синхронизации часов всех систем-членов;
Высокая скорость, высокое качество, резервирование кабелей;
Программного обеспечения (Операционная система услуги и, как правило, промежуточное ПО Такие как DB2 ).

Средство связи может быть либо выделенной внешней системой (небольшой мэйнфрейм, например Система z9 BC, специально сконфигурированный только с процессорами связи) или встроенные процессоры на самих мэйнфреймах, сконфигурированные как ICF (внутренние средства связи).^[3] Рекомендуется использовать хотя бы один внешний CF в параллельном сисплексе.^[4] Рекомендуется, чтобы Parallel Sysplex имел по крайней мере два CF и / или ICF для избыточности, особенно в среде совместного использования производственных данных. Протокол времени сервера (STP) заменил таймеры Sysplex начиная с 2005 г. для моделей мэйнфреймов System z z990 и новее.^[5] Таймер Sysplex - это физически отдельная часть оборудования от мэйнфрейма,^[6] тогда как STP является неотъемлемой частью микрокода мэйнфрейма.^[7]С помощью STP и ICF можно построить полную установку Parallel Sysplex с двумя подключенными мэйнфреймами. Более того, один мэйнфрейм может содержать внутренний эквивалент полного физического Parallel Sysplex, полезного для тестирования и разработки приложений.^[8]

Журнал IBM Systems Journal посвятил полный выпуск всем технологическим компонентам.^[9]

Серверный протокол времени

В компьютерных системах важно поддерживать точное время. Например, в системе обработки транзакций процесс восстановления восстанавливает данные транзакции из файлов журнала. Если для регистрации данных транзакции используются отметки времени, а отметки времени двух связанных транзакций переносятся из фактической последовательности, то восстановление базы данных транзакций может не соответствовать состоянию до процесса восстановления. Серверный протокол времени (STP) может использоваться для предоставления единого источника времени между несколькими серверами. Основываясь на концепции протокола сетевого времени, один из серверов System z назначается HMC в качестве основного источника времени (Stratum 1). Затем он отправляет временные сигналы на серверы Stratum 2 с помощью соединительных каналов. Серверы Stratum 2, в свою очередь, отправляют временные сигналы серверам Stratum 3. Чтобы обеспечить доступность, один из серверов может быть назначен в качестве источника времени резервного копирования, а третий сервер может быть назначен в качестве арбитра, чтобы помочь Резервному серверу времени определить, следует ли ему выполнять роль основного во время исключительных ситуаций.

STP доступен на серверах System z с 2005 года.

Дополнительная информация о STP доступна в «Руководстве по планированию протокола времени сервера».^[10]

Географически распределенный параллельный сисплекс

Географически распределенный параллельный сисплекс (GDPS) является расширением Parallel Sysplex мэйнфреймов, потенциально расположенных в разных городах. GDPS включает конфигурации для одного или нескольких сайтов:^[11]

GDPS HyperSwap Manager: основан на синхронном Одноранговое удаленное копирование (PPRC) для использования в едином центре обработки данных. Данные копируются с основного запоминающего устройства на вспомогательное запоминающее устройство. В случае отказа основного устройства хранения система автоматически делает вторичное устройство хранения основным, обычно без прерывания работы приложений.
GDPS Metro: он основан на технологии синхронного зеркалирования данных (PPRC), которая может использоваться на мэйнфреймах на расстоянии 200 километров (120 миль) друг от друга. В двухсистемной модели оба сайта можно администрировать, как если бы они были одной системой. В случае отказа системы или устройства хранения восстановление может происходить автоматически с ограниченной потерей данных или без нее.
GDPS Global - XRC: основан на асинхронном Расширенная удаленная копия (XRC) без ограничений по расстоянию. XRC копирует данные на устройствах хранения между двумя сайтами, так что в случае сбоя может быть потеряно всего несколько секунд данных. Если сбой все же происходит, пользователь должен инициировать процесс восстановления. После запуска процесс восстановления с вторичных запоминающих устройств и реконфигурации систем происходит автоматически.
GDPS Global - GM: основан на асинхронном IBM Global Mirror техника без ограничений по расстоянию. Он предназначен для восстановления после полного отказа на одном сайте. Он активирует вторичные устройства хранения и системы резервного копирования.
GDPS Metro Global - GM: это конфигурация для систем с более чем двумя системами / площадками для аварийного восстановления. Он основан на GDPS Metro совместно с GDPS Global - GM.
GDPS Metro Global - XRC: это конфигурация для систем с более чем двумя системами / площадками для аварийного восстановления. Он основан на GDPS Metro совместно с GDPS Global - XRC.
GDPS Continuous Availability: это решение для аварийного восстановления / непрерывной доступности, основанное на двух или более сайтах, разделенных неограниченным расстоянием, работающих с одними и теми же приложениями и имеющими одни и те же данные для обеспечения межсайтовой балансировки рабочей нагрузки. IBM Multi-site Workload Lifeline, благодаря своему мониторингу и маршрутизации рабочих нагрузок, играет важную роль в решении GDPS Continuous Availability.

Смотрите также

внешняя ссылка

[1] Система / 390 Parallel Sysplex Performance (PDF) (Четвертое изд.). Международная корпорация бизнес-машин. Декабрь 1998. SG24-4356-03. Архивировано из оригинал (PDF) на 2011-05-18. Получено 2007-09-17.

[2] Дэвид Рафтен (ноябрь 2019 г.). «Варианты конфигурации устройства сопряжения». IBM. Цитировать журнал требует | журнал = (помощь)

[3] «Определение средства сцепления». PC Magazine.com. Получено 13 апреля, 2009.

[4] «Сцепное средство» (PDF). Получено 13 апреля, 2009.

[5] «Переход с таймера Sysplex на STP». IBM. Получено 15 апреля, 2009.

[6] «Таймер Sysplex». Симметричный. Получено 15 апреля, 2009.

[7] "Протокол времени сервера IBM (STP)". IBM. Получено 15 апреля, 2009.

[8] Джонсон, Джон Э. "Учебный курс MVS: IBM Health Checker". z / Журнал. Получено 15 апреля, 2009.^{[постоянная мертвая ссылка ]}

[9] "Системный журнал IBM о параллельных кластерах Sysplex S / 390". Получено 24 апреля 2017.

[10] Руководство по планированию протокола времени сервера (PDF). Красные книги (Четвертое изд.). Международная корпорация бизнес-машин. Июнь 2013 г. SG24-7280-03.

[11] Ахмад, Риаз (5 марта 2009 г.). Обновление и внедрение GDPS 3.6. Остин, Техас: ПОДЕЛИТЬСЯ. Получено 17 апреля, 2009.^{[постоянная мертвая ссылка ]}

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]