Конгруэнтный генератор с перестановками - Permuted congruential generator

А переставленный конгруэнтный генератор (PCG) это генерация псевдослучайных чисел алгоритм разработан в 2014 г. перестановка функция для улучшения статистических свойств модуля 2п линейный конгруэнтный генератор. Он обеспечивает отличные статистические характеристики[1][2][3][4] с небольшим и быстрым кодом и небольшим размером состояния.[5]

ГКГ отличается от классического линейного конгруэнтного генератора тремя способами:

  • модуль и состояние LCG больше, обычно в два раза больше желаемого выхода,
  • он использует мощность-2 модуля, что приводит к особенно эффективной реализации с генератором полного периода и несмещенными выходными битами, и
  • состояние не выводится напрямую, а наиболее значимые биты состояния используются для выбора побитовое вращение или сдвиг, который применяется к состоянию для получения вывода.

Это переменное вращение, которое устраняет проблему короткого периода в младших битах, от которой страдают группы LCG с степенью двойки.[5]:31–34

Варианты

Семейство PCG включает несколько вариантов. Ядро LCG определено для ширины от 8 до 128 бит, хотя для практического использования рекомендуются только 64 и 128 бит; меньшие размеры предназначены для статистических испытаний методики.

Аддитивная константа в LCG может варьироваться для получения различных потоков. Константа - произвольное нечетное целое число,[6] поэтому его не нужно хранить явно; то адрес самой переменной состояния (с установленным младшим битом).

Определено несколько различных выходных преобразований. Все работают хорошо, но у некоторых есть больший запас, чем у других.[5]:39 Они состоят из следующих компонентов:

  • RR: случайное (зависящее от ввода) чередование с выходом, равным половине размера ввода. Учитывая 2б-битовое входное слово, верхнее б-1 бит используется для количества поворота, следующие по значимости 2б−1 биты повернуты вправо и используются как выход, а младшие 2б−1+1−б биты отбрасываются.
  • RS: случайный (зависящий от ввода) сдвиг для случаев, когда ротация обходится дороже. Опять же, размер вывода составляет половину размера ввода. Начиная с 2б-битовое входное слово, верхнее б−3 бита используются для величины сдвига, которая применяется к следующим по значимости 2б−1+2б−3−1 бит, а младшие 2б−1 выводятся биты результата. Низкий 2б−1−2б−3б+4 бита отбрасываются.
  • XSH: An xorshift операция x ^ = x >> константа. Константа выбирается равной половине битов, не отбрасываемых следующей операцией (округляется в меньшую сторону).
  • XSL: упрощенная версия xorshift, складывающая значение пополам с помощью операции XOR, объединяющей высокую половину с низкой. Сложенное значение используется для последующих вращений.
  • RXS: сдвиг xorshift на случайную (зависящую от ввода) величину.
  • М: умножить на фиксированную константу.

Они объединены в следующие рекомендуемые выходные преобразования, показанные здесь в их наиболее распространенных размерах:

  • XSH-RR: xorshift смешивает некоторые старшие биты вниз, затем биты 63–59 выбирают величину поворота, которая будет применяться к битам 27–58.
    (64 → 32 бит) count = (int) (x >> 59); х ^ = х >> 18; return rotr32 ((uint32_t) (x >> 27), count);.
  • XSH-RS: аналогично, но меньшее количество битов определяет величину сдвига.
    (64 → 32 бит) count = (int) (x >> 61); х ^ = х >> 22; return (uint32_t) (x >> (29 - количество));.
  • XSL-RR: упрощенная версия XSH-RR, оптимизированная для 128-битных состояний, реализованных с использованием двух слов на 64-битных машинах.
    (128 → 64 бит) count = (int) (x >> 122); x64 = (uint64_t) (x ^ (x >> 64)); вернуть rotr64 (x64, count);
  • RXS-M-XS: самое медленное и самое сильное преобразование вывода при использовании для получения вывода половинного размера, оно становится самым слабым при использовании по назначению для получения вывода того же размера, что и состояние. Для использования, когда размер состояния должен быть ограничен 32 или 64 битами.
    (32 → 32 бит) count = (int) (x >> 28); х ^ = х >> (4 + счет); х * = 277803737u; вернуть x ^ (x >> 22);
    (64 → 64 бит) count = (int) (x >> 59); x ^ = x >> (5 + счетчик); х * = 12605985483714917081u; вернуть x ^ (x >> 43);
  • XSL-RR-RR: аналогично предыдущему, это превращает 128 бит состояния в 128 бит вывода, когда приложение требует этого.
    (128 → 128 бит) count = (int) (x >> 122); low64 = rotr64 ((uint64_t) (x ^ (x >> 64)), количество); high64 = rotr ((uint64_t) (x >> 64), low64 и 63); return (uint128_t) high64 << 64 | low64;

Каждый шаг этих выходных преобразований либо обратим (и, следовательно, один к одному ) или усечением, поэтому их сочинение сопоставляет одинаковое фиксированное количество входных состояний каждому выходному значению. Это сохраняет равнораспределение базовой LCG.

Наконец, если длина цикла больше 2128 требуется, генератор может быть расширенный с массивом под-генераторов. Один выбирается (поочередно) для добавления к выходу основного генератора, и каждый раз, когда состояние основного генератора достигает нуля, подгенераторы циклируются по схеме, которая обеспечивает экспоненту периода в общем размере состояния.

Пример кода

Генератор рекомендуется для большинства пользователей[5]:43 это PCG-XSH-RR с 64-битным состоянием и 32-битным выходом. Он может быть реализован как:

#включают <stdint.h>статический uint64_t       государственный      = 0x4d595df4d0f33173;		// Или что-то зависящее от семянстатический uint64_t const множитель = 6364136223846793005u;статический uint64_t const приращение  = 1442695040888963407u;	// Или произвольная нечетная константастатический uint32_t rotr32(uint32_t Икс, беззнаковый р){	возвращаться Икс >> р | Икс << (-р & 31);}uint32_t pcg32(пустота){	uint64_t Икс = государственный;	беззнаковый считать = (беззнаковый)(Икс >> 59);		// 59 = 64 - 5	государственный = Икс * множитель + приращение;	Икс ^= Икс >> 18;								// 18 = (64 - 27)/2	возвращаться rotr32((uint32_t)(Икс >> 27), считать);	// 27 = 32 - 5}пустота pcg32_init(uint64_t семя){	государственный = семя + приращение;	(пустота)pcg32();}

Генератор применяет выходное преобразование к исходный государство, а не окончательный состояние с целью увеличения доступного параллелизм на уровне инструкций для максимальной производительности на современных суперскалярные процессоры.[5]:43

Немного более быстрая версия исключает инкремент, уменьшая LCG до мультипликативного (Лемер -стилем) генератор с периодом всего 262, и использует более слабую функцию вывода XSH-RS:

статический uint64_t mcg_state = 0xcafef00dd15ea5e5u;	// Должно быть нечетнымuint32_t pcg32_fast(пустота){	uint64_t Икс = mcg_state;	беззнаковый считать = (беззнаковый)(Икс >> 61);	// 61 = 64 - 3	mcg_state = Икс * множитель;	Икс ^= Икс >> 22;	возвращаться (uint32_t)(Икс >> (22 + считать));	// 22 = 32 - 3 - 7}пустота pcg32_fast_init(uint64_t семя){	mcg_state = 2*семя + 1;	(пустота)pcg32_fast();}

Экономия времени минимальна, поскольку остается самая дорогая операция (64 × 64-битное умножение), поэтому предпочтительна обычная версия, за исключением в крайнем случае. Тем не менее, эта более быстрая версия также проходит статистические тесты.[4]

При выполнении на 32-разрядном процессоре 64 × 64-разрядное умножение должно быть реализовано с использованием трех операций 32 × 32 → 64-разрядного умножения. Чтобы уменьшить это число до двух, существуют 32-битные умножители, которые работают почти так же хорошо, как 64-битные, например 0xf13283ad.[6], 0xffffffff0e703b65 или 0xf2fc5985.

Сравнение с другими генераторами псевдослучайных чисел

PCG была разработана путем применения TestU01 к вариантам уменьшенного размера,[7] и определение минимального количества битов внутреннего состояния, необходимых для передачи BigCrush. BigCrush исследует достаточно данных, чтобы определить период 235, поэтому даже идеальному генератору требуется 36 бит состояния для его передачи. Некоторые очень плохие генераторы могут пройти, если им дано достаточно большое состояние;[8] прохождение несмотря на маленький Состояние является мерой качества алгоритма и показывает, насколько велик запас прочности между этим нижним пределом и размером состояния, используемым в практических приложениях.

PCG-RXS-M-XS (с 32-битным выходом) передает BigCrush с 36 битами состояния (минимально возможное), PCG-XSH-RR (pcg32 () выше) требуется 39, а PCG-XSH-RS (pcg32_fast () выше) требует 49 бит состояния. Для сравнения, xorshift *, одна из лучших альтернатив, требует 40 бит состояния,[5]:19 и Твистер Мерсенна не работает, несмотря на 19937 бит состояния.[9]

Прогнозирование и восстановление семян

Было показано, что практически возможно (с большим объемом вычислений) восстановить начальное число псевдослучайного генератора с учетом 512 последовательных выходных байтов.[10]. Это означает, что практически возможно предсказать оставшуюся часть псевдослучайного потока по 512 байтам.

Смотрите также

Рекомендации

  1. ^ Лемир, Даниэль (22 августа 2017 г.). «Тестирование некриптографических генераторов случайных чисел: мои результаты». Получено 2017-10-03.
  2. ^ Кук, Джон Д. (7 июля 2017 г.). «Тестирование генератора случайных чисел PCG». Получено 2017-10-03.
  3. ^ Кук, Джон Д. (14 августа 2017 г.). «Тестирование ГСЧ с PractRand». Получено 2017-10-03.
  4. ^ а б О'Нил, M.E. (29 июля 2017 г.). «PCG проходит PractRand». Получено 2017-11-03.
  5. ^ а б c d е ж О'Нил, Мелисса Э. (5 сентября 2014 г.). PCG: семейство простых быстрых, эффективных с точки зрения пространства, статистически хороших алгоритмов для генерации случайных чисел (PDF) (Технический отчет). Колледж Харви Мадда. HMC-CS-2014-0905.
  6. ^ а б О'Нил, M.E. (10 августа 2017 г.). «Критика потоков PCG (и SplitMix тоже)». Получено 2017-11-03.
  7. ^ О'Нил, M.E. (20 августа 2017 г.). «Визуализация сердца некоторых ГПСЧ». Получено 2017-11-03.
  8. ^ О'Нил, M.E. (20 августа 2017 г.). "Слишком большой, чтобы обанкротиться". Получено 2017-11-03.
  9. ^ Л'Экуайер, Пьер; Симард, Ричард (август 2007 г.). «TestU01: C-библиотека для эмпирического тестирования генераторов случайных чисел» (PDF). Транзакции ACM на математическом ПО. 33 (4): 22-1–22-40. CiteSeerX  10.1.1.499.2830. Дои:10.1145/1268776.1268777.
  10. ^ Буйлаге, Шарль; Мартинес, Флоретта; Соваж, Джулия (28 сентября 2020 г.). «Практическое восстановление начального числа для генератора псевдослучайных чисел PCG». Транзакции IACR по симметричной криптологии. 2020 (3): 175–196. Дои:10.13154 / tosc.v2020.i3.175-196.

внешняя ссылка