Стохастическая игра - Stochastic game

В теория игры, а стохастическая игра, представлен Ллойд Шепли в начале 1950-х гг. динамичная игра с участием вероятностные переходы играют один или несколько игроков. Игра проходит в несколько этапов. В начале каждого этапа игра проходит в штат. Игроки выбирают действия, и каждый игрок получает расплачиваться это зависит от текущего состояния и выбранных действий. Затем игра переходит в новое случайное состояние, распределение которого зависит от предыдущего состояния и действий, выбранных игроками. Процедура повторяется в новом состоянии, и игра продолжается конечное или бесконечное число этапов. Общий выигрыш для игрока часто принимается как дисконтированная сумма выплат на этапе или ограничивать низший средних этапов выигрышей.

Стохастические игры обобщают Марковские процессы принятия решений для нескольких взаимодействующих лиц, принимающих решения, а также от игр стратегической формы до динамических ситуаций, в которых среда изменяется в ответ на выбор игроков.[1]

Игры для двух игроков

Стохастические игры двух игроков на ориентированные графы широко используются для моделирования и анализа дискретных систем, работающих в неизвестной (состязательной) среде. Возможные конфигурации системы и ее окружения представлены в виде вершин, а переходы соответствуют действиям системы, ее окружения или «природы». Тогда запуск системы соответствует бесконечному пути в графе. Таким образом, систему и ее окружение можно рассматривать как двух игроков с антагонистическими целями, где один игрок (система) стремится максимизировать вероятность «хороших» запусков, а другой игрок (среда) стремится к противоположному.

Во многих случаях существует равновесное значение этой вероятности, но оптимальные стратегии для обоих игроков могут не существовать.

Мы вводим основные концепции и алгоритмические вопросы, изучаемые в этой области, и упоминаем некоторые давно существующие открытые проблемы. Затем мы упоминаем избранные недавние результаты.

Теория

Составляющими стохастической игры являются: конечный набор игроков ; пространство состояний (либо конечное множество, либо измеримое пространство ); для каждого игрока , набор действий (либо конечное множество, либо измеримое пространство ); вероятность перехода от , где это профили действий, чтобы , где вероятность того, что следующее состояние находится в учитывая текущее состояние и текущий профиль действия ; и функция выплаты от к , где -я координата , , это выигрыш для игрока как функция государства и профиль действия .

Игра начинается с некоторого начального состояния . На этапе , игроки сначала наблюдают , затем одновременно выберите действия , затем наблюдайте за профилем действия , а потом природа выбирает по вероятности . Игра в стохастическую игру, , определяет поток выплат , где .

Игра со скидкой с коэффициентом дисконтирования () - игра, в которой выплата игроку является . В -этапная игра - это игра, в которой игроку является .

Значение соответственно , стохастической игры двух лиц с нулевой суммой соответственно , с конечным числом состояний и действий существует, и Трумэн Бьюли и Илон Кольберг (1976) доказали, что сходится к пределу как уходит в бесконечность и это сходится к тому же пределу, что и идет в .

Игра без скидок это игра, в которой выигрыш для игрока является «пределом» средних значений этапов выигрыша. Некоторые меры предосторожности необходимы при определении ценности нулевой суммы для двух человек. и при определении равновесных выплат ненулевой суммы . Единая стоимость стохастической игры двух лиц с нулевой суммой существует, если для каждого есть положительное целое число и стратегическая пара игрока 1 и игрока 2, что для каждого и и каждый ожидание относительно вероятности игры, определяемой и по крайней мере , и ожидание относительно вероятности игры, определяемой и самое большее . Жан-Франсуа Мертенс и Авраам Нейман (1981) доказали, что любая стохастическая игра двух лиц с нулевой суммой и конечным числом состояний и действий имеет одинаковую ценность.

Если имеется конечное число игроков, а наборы действий и множество состояний конечны, то стохастическая игра с конечным числом этапов всегда имеет равновесие по Нэшу. То же самое верно и для игры с бесконечным числом этапов, если общий выигрыш равен сумме со скидкой.

Стохастическая игра с ненулевой суммой имеет равномерную равновесную выплату если для каждого есть положительное целое число и профиль стратегии таким образом, что за каждое одностороннее отклонение игрока , т.е. профиль стратегии с участием для всех , и каждый ожидание относительно вероятности игры, определяемой по крайней мере , и ожидание относительно вероятности игры, определяемой самое большее . Николя Вьей показал, что все стохастические игры двух лиц с конечными пространствами состояний и действий имеют равномерную равновесную выплату.

Стохастическая игра с ненулевой суммой имеет предельно-средний равновесный выигрыш если для каждого есть профиль стратегии так что за каждое одностороннее отклонение игрока , ожидание нижнего предела средних значений выигрышей на этапах относительно вероятности игр, определяемых по крайней мере , и ожидание превышения предела средних значений выигрышей на этапе относительно вероятности игр, определяемой самое большее . Жан-Франсуа Мертенс и Авраам Нейман (1981) доказывает, что каждая стохастическая игра двух лиц с нулевой суммой и конечным числом состояний и действий имеет предельное среднее значение, и Николя Вьей показал, что все стохастические игры двух лиц с конечными состояниями и пространствами действий имеют предельно-средний равновесный выигрыш. В частности, эти результаты подразумевают, что эти игры имеют ценность и приблизительный равновесный выигрыш, называемый равновесным выигрышем liminf-average (соответственно, limsup-average), когда общий выигрыш является пределом меньшего (или более высокого) предела. средние сценические выплаты.

Имеет ли каждая стохастическая игра с конечным числом игроков, состояний и действий однородный равновесный выигрыш, или предельно-средний равновесный выигрыш, или даже предельно-средний равновесный выигрыш, является сложным открытым вопросом.

А Марковское идеальное равновесие это уточнение концепции подигра идеальное равновесие по Нэшу к стохастическим играм.

Приложения

Стохастические игры имеют применение в экономика, эволюционная биология и компьютерные сети.[2][3] Они являются обобщениями повторяющиеся игры которые соответствуют частному случаю, когда есть только одно состояние.

Смотрите также

Заметки

  1. ^ Солан, Эйлон; Вьей, Николя (2015). «Стохастические игры». PNAS. 112 (45): 13743–13746. Дои:10.1073 / pnas.1513508112. ЧВК  4653174. PMID  26556883.
  2. ^ Ограниченные стохастические игры в беспроводных сетях Э.Альтман, К. Авратченков, Н. Бонно, М. Дебба, Р. Эль-Азузи, Д. С. Менаше
  3. ^ Джеиче, Буалем; Чукам, Ален; Тембине, Хамиду (27.09.2017). «Игры среднего поля в технике». AIMS Электроника и электротехника. 1: 18–73. arXiv:1605.03281. Дои:10.3934 / ElectrEng.2017.1.18. S2CID  16055840.

дальнейшее чтение

внешние ссылки