Око за око - Tit for tat

В западных бизнес-культурах рукопожатие встреча с кем-то - это сигнал о начальном сотрудничестве.

Око за око английская поговорка, означающая "эквивалент возмездие Он развился из «наконечника для метчика», впервые использованного в 1558 году.[1]

Это также очень эффективный стратегия в теория игры. An агент использование этой стратегии сначала будет сотрудничать, а затем повторить предыдущее действие противника. Если противник ранее был кооперативным, агент действует. Если нет, то агента нет.

Теория игры

«Око за око» очень успешно использовалось в качестве стратегии для повторяющихся Дилемма заключенного. Стратегия была впервые представлена Анатолий Рапопорт в Роберт Аксельрод два турнира,[2] проводился около 1980 года. Примечательно, что (в обоих случаях) это была и самая простая стратегия, и самая успешная в условиях прямой конкуренции.

Агент, использующий эту стратегию, сначала будет сотрудничать, а затем повторить предыдущее действие противника. Если противник ранее был кооперативным, агент действует. Если нет, то агента нет. Это похоже на взаимный альтруизм в биологии.

Подразумеваемое

Успех стратегии «око за око», которая во многом основывается на сотрудничестве, несмотря на то, что ее название подчеркивает состязательный характер, многих застал врасплох. В сравнении со стратегиями, разработанными различными командами, он выиграл в двух соревнованиях. После первого соревнования новые стратегии, разработанные специально для борьбы с «око за око», потерпели неудачу из-за их негативного взаимодействия друг с другом; Успешная стратегия, отличная от «око за око», должна была быть сформулирована с учетом как «око за око», так и самой себя.

Этот результат может дать представление о том, как группы животных (и особенно человеческие сообщества) стали жить в преимущественно (или полностью) кооперативных обществах, а не в индивидуалистических »красный в зубах и когтях "способ, которого можно ожидать от лиц, занимающихся Гоббсовский состояние природы. Это, и особенно его применение к человеческому обществу и политике, является предметом Роберт Аксельрод книга Эволюция сотрудничества.

Более того, стратегия «око за око» оказалась полезной для социальных психологов и социологов при изучении эффективных методов уменьшения конфликтов. Исследования показали, что когда люди, которые участвовали в соревновании в течение определенного периода времени, больше не доверяют друг другу, наиболее эффективным средством предотвращения конкуренции является использование стратегии «око за око». Люди обычно участвуют в поведенческой ассимиляции, процессе, в котором они стремятся сопоставить свое собственное поведение с тем, что демонстрируют сотрудничающие или конкурирующие члены группы. Следовательно, если стратегия «око за око» начинается с сотрудничества, затем следует сотрудничество. С другой стороны, если другая сторона конкурирует, то стратегия «око за око» приведет к соревнованию и альтернативная сторона. В конце концов, каждое действие другого участника встречает соответствующий ответ, соперничество - конкуренцию, а сотрудничество - сотрудничество.

В случае разрешения конфликта стратегия «око за око» эффективна по нескольким причинам: метод признан как Чисто, отлично, провокационный, и прощающий. Во-первых, это Чисто и узнаваемая стратегия. Те, кто его использует, быстро распознают непредвиденные обстоятельства и соответствующим образом корректируют свое поведение. Более того, считается отлично поскольку это начинается с сотрудничества и только дефекты в последующем конкурентном движении. Стратегия также провокационный потому что он обеспечивает немедленное возмездие тем, кто соревнуется. Наконец, это прощающий поскольку он немедленно приводит к сотрудничеству, если конкурент сделает шаг к сотрудничеству.

Последствия стратегии «око за око» имеют отношение к исследованию конфликтов, их разрешению и многим аспектам прикладной социальной науки.[3]

Математика

Возьмем, к примеру, следующую бесконечно повторяющуюся игру-дилемму заключенного:

CD
C6, 62, 9
D9, 23, 3

Стратегия «Око за око» копирует то, что ранее выбрал другой игрок. Если игроки сотрудничают посредством игровой стратегии (C, C), они сотрудничают навсегда.

1234...
p1CCCC...
p2CCCC...

Сотрудничество дает следующий результат (где коэффициент дисконтирования):

а геометрическая серия подводя итог

Если игрок уклоняется от отказа (D), то в следующем раунде он наказывается. Чередуйте исходы, когда p1 сотрудничает, а p2 отклоняется, и наоборот.

1234...
p1CDCD...
p2DCDC...

Отклонение дает следующий выигрыш:

сумма двух геометрических рядов, которая составляет

Ожидайте сотрудничества, если вознаграждение за отклонение не лучше сотрудничества.

Продолжайте сотрудничество, если,

Продолжайте дезертировать, если,

Проблемы

Хотя Аксельрод эмпирически показал, что стратегия является оптимальной в некоторых случаях прямой конкуренции, два агента, играющие око за око, остаются уязвимыми. Одноразовая однобитовая ошибка в интерпретации событий любым игроком может привести к бесконечной «смертельной спирали»: если один агент отказывает, а противник сотрудничает, то оба агента в конечном итоге будут попеременно сотрудничать и отказываться, что дает меньший выигрыш, чем если оба агента будут постоянно сотрудничать. Такая ситуация часто возникает в конфликтах реального мира, начиная от школьных драк до гражданских и региональных войн. Причина этих проблем в том, что око за око не подигра идеальное равновесие, за исключением критических условий на учетная ставка.[4]Хотя в эту подигру нельзя напрямую попасть для двух агентов, играющих в стратегию «око за око», стратегия должна быть равновесие по Нэшу во всех под-играх, чтобы быть безупречным. Кроме того, эта вспомогательная игра может быть достигнута, если в сигнализации агентов разрешен какой-либо шум. Совершенный вариант подигры «око за око», известный как «сокрушение око за око», может быть создан с использованием базового механизма репутации.[5]

Острие ножа - это «равновесие, которое существует только для точных значений экзогенных переменных. Если вы измените переменные хотя бы малейшим образом, равновесие на краю ножа исчезнет».[6]

Может быть как равновесием по Нэшу, так и острым равновесием. Известно как острие равновесия, потому что равновесие "ненадежно опирается" на точное значение.

Пример:

ОставилиПравильно
Вверх(Х, Х)(0, 0)
Вниз(0, 0)(-X, -X)

Предположим, X = 0. Нет никаких выгодных отклонений от (Вниз, Влево) или от (Вверх, Вправо). Однако, если значение X отклоняется на любую величину, независимо от того, насколько оно мало, равновесие больше не сохраняется. Отклонение вверх становится выгодным, например, если X имеет значение 0,000001 вместо 0. Таким образом, равновесие очень ненадежно. При использовании в статье Википедии «крайние условия» относятся к тому факту, что очень редко, только когда выполняется определенное условие и, например, X равен определенному значению, достигается равновесие.

«Око за два зуба» можно было бы использовать для смягчения этой проблемы; см. описание ниже.[7] «Око за око с прощением» - это похожая попытка избежать смертельной спирали. Когда оппонент отступает, игрок, использующий эту стратегию, все равно будет сотрудничать при следующем ходу. Точная вероятность того, что игрок ответит сотрудничеством, зависит от состава противников.

Кроме того, стратегия «око за око» не является оптимальной в ситуациях, когда отсутствует полная конкуренция. Например, когда стороны являются друзьями, для дружбы может быть лучше, когда игрок сотрудничает на каждом шагу, несмотря на случайные отклонения со стороны другого игрока. Большинство ситуаций в реальном мире менее конкурентны, чем полное соревнование, в котором стратегия «око за око» победила.

Око за око сильно отличается от мрачный спусковой крючок в том смысле, что он снисходителен по своей природе, поскольку немедленно приводит к сотрудничеству, если конкурент решает сотрудничать. Мрачный триггер, с другой стороны, является самой неумолимой стратегией, в том смысле, что даже один дефект заставит игрока играть с мрачным триггером до конца игры.[8]

Синица за две татуировки

Око за два зуба похоже на око за око, но позволяет противнику дважды отказаться от согласованной стратегии, прежде чем игрок нанесет ответный удар. Этот аспект заставляет игрока, использующего стратегию «око за око», казаться более «снисходительным» к противнику.

В стратегии «око за око», как только оппонент отступает, игрок «око за око» немедленно реагирует отказом на следующем ходу. К сожалению, это приводит к тому, что две ответные стратегии постоянно переходят друг в друга, что приводит к плохому исходу для обоих игроков. Игрок «око за два ока» позволит первому побегу остаться незамеченным как средство избежать «смертельной спирали» из предыдущего примера. Если противник отказывает в два раза подряд, игрок «око за двое» ответит отказом.

Эта стратегия была предложена Роберт Аксельрод во время второго раунда компьютерного моделирования в RAND. Проанализировав результаты первого эксперимента, он определил, что если бы участник выбрал стратегию «око за два око», он получил бы более высокий совокупный балл, чем любая другая программа. В результате он сам с большими ожиданиями вступил в него во втором турнире. К сожалению, из-за более агрессивного характера программ, представленных во втором раунде, которые смогли воспользоваться его весьма щадящим характером, «око за око» показало значительно худшие результаты (в смысле теории игр), чем «око за око».[9]

Использование в реальном мире

Одноранговый обмен файлами

BitTorrent одноранговые узлы используют стратегию «око за око» для оптимизации скорости загрузки.[10] В частности, большинство одноранговых узлов BitTorrent используют вариант Tit for two Tats, который называется регулярное снятие удушья в терминологии BitTorrent. Одноранговые узлы BitTorrent имеют ограниченное количество слотов для загрузки, которые можно выделить другим одноранговым узлам. Следовательно, когда пропускная способность загрузки у однорангового узла переполнена, он будет использовать стратегию «око за око». Сотрудничество достигается, когда пропускная способность загрузки заменяется пропускной способностью загрузки. Следовательно, когда одноранговый узел не выполняет загрузку в ответ на загрузку нашего собственного однорангового узла, программа BitTorrent будет удушение соединение с отказывающимся от сотрудничества одноранговым узлом и выделите этот слот для загрузки более сотрудничающему одноранговому узлу. Регулярное снятие удушья соотносится с тем, что всегда нужно сотрудничать при решении дилеммы заключенного. Периодически одноранговый узел будет выделять слот загрузки случайно выбранному не сотрудничающему одноранговому узлу (отпугивать). Это называется оптимистичный отказ. Такое поведение позволяет искать больше сотрудничающих одноранговых узлов и дает второй шанс ранее не взаимодействующим одноранговым узлам. Оптимальные пороговые значения этой стратегии все еще являются предметом исследований.

Объяснение взаимного альтруизма в сообществах животных

Исследования просоциального поведения животных побудили многих этологов и эволюционных психологов применить стратегии «око за око», чтобы объяснить, почему альтруизм развивается во многих сообществах животных. Эволюционная теория игр, основанная на математических теориях, формализованных фон Нейман и Моргенштерн (1953), был впервые разработан Мэйнард Смит (1972) и исследовали поведение птиц. Роберт Хинд. Их применение теории игр к эволюции стратегий животных открыло совершенно новый способ анализа поведения животных.

Взаимный альтруизм работает в сообществах животных, где затраты для благотворителя в любой сделке с едой, правами спаривания, гнездовьями или территорией меньше, чем выгода для бенефициара. Теория также утверждает, что на акт альтруизма следует отвечать взаимностью, если баланс потребностей меняется. Механизмы выявления и наказания «обманщиков», которые не отвечают взаимностью, в сущности, форма «око за око», важны для регулирования реципрокного альтруизма. Например, предполагается, что «око за око» является механизмом кооперативного инспекционного поведения хищников в гуппи.

Война

Неспособность любой из сторон отступить от конфликта из-за боязни прослыть слабой или сотрудничать с противником была источником многих конфликтов на протяжении всей истории.

Тем не менее, стратегия «око за око» также была обнаружена аналитиками в спонтанном ненасильственный поведение, называемое "живи и давай жить другим "возникшие во время позиционной войны в Первая мировая война. Войска, окопавшиеся всего в нескольких сотнях футов друг от друга, породили бы невысказанное понимание. Если снайпер убивал солдата с одной стороны, другой ожидал такого же возмездия. И наоборот, если никто не был убит какое-то время, другая сторона признала бы это подразумеваемое «перемирие» и действовала соответственно. Это создало «сепаратный мир» между окопами.[11]

Смотрите также

Рекомендации

  1. ^ Шон Харгривз Хип, Янис Варуфакис (2004). Теория игр: критический текст. Рутледж. п. 191. ISBN  978-0-415-25094-8.
  2. ^ Аксельрод Турниры
  3. ^ Форсайт, Д. (2010) Групповая динамика
  4. ^ Гинтис, Герберт (2000). Развитие теории игр. Princeton University Press. ISBN  978-0-691-00943-8.
  5. ^ Бойд, Роберт (1989). «Ошибки позволяют эволюционную стабильность в повторяющейся игре« дилемма заключенного »». Журнал теоретической биологии. 136 (1): 47–56. CiteSeerX  10.1.1.405.507. Дои:10.1016 / S0022-5193 (89) 80188-2. PMID  2779259.
  6. ^ "Равновесие на острие ножа - теория игр 101". Получено 2018-12-10.
  7. ^ Докинз, Ричард (1989). Эгоистичный ген. Oxford University Press. ISBN  978-0-19-929115-1.
  8. ^ Аксельрод, Роберт (2000-01-01). «О шести достижениях теории кооперации». Анализировать и Критик. 22 (1). CiteSeerX  10.1.1.5.6149. Дои:10.1515 / auk-2000-0107. ISSN  2365-9858.
  9. ^ Аксельрод, Роберт (1984). Эволюция сотрудничества. Основные книги. ISBN  978-0-465-02121-5.
  10. ^ Коэн, Брэм (22 мая 2003 г.). «Стимулы повышают надежность BitTorrent» (PDF). BitTorrent.org. Получено 2011-02-05.
  11. ^ Приятные парни финишируют первыми. Ричард Докинз. BBC. 1986 г.

внешняя ссылка