Дилемма заключенных в теории игр: от абстракций к конкретике

Дилемма заключенных относится к типу экономической игры, в которой равновесие Нэша таково, что оба игрока оказываются в худшем положении, даже если они оба выбирают свои оптимальные стратегии.

Дилемма заключенных – это классический пример игры, в которой участвуют два подозреваемых, скажем P и Q, арестованные полицией и которые должны решить, признаваться им или нет.

Если один сознается, а другой нет, то заключенный, который сознается, получает более легкий тюремный срок, скажем, 1 год, а заключенный, который не сознается, получает очень суровый срок, скажем, 8 лет.

Если ни один из них не признается, они оба получают более легкие сроки, скажем, по 2 года каждый; но если оба признаются, то оба получают строгий срок, скажем, по 4 года каждый.

Игра может быть визуализирована с помощью следующей матрицы выплат:

Выплаты в тюрьме		Заключенный Q
Выплаты в тюрьме		Признаться	Не признаться
Заключенный P	Признаться	-4, -4	-1, -8
Заключенный P	Не признаться	-8, -1	-2, -2

Комбинированная оптимальная стратегия для обоих заключенных – не признаваться в содеянном. Именно потому, что это привело бы к минимальному объединенному тюремному сроку для них.

Но поскольку они не могут общаться и сотрудничать, пытаясь сделать все возможное индивидуально, они выбирают стратегии, которые обрекают их обоих.

Давайте посмотрим на игру с точки зрения заключенного P. Если заключенный Q сознается, то заключенному Р тоже лучше признаться, потому что в противном случае он получил бы срок 8 лет вместо 4 лет.

Точно так же, если заключенный Q не сознается, то в интересах заключенного P сознаться, потому что, признавшись, он получит срок в 1 год вместо 2 лет. Следовательно, независимо от того, что делает заключенный Q, признание является доминирующей стратегией для заключенного P.

Теперь давайте рассмотрим точку зрения заключенного Q. Он знает, что признание является доминирующей стратегией заключенного P. Он не хочет не признаваться и получить 8-летний срок и признаться. Но когда он это делает, оба получают по 4 года тюремного заключения каждый.

В конечном счете и тот и другой находятся в худшем положении, потому что они получают по 4 года каждый вместо всего лишь 2 лет каждый.

Но они не могут избежать этого печального исхода, потому что не могут сотрудничать, и любая другая стратегия была бы худшей для каждого заключенного в отдельности.

Равновесие Нэша в дилемме заключенных

Результатом дилеммы заключенного является равновесие Нэша. Равновесие Нэша – это такая комбинация стратегий, при которой у фирмы-игрока есть какой-либо стимул в одностороннем порядке изменить свою стратегию.

Когда оба игрока в игре имеют доминирующие стратегии, результатом, который является пересечением доминирующих стратегий, является равновесие Нэша.

Равновесие Нэша в дилемме заключенных

В дилемме заключенных, поскольку признание является доминирующей стратегией для каждого заключенного, равновесие Нэша возникает, когда оба признаются.

Это равновесие Нэша, потому что ни один заключенный не станет лучше, если в одностороннем порядке изменит свою стратегию.

Например, если заключенный Р решит не признаваться, в то время как заключенный Q действительно признается, то заключенный Р получит 8 лет вместо 4 лет. Следовательно, заключенному Р будет хуже, если он отойдет от равновесия Нэша.

Он не станет выбирать иной стратегии, кроме той, что диктует равновесие Нэша. Этот пример показывает, что равновесие Нэша является самоподкрепляющимся и стабильным.

Примеры

Хотя дилемма заключенных, рассмотренная выше, является абстрактной концепцией, многие реальные ситуации очень похожи на нее.

Пример 1. Фирмы знают, что если они не рекламируют, то могут сохранить свою существующую долю рынка и прикарманить сэкономленный рекламный бюджет в качестве дополнительной прибыли, но они все равно рекламируют, потому что каждая фирма боится, что если она не рекламирует, а другая фирма делает это, то она потеряет свою долю рынка.

Поскольку обе фирмы испытывают один и тот же страх, обе они рекламируют, обе имеют более низкую прибыль (из-за более высоких расходов на рекламу), и никто не получает никакой доли рынка.

Пример 2. Фирмы, принимающие решение о том, следует ли нанять адвоката, чтобы представлять их интересы в арбитраже, будут коллективно лучше, если они решат не нанимать адвоката.

Но каждая фирма нанимает адвоката из страха, что если другая фирма наймет адвоката, а они этого не сделают, вероятность того, что другая фирма выиграет в арбитраже, значительно возрастет.

Пример 3. Фирмы в олигополии находятся в лучшем положении, если они могут одновременно ограничивать свой выпуск и устанавливать монопольную цену.

Но так как сговор незаконен, то и то, и другое дает более высокую отдачу, что снижает отдачу каждой фирме. Модель Курно является иллюстрацией такой дилеммы заключенных.