НАРОДНЫЕ ТЕОРЕМЫ
БЕСКОНЕЧНО ПОВТОРЯЕМЫЕ ИГРЫ ПРИ ПОЛНОЙ ИНФОРМАЦИИ
Рассмотрим «статичную» игру п участников, определенную пространством стратегий Ai для каждого игрока г = 1,...,п и платежной функцией IF(ai,..., а*,...,ап) для каждого игрока г, где ау принадлежит Aj.
Для простоты допустим, что множество чистых стратегий конечно (например, в ценовой игре цены должны быть приведены в центах, быть неотрицательными, их число должно быть большим, но ограниченным). Мы не различаем чистые и смешанные стратегии, так что можно представить Ai как набор вероятностей распределения (смешанных стратегий) сверх чистых стратегий, доступных игроку г (также чисто технически удобно предположить, что игроки могут применять коррелированные стратегии, т. е. они могут влиять своими действиями на принимаемые обществом решения; однако эту возможность мы здесь не используем). Статичная игра часто называется «составной игрой». Мы будем использоватьа—i — (®1 1 at — ll ai+l i an)
и 1Р(а*,а-{) для обозначения прибыли г-го игрока.
Мы определим отправную (reservation) полезность игрока г как наихудший исход для игрока г в этой игре:
П1* = min шах П1(аг, а_^).
a_i a,
•*
Предвидя действия a-i соперников, игрок г максимизирует П1(а,-Та_*) в статичных условиях. Очевидно, что г-й игрок не может получить прибыль меньшую, чем П**, по условиям данной игры (либо меньше, чем П1* «в среднем», если данная игра будет повторяться все время).
Вектор выигрыша П = (П1,..., П1,..., Пп) индивидуально рационален, если для всех г П* > П1*. (Это достижимо, если существуют возможные стратегии а = (ai,..., а,-,. - •, an), такие, что для всех i П* = Пг(а)).
Например, в ценовой игре Бертрана или в количественной игре Курно индивидуальные рациональные прибыли равны нулю. (Невозможно принудить фирмы получать отрицательную прибыль; но, с другой стороны, если оппонент назначает нулевую цену или производит такое количество продукции, что цена падает ниже предельных затрат, это будет препятствовать получению прибыли).
Легко проверить, что возможен любой набор прибылей, сумма которых не превышает монопольную прибыль.Рассмотрим бесконечно повторяемую версию составной игры. Пусть 6 обозначает дисконтирующий множитель. Тогда игрок г получит выигрыш:
оо
Г = ^«'П,'(а1(0,...,оп(0),
1=0
и средний выигрыш составит
V»' = (1 -8)У\
гдеа^/) обозначает действие, выбранное игроком г в момент < (которое является функцией прошлого развития событий).
Наша первая народная теорема восходит к [38]. Она утверждает, что любой средний вектор выигрыша более приемлем для всех игроков по сравнению с равновесным по Нэшу вектором выигрыша составной игры, поскольку может поддерживаться как исход совершенного равновесия бесконечно повторяемой игры, если игроки достаточно терпеливы. Более точно — пусть
П,'л, = 1Г(а|\...,а?г),417
и пусть V = (и1,..., Vй) так, что V достижимо и уг > П*^ для всех г. Тогда существует <$о < 1 такое, что для всех 6 > 6о V является равновесным вектором выигрыша.
Доказательство этой народной теоремы в основном такое же, как и приведенное в тексте. Для простоты изложения предположим, что существуют чистые стратегии а = (а1,..., ап), такие, что V* = П1(а1,..., а„) для всех г. Определим следующие стратегии поведения. Каждый игрок играет а, до тех пор, пока все игроки не примут стратегию а несколько раньше. Если кто-либо отклонился от данной стратегии в прошлом, игрок принимает стратегию . Таким образом, соглашение об а вынужденно вследствие угрозы Нэша, т. е. угрозы возвращения к стратегии поведения Нэша навсегда. При отклонении в данный момент игрок получает в лучшем случае ограниченную сумму; с другой стороны, в этом случае он теряет прибыль от будущего сотрудничества:
которая стремится к бесконечности, так же как и 6 стремится к 1.
Для игры Бертрана (которая потенциально является одним из наиболее интересных применений теории длительного повторяемого взаимодействия, так как цены ограничены короткими периодами времени) эта теорема дает полное описание множества равновесий для 6, близкой к 1.
Это объясняется тем, что если фирмы имеют одинаковые предельные затраты, равновесие Нэша составной игры дает нулевую прибыль и, таким образом, отправной выигрыш. Предыдущая теорема тогда показывает, что индивидуальные рациональные и возможные выигрыши являются равновесными выигрышами для ?, близкой к 1. Для других составных игр (например, конкуренция Курно) точки Нэша не дают отправной ценности (рис. 6.4).
Конкуренция Конкуренция
Бертрана. Курно
Рис. 6.4. Угрозы Нэша.
В играх, где равновесие Нэша лежит выше отправной ценности, возникает вопрос, могут ли быть навязаны другие равновесные векторы выигрыша, помимо тех, которые были указаны в предыдущей теореме. Ответ состоит в том, что каждый индивидуально рациональный и возможный вектор выигрыша может быть навязан в условиях совершенного равновесия. Оумен и Шэпли [11] и Рубинстайн [70] доказали это для случая 6 = I.418 Предположение о том, почему любой выигрыш, превышающий отправную ценность, может быть устойчивым, следующее:
«...до тех пор, пока все выполняют прежние правила, игроки продолжают придерживаться своих стратегий а*, приводящих к выигрышу г;;. Если какой- то игрок j отклоняется, он будет, как и прежде, минимаксимизирован, но не навсегда, а лишь на период, необходимый для аннулирования любой возможной выгоды, полученной в результате этого отклонения. После такого наказания игроки возвращаются к своим стратегиям а,. Наказывающие вынуждены примириться со своей минимаксной стратегией, так как в противном случае их подстерегает угроза того, что, если кто-либо уклонится от принятия стратегии наказания, он в свою очередь будет минимаксимизирован другими на такое время, что это отклонение не будет иметь смысла. Более того, игроки, наказывающие его, также будут наказаны, если кто-либо из них отклонится от данного курса, и т. д. Таким образом, существует потенциальная последовательность наказаний с последующим повышением их уровня, где наказание на каждом из уровней выносится в результате боязни того, что последует наказание на следующем уровне» [42, р. 538].
Фьюденберг и Мэскин показали, что в условиях нестрогой упорядоченности эта последовательность с понижением уровня соблюдается при 6 = 1. Все индивидуально рациональные и возможные выигрыши могут поддерживаться в совершенном равновесии для й, достаточно близкой к 1.
6.7.3.2