4.3. Сигнальные игры
Природа выбирает тип ti для ведущего из множества возможных типов Т = .. в соответствии с вероятностным распределением p{ti) : p{ti) > 0 для любого i и p{h) + ? ? ? + p{ti) = 1. 2.
Ведущий наблюдает ti и выбирает сигнал rrij из множества возможных сообщений М = {mi,..., rrij} . 3.
Получатель наблюдает (получает сигнал) rrij (но не ti) и затем выбирает действие ak из множества А = {аь . ..,ак} ? 4.
Определяются выигрыши Us(ti, rrij, аь) и rrij, аь) .
Разумеется, естественно считать, что множество возможных сообщений зависит от типа игрока, а множество возможных действий зависит от полученного сигнала. Так, скажем, в модели сигнализирования на рынке труда S — рабочий, а R — это перспективный рынок занятости, тип — это производительность рабочего, а сообщение — это выбор уровня образования, и, наконец, действие — это уровень заработной платы. В модели корпоративных капиталовложений и структуры капиталов S — фирма, нуждающаяся в финансировании нового проекта, R — потенциальный инвестор, тип — прибыльность имеющихся активов фирмы, сообщение — это предложение фирмой долевой ставки отдачи, а действия — решения инвестора вкладывать или нет. В некоторых случаях сигнальная игра может быть частью более сложной игры, т.е. например, может быть некоторое действие получателя до выбора сообщения ведущим S .
Мы остановимся на простом случае:
T = {ti,t2}, M = {mi,m2}, A = {ai,a2}, Probjii} = p.
Дерево такой сигнальной игры удобно изображать следующим образом (мы не указываем здесь выигрыши в терминальных вершинах) (рис.9):
Рис. 9.
Как всегда, стратегия игрока — это полный план действий: стратегия предписывает допустимое действие в каждом случае, когда игроку, может быть, придется сделать ход.
В сигнальной игре чистая стратегия игрока S — это функция rn(ti) , указывающая, какое сообщение будет выбрано для каждого типа, который может выбрать Природа, а чистая стратегия игрока R — это функция a (raj) , указывающая, какое действие будет выбрано для каждого возможного сообщения S . В изображенной игре может быть всего 4 (чистых) стратегии у каждого из игроков:Первая стратегия S — сыграть mi , если Природа выбрала t\ , и сыграть mi , если t2 .
Вторая стратегия S — сыграть mi , если Природа выбрала ti , и сыграть т2 , если t2 .
Третья стратегия S — сыграть т2 , если Природа выбрала ti , и сыграть mi , если t2 .
Четвертая стратегия S — сыграть т2 , если Природа выбрала 11 , и сыграть т2 , если t2 . Первая стратегия R — сыграть а\ , если S выбрала т\ , и сыграть а\ , если т2 .
Вторая стратегия R — сыграть а\ , если S выбрала т\ , и сыграть а2 , если т2 .
Третья стратегия R — сыграть а2 , если S выбрала т\ , и сыграть а\ , если т2 .
Четвертая стратегия R — сыграть а2 , если S выбрала mi , и сыграть а2 , если т2 .
Первая и четвертая стратегии S — объединяющие, так как каждый тип посылает один и тот же сигнал, а вторая и третья — разделяющие, так как каждый тип посылает разные сигналы. В моделях с более чем двумя типами могут быть частично объединяющие (или полуразделяющие) стратегии, когда все типы из некоторого подмножества типов посылают один и тот же сигнал, но разные подмножества типов посылают различные сообщения. Есть также гибридные стратегии, например, t\ посылает т\ , a t2 рандомизирует т\ и т2 .
Поскольку S знает всю историю игры и его выбор осуществляется в одноточечном информационном множестве, то вопрос о его представлениях не возникает. Что касается R, то он выбирает действие после наблюдения сообщения S , но не зная тип S, значит, выбор R происходит в неодноточечном информационном множестве. Поэтому теперь мы можем переформулировать требования, которые мы рассматривали в начале этой главы для сигнальных игр.
(fj,(ti\mj) — вероятность того, что сообщение rrij послано типом ti).
Сигнальное требование 1.
После получения каждого сообщения mj из MR должен иметь представление о том, какой тип мог послать сообщение rrij . Обозначим соответствующее вероятностное распределение через p(ti\mj) , где p(ti\mj) > О для любого ti ? Т и
t,ET
При данном сообщении S и представлении R оптимальное действие характеризуется с помощью требования последовательной рациональности:
Сигнальное требование 2 R . Для любого rrij ? М действие R, a* (rrij) , должно максимизировать ожидаемую полезность R при данном представлении fj,(ti\rrij) относительно того, какой тип мог послать сообщение rrij . То есть a* (rrij) решает задачу
max V" fj,(ti\mj)UR(ti, rrij, ак).
a-kEA —'
пет
Требование последовательной рациональности применимо пк S, но S имеет полную информацию, а следовательно тривиальные представления, а кроме того, он ходит только в начале игры, значит стратегия S должна быть оптимальна при данной стратегии R.
Сигнальное требование 2S . Для любого типа ti ? Т сообщение m*(ti) игрока S должно максимизировать полезность S при данной стратегии a* (rrij) игрока R. Т.е. m*(ti) решает задачу
max Us (ti, rrij, a* (rrij)).
rrij G M
Наконец, при данной стратегии m*(ti) игрока S, обозначим через Tj множество типов, которые посылают сообщение m,j . Т.е. ti ? Tj , если m*(ti) = rrij . Если Tj — непусто, то информационное множество, соответствующее сообщению rrij , лежит на равновесном пути; в противном случае rrij не посылается никаким типом, и соответственно информационное множество находится вне равновесного пути. Поэтому требование 3 можно переписать для R следующим образом.
Сигнальное требование 3. Для любого rrij в М, если существует ti в Т такой, что m*(ti) = rrij , представление R в информационном множестве, соответствующем rrij , должно определяться по правилу Байеса и исходя из стратегии S , т.е.
р{и)
n(ti \rrij) = Определение 4.3.1. Совершенное Байесово равновесие (в чистых стратегиях) в сигнальной игре есть пара стратегий m*(ti) , a*(rrij) и представление p(ti\m,j) , удовлетворяющие сигнальным требованиям 1, 2 R, 2 S и 3.
Если стратегия S является объединяющей или разделяющей, то равновесие называется объединяющим или разделяющим соответственно.
(1.3) и и (7 1;
(2,4) и
0.5
Ч/ (1,0)
Пример (Gibbons).
Рассмотрим сигнальную игру, изображенную на рис. 10.Здесь потенциально может существовать 4 совершенных Байесовых равновесия в чистых стратегиях. (1)
объединяющее на I; (2)
объединяющее на г ; (3)
разделяющее с t\ , играющим I, и t2 , играющим г ; (4)
разделяющее с t\ , играющим г , и t2 , играющим I.
Рассмотрим эти возможности поочередно.
(1) Объединяющее на I. Предположим, что есть равновесие, в котором стратегия S есть (1,1), т.е. t\ играет I и t2 играет /. (Запись (то', то") означает, что тип t\ посылает сигнал то', а тип t2 посылает сигнал то" .) Тогда информационное множество R, соответствующее I, лежит на равновесном пути, поэтому представление (р, 1 — р) в этом информационном множестве определяется правилом Байеса и стратегией S, а именно р = 0.5 — априорное распределение. При таком представлении (или любом другом представлении), лучший ответ R на I — это сыграть и, так что типы t\ и t2 получают соответственно 1 и 2. Чтобы определить, будут ли оба типа действительно играть I, нам надо уточнить еще, как R реагировал бы на г . Если ответ Д на г есть и , то выигрыш типа 11 от игры г есть 2, что превосходит выигрыш 11 от игры I, поэтому если ответ Д на г есть и, то типу t\ играть I не следует. Но если ответ Д на г есть d, то t\ и t2 получают 0 и 1 от игры г , тогда как они получают 1 и 2 (соответственно) от игры I. Таким образом, если существует равновесие, в котором стратегия S есть (/, /), то ответ R на г должен быть d, а значит, стратегия R должна быть (u,d) (где (а', а") означает, что R играет а' на I и а" на г). Остается определить те представления R в информационном множестве, соответствующем г , при которых для него оптимально играть d . Легко видеть, что играть d оптимально для R при любом q < 2/3. Действительно, для данных представлений [q, 1 — q] игрока R ожидаемый выигрыш R от игры и есть 1 • q + 0(1 — q) , от игры d есть 0 • q + 2(1 — q) . Значит, играть d оптимально, если 2(1 — q) > 1 • q, т. е. q < | .
Следовательно, [(/,/), (u,d), р = 0.5, q] является объединяющим совершенным Байсовым равновесием для любого Ч < 2/3. (2)
Объединяющее на г. Предположим теперь, что стратегия S есть (г, г), значит, q = 0.5, и значит, (т.к. 0.5 < 2/3 у R лучший ответ на г есть d, давая 0 для t\ и 1 для t2 . Но 11 может получить 1, играя I, так как лучший ответ R на I есть и для любого значения р , значит, равновесия с (г, г) не существует. (3)
Разделяющее с t\ , играющим I. Если S играет (/, г), то оба информационных множества — на равновесном пути, следовательно оба представления определены правилом Байеса и стратегией S , т.е. р = 1, q = 0 . Лучший ответ R на эти представления есть und соответственно, так что оба типа S получают по 1. Остается проверить, является ли эта стратегия S оптимальной при данной стратегии (и, d) игрока R . Но это не так: если t2 отклонится от г, играя I, то R отвечает и , поскольку его стратегия — (и, d) , давая t2 выигрыш 2, что превосходит выигрыш 1 для t2 от игры г .
(4) Разделяющее с t\ , играющим г . Если S играет (г, /), то представления R должны быть р = 0 и q = 1, так что лучший ответ R есть (и, и) и оба типа получат 2. Если бы 11 отклонился, играя I, то R отреагировал бы и; выигрыш 11 тогда был бы 1, значит, нет стимулов для t\ отклоняться от игры г . Аналогично, если t2 отклонился бы, сыграв г , то поскольку R играет и , выигрыш t2 был бы 1, а значит, t2 нет смысла отклоняться от игры I. Значит, [ (г, /), (и, и) , р = О , q = 1 ] — разделяющее совершенное Байесово равновесие.
Примеры.
Модель ограничивающего ценообразования Милгрома-Ро- бертса (Milgrom, Roberts, 1982; см. также, например, Тироль, 2000).
Мы приведем несколько упрощенную модель и опишем ее достаточно схематично. Предположим, что есть два периода времени и две фирмы. Фирма 1, укоренившаяся, является монополистом в момент времени 1. Она выбирает цену р\ своей продукции в первом периоде. Затем фирма 2, новичок, решает вопрос о том, входить в отрасль или нет во втором периоде. Если она входит, то во втором периоде мы имеем ситуацию дуополистической конкуренции, если же нет, то фирма 1 остается монополистом.
Предположим, что затраты фирмы 1 могут быть низкими (с вероятностью х) или высокими (с вероятностью 1-х). Пусть M\(pi) обозначает монопольную прибыль укоренившейся фирмы, если она назначает цену р\ , причем t = L или Н в зависимости от того, являются ли затраты фирмы низ- кими (L) или высокими (Н), то есть
M[(p1) = (p1-CT)D™(p1),
где -D™(') — монопольный спрос. Пусть далее р^ и р^ — монопольные цены, назначаемые укоренившейся фирмой в зависимости от уровня затрат. Хорошо известно, что р^ < р^ . Обозначим через М^ и — прибыль монополиста (в зависимости от типа затрат), который максимизирует свою прибыль, то есть М\ = М\(ргт) . Будем считать, что М\(р\) строго вогнута по pi .
Фирма 1 знает свои затраты. Фирма 2 не знает затрат фирмы 1. Следуя Милгрому-Робертсу, считаем, что фирма узнает затраты фирмы 2 после входа, если она решается на вход; считаем также, что дуополистическая конкуренция по цене (после входа, если он происходит) не зависит от цены первого периода. Обозначим через D\ и D\ дуополистические прибыли фирм при условии, что тип первой фирмы — t. (Можно считать, что D\ включает затраты на вход.)
Будем считать, что решение фирмы 2 относительно входа зависит от представлений относительно затрат фирмы 1 следующим образом:
> 0 >
Таким образом, в условиях симметричной информации фирма 2 вошла бы, если бы затраты первой фирмы были высокими (общий коэффициент дисконтирования есть а).
Поскольку фирма 1 предпочитает быть монополистом ( Ml > D\ , t = L, H), она, конечно же, хочет передать информацию о том, что ее затраты низки. Однако проблема состоит в том, что у нее нет прямого механизма сделать это, даже если у нее действительно низкие затраты. Косвенный способ состоит в сигнализировании путем назначения низкой цены р\ . В нашем примере фирма 1 может захотеть назначить р\ , даже если у нее высокие затраты. Потеря прибыли в первом (монопольном) периоде может быть перекрыта во втором периоде за счет сохранения своего монопольного положения. Но означает ли это, что назначение цены р\ предотвратит вход? Это, увы, совершенно не очевидно. Рациональный новичок, зная, что в интересах укоренившейся фирмы «обмануть» подобным образом новичка, может не поддаться на такую уловку. Но укоренившаяся фирма понимает, что новичок знает о соответствующей заинтересованности укоренившейся фирмы обмануть, и т. д.
В такого рода модели есть два типа потенциальных равновесий (не считая третьего случая, когда укоренившаяся фирма использует смешанные стратегии) — разделяющие, когда укоренившаяся фирма назначает различные цены в зависимости от своего типа, и объединяющее, когда цена первого периода не зависит от типа фирмы. В первом случае цена первого периода выявляет затраты новичку. Во втором, напротив, новичок ничего не узнает относительно затрат и его апостериорные представления остаются неизменными (он приписывает вероятность х низким затратам).
(3.1)
Mf - Mf(pf) > 8(М? - Di ).
Начнем с разделяющего равновесия. Мы имеем два необходимых условия: тип L не хочет назначать равновесную цену типа Н, и наоборот. (Затем мы завершим описание равновесия, выбирая представления вне равновесного пути, т.е. для цен, отличающихся от потенциальных равновесных цен, которые будут препятствовать отклонению обоих типов от их равновесных цен.) Ясно, что в разделяющем равновесии цена, назначенная типом Н, индуцирует вход, поэтому укоренившаяся фирма играет рН и получает прибыль М^1 -\-8Df (если он назначает меньшую цену, то он может увеличить свою прибыль в первом периоде без неблагоприятного влияния на вход). Пусть р\ — цена, назначаемая типом L . Тип Н, назначая эту цену, предотвращает вход и получает М^(р^) -\-8М^ . Таким образом, необходимое условие равновесия есть М^ + 8D^ > М?{Р\) + или
Аналогично тип L максимизирует свою прибыль, выбирая р\ . Поскольку он может назначить свою монопольную цену и получить в худшем случае (р^ в худшем случае индуцирует вход) Мi + 5Di и поскольку в равновесии он получает M^pf) + 8М[ мы должны иметь
Mf + SDf1 < МНр{) + 8MiL или
(3.2)
Mf-M^pf) < 8{M^-D[)
При некоторых предположениях38 неравенства (3.1) и (3.2) определяют некоторый интервал [pi,pi] цен р\ , причем р\ < р^ . Это означает, что для того чтобы «разделять», тип L должен назначать цену ниже своей монопольной цены, чтобы сделать «объединение», т.е. назначение низкой цены, весьма затратным для типа Н .
Предположения, которые упоминались выше, обеспечивают существование не более одной точки пересечения кривых у = - М^(р^) и у = - М1я(р(') (см. рис. 11).
Заметим, что в точке р\ неравенство (3.1) превращается в равенство, и р\ называется разделяющей ценой наименьших затрат39, так как из всех разделяющих цен тип L предпочел бы цену pi (ближайшую к р1т ).
Предположим, что тип Н выбирает ря , а тип L — цену Pi G \])11pi]. Когда наблюдается цена, отличная от этих двух цен, представления произвольны. Простейший способ получить равновесие — выбрать представления, которые индуцируют вход, поэтому будем считать, что если pi ф ря и р1 ф pf ) то апостериорные представления х' есть 0 (фирма 2 считает, что укоренившаяся фирма имеет тип Н).
Хотя мы получаем тем самым континуум разделяющих равновесий, все-таки «разумным» представляется только одно из них — с разделяющей ценой наименьших затрат.
Рис. 11.
Таким образом, подводя итоги нашего достаточно краткого анализа разделяющего равновесия, заметим следующее: существует единственное «разумное» равновесие, при этом тип Н назначает свою монопольную цену и «разрешает» вход, тип L назначает наибольшую цену р\ .
Обратимся теперь к объединяющему равновесию. Его существование зависит от выполнения условия
xD% + (1 - x)D% < 0. (3.3)
Предположим, что это условие не выполнено40. Тогда при объединяющей цене фирма 2 получает строго положительную прибыль, если входит. Это означает, что вход не предотвращен, стало быть, оба типа не могут сделать ничего лучшего, нежели назначить свои монопольные цены. Так как эти цены различны, то объединяющего равновесия не существует.
Следовательно, предположим, что (3.3) имеет место, так что объединяющаяся цена р\ сдерживает вход. Необходимое условие того, что цена р\ является ценой объединяющего рав- новесия, состоит в том, что ни один из типов не хочет назначать свою монопольную цену.
Если бы один из них сделал бы это, то это, в худшем случае, допустило бы вход. Значит, р\ должна удовлетворять условию (3.2) и аналогичному условию для типа Н :
Mf - Mf(pi) < 8{М? - Df). (3.4)
Если выполнено условие
Mf - M?(pL) < 6(М? - )
(см. также сноску 5 выше), то существует интервал цен «вокруг» удовлетворяющих обоим неравенствам.
Можно показать, что если р\ удовлетворяет условиям (3.2) и (3.4), то pi может быть частью объединяющего равновесия. Предположим, что как только фирма 1 назначает цену, отличную от pi (цена вне равновесного пути), то фирма 2 считает, что фирма 1 имеет тип Н . Тогда фирма 2 входит, а фирма 1 может назначить монопольную цену. Таким образом, из условий (3.2) и (3.3) следует, что ни один из типов не будет отклоняться.
Модель Спенса (Spence, 1974). Спенс предложил следующую модель выбора уровня образования. Первый игрок S (работник) выбирает уровень образования ai > 0 . Его затраты на инвестирование ai единиц в образование есть a\/Q , где Q — его тип «способностей». Производительность работника в фирме равна Q (для простоты не зависит от уровня образования). Второй игрок R (фирма) старается минимизировать квадрат разности между ставкой заработной планы , предлагаемой работнику (в зависимости от его производительности), и его производительностью. Игрок 2 предлагает ожидаемую производительность ai(a2) = E(Q\ai) . Функция выигрыша работника есть а2 — ai/Q ? S может иметь один из двух возможных типов Q' гл" г. гл' гл" '
или Q , причем 0 < Q < Q ; вероятности этих типов — р и р соответственно. S знает свой тип, но Д — нет.
Пусть (Т1 и (Т1 обозначают равновесные стратегии типов Q и Q . Заметим, что если al ? suppo^ и а ? suppo^ (где suppui — носитель стратегии о\ , т.е. множество тех чистых стратегий, которые играются с положительными вероятностями), то а1 < а1 . В самом деле, в равновесии
/ i t п и /
a2\ai) — ai/Q >a2(a1)-a1/Q и
// ff ff f f ff a2\ai) — ai/Q >a2(a1)-a1/Q .
Складывая эти два неравенства, получаем
(1/Q - 1 /Q( )(ах - ах) > 0 или ах < ах.
В разделяющем равновесии низкопроизводительный работник выявляет свой тип и получает зарплату Q . Он поэтому должен выбрать а1 = 0; если бы он поступил иначе, то смог бы выиграть, выбрав а1 = 0 , поскольку он бы сэкономил на затратах на образование и получил бы зарплату, являющуюся необходимо выпуклой комбинацией Q и Q и поэтому, как минимум, равную Q .
Пусть а1 > 0 означает равновесное действие типа Q (заметим, что в разделяющем равновесии тип Q не может играть смешанную стратегию, поскольку все его равновесные действия приносят зарплату Q , и поэтому тип Q предпочитает самый низкий уровень образования). Для того чтобы (а1 = 0, а1) было частью разделяющего равновесия, тип Q не должен предпочитать а1 (в сравнении с а1):
/ // // I
Q > Q — a1/Q или
a'i[>Q'{Q"-Q') (3-5)
Аналогично тип Q" не может предпочитать а1 (в сравнении с а1) :
а[ Рассмотрим представления
/ // , ,, {//(Q |«1) = 1, если а\ ф а1, //(Q |а1) = 0}.
Ясно, что оба типа предпочитают а\ = 0 любому а\ ^ {0,а1}, поскольку любой такой а\ дает зарплату Q . Поскольку для Q 0 предпочтительнее а1 (см. (3.5)), а для Q а1 предпочтительнее 0 (см. (3.6)), то мы имеет континуум разделяющих равновесий. Этот континуум иллюстрирует, как определение представлений вне равновесного пути приводит к множественности равновесий. Мы использовали «пессимистичное» представление, согласно которому любой сигнал, кроме а1 , убеждает R в том, что S имеет тип Q . Однако разделяющие равновесия могут основываться на менее экстремальных апостериорных представлениях. В частности, мы можем считать, что ^(Q |«i) = 0 для всех а\ > а1 .
Интересно отметить, что из этого континуума разделяющих равновесий все, кроме одного с наименьшими затратами, когда al = Q (Q — Q ) = могут быть исключены по следующим соображениям.
Независимо от того, какой уровень образования выбирает S, игрок R никогда не выбирает уровень зарплаты вне интервала [Q , Q ] . Когда игрок S осознает это, то тип Q никогда не выберет а > а\ . Когда игрок R осознает, что это так, то он должен отвечать на а\ > а\ зарплатой Q ; в этом случае тип Q никогда не выберет а\ > а\ .
В объединяющем равновесии оба типа выбирают одно и то / "о
же действие а\ = а1 = а1 . Зарплата в этом случае есть
«2(^1) = Р Q +Р Q ?
Простейший способ «поддержать» а как объединяющий исход — это формирование пессимистичного представления МQ lai) = 1 Для любого а\ ф d\ , так как это минимизирует
(для обоих типов) соблазн отклониться. Поэтому Й1 является уровнем образования объединяющего равновесия тогда и только тогда, когда для любого Q
Q' < PQ'+P"Q" - аг/Q.
Так как Q' < Q", Q' наиболее склонен отклониться к ai = О , минимизировать затраты на образование и связывающее ограничение есть а\ < р Q (Q — Q ), то существует также континуум объединяющих равновесий.
Следовательно, Q (Q — Q ) < а1
Обратно, предположим теперь, что а1 лежит в этом интервале.
Еще по теме 4.3. Сигнальные игры:
- 2.1. Позиционная форма игры
- ДЕЛОВЫЕ ИГРЫ
- Ролевые игры "МАО" для предпринимателей 1.
- ИГРЫ И СТРАТЕГИИ
- 16.4 Динамические игры с несовершенной информацией
- 3. Динамические игры с несовершенной информацией
- 2.5. Повторяющиеся игры
- ИГРЫ С «ПОЧТИ СОВЕРШЕННОЙ* ИНФОРМАЦИЕЙ
- 6.6. Дополнение. Выпуклые игры
- Игры — важный обучающий инструмент
- Игры использовались веками
- 4. Статические игры с неполной информацией
- 16.5 Статические игры с неполной информацией
- СТАТИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ