1.5. Рационализуемые стратегии
Определение 1.5.1. Стратегия является лучшим
ответом игрока i на набор стратегий оппонентов <7_г-, если Ui{(Ji, (J-i) > Ui{a'i,G-i) при любых а[ ? . Стратегия (Ji является «никогда не лучшим» ответом8 (далее НЛО), если не существует cr_i, для которых она была бы лучшим ответом.
Конечно же игрок не будет играть стратегию, которая является «никогда не лучшим ответом».
Ясно, что строго доминируемая стратегия является «никогда не лучшей». Разумеется, может случиться, что стратегия будет «никогда не лучшим ответом», даже если она не является строго доминируемой (мы еще вернемся к этому). Таким образом, удаляя «никогда не лучшие ответы», мы должны удалить по крайней мере и все стратегии, удаляемые при последовательном удалении строго доминируемых стратегий. Более того, предполагая «общее знание», мы можем итерировать удаление «никогда не лучших ответов». Рациональный игрок не должен играть HJIO, как только он исключает возможность того, что его противники могут играть HJIO и т. д.
Стратегии, остающиеся после такого итеративного удаления, — это те стратегии, которые рациональный игрок может оправдать, или рационализовать, разумеется, при некоторых разумных предположениях о выборе своих противников.
Определение 1.5.2. Стратегии в , которые выдерживают последовательное удаление НЛО, называются рацио-
о
нализуемыми стратегиями .
Понятие рационализуемых стратегий было введено независимо Бернхеймом и Пирсом (Bernheim, 1984; Реагсе, 1984).
Можно показать, что так же, как и при последовательном удалении строго доминируемых стратегий, порядок удаления не существен.
Заметим, что множество рационализируемых стратегий не может быть шире, чем множество стратегий, «выживающих» при последовательном удалении строго доминируемых стратегии, поскольку на каждом шаге процесса, определяющего множество рационализируемых стратегий, все стратегии, строго доминируемые на данном шаге, удаляются.Пример (Osborn, Rubinstein) (см. рис. 16). ь2
(2,5) (3,3) (2,5) (0,-2)
Ьз (7,0) (5,2) (0,7) (0,0)
hi
( (0,7) (5,2) (7,0)
V (0,0)
а 1 а2 а3 а4
64 (0,1) (0,1) (0,1) (ю,-1) / Рис. 16.
На первом шаге исключения удаляется стратегия 64 , т.к. она является HJIO, поскольку она строго доминируется сме шанной стратегией 0,^,0^
2, и, 2, ^ , или (-,-,0,0). Как только
исключена 64, можно исключить <24, т.к. она строго доминируется а2 (поскольку 64 удалена). Но дальше мы уже не можем удалить ни одну стратегию, т.к. а\ — лучший ответ на 63 , а2 — на Ь2 и аз — на Ь\ . Аналогично остаются Ь\ , Ь2 , 63 . Таким образом, множество рационализуемых чистых стратегий есть {а!,а2,аз} для игрока 1 и (bi,b2,bs) — для игрока 2.
Для каждой рационализуемой стратегии игрок может построить последовательность «оправданий» своего выбора без ссылок на убеждение в том, что другой игрок не будет играть HJIO-стратегию. Например, в этой игре игрок 1 может оправдать выбор а2 убеждением, что игрок 2 будет играть Ь2 , которое игрок 1 может оправдать убеждением, что игрок 2 будет думать, что он собирается играть а2 , что осмысленно, если игрок 1 убежден, что игрок 2 думает, что он, игрок 1, думает, что игрок 2 будет играть Ь2,, и т. д.
Мы отметили, что множество рационализуемых стратегий не больше, чем множество стратегий, остающихся после после- довательного удаления строго доминируемых стратегий. Однако в случае двух игроков (п = 2) эти два множества совпадают, так как в игре 2-х лиц (смешанная) стратегия является лучшим ответом на некоторую стратегию противника, если Gi не является строго доминируемой. Если чистая стратегия игрока i является HJIO для любой смешанной стратегии оппонента, тогда строго доминируется некоторой смешанной стратегией G ?г-.
Рассмотрим это на примере (Mas-Colell, Whinston, Green) (рис.
17). L R и ( (ю,1) (0,4) м (4,2) (4,3) D V (0,5) (10,2) Рис. 17. У игрока 1 — три стратегии U , М и D . U — лучшая против L , но худшая против R, D — лучшая против R и худшая — против L . С другой стороны, М «относительно неплоха» и против L , и против R. Ни одна из этих трех стратегий не доминируется никакой другой. Но если разрешить игроку 1 рандомизацию, то игра U и D с вероятностями 1/2 каждая дает игроку 1 ожидаемый выигрыш 5, вне зависимости от стратегии второго игрока, тем самым строго доминируя М.Предположим, что выигрыши от использования стратегии М изменены так, что М не является строго доминируемой. Тогда выигрыши от М лежат где-то выше, чем линия, соединяющая точки, соответствующие стратегиям U и D . Здесь оси соответствуют ожидаемым выигрышам игрока 1 в случае, если игрок 2 играет R (ось IR) И L (ОСЬ ul) (СМ. рис.18). Линия ab — это множество
{(uR,uL) : + = ^u1(M,R) + ^u1(M,L)}.
10 Db
Рис. 18.
Является ли М здесь лучшим ответом? ДА.
Действительно, заметим, что если игрок 2 играет R с вероятностью 02 (R) , тогда ожидаемый выигрыш игрока 1 от выбора стратегии с выигрышами (ur,ul) есть <72(R)ur (1 — (72(R))ul . Легко видеть, что М — это лучший ответ на (72(i?) = 1/2; он дает ожидаемый выигрыш, строго больший, чем ожидаемый выигрыш, достижимый с помощью стратегий U и/или D . (В случае п > 2 это уже не так: могут существовать стратегии, являющиеся НЛО, но не являющиеся строго доминируемыми; это связано с тем, что рандомизация независима.)