1.2. Игры в нормальной форме
i, ставящая в соответствие каждому набору стратегий s = (si, ..., sn) , называемому также ситуацией, выигрыш
4
этого игрока .
Стандартный пример здесь — дуополия по Бертрану и по Курно, когда стратегии — это цены или объемы выпуска, соответственно, а выигрыши — это прибыль (см.
п. 1.9).Важным предположением, которое играет ключевую роль в теории, является предположение о том, что все игроки рациональны, в том смысле, что каждый игрок рассматривает имеющиеся в его распоряжении альтернативы, формирует представления относительно неизвестных параметров, имеет четко определенные предпочтения и выбирает свои действия в результате некоторого процесса оптимизации (максимизации своей целевой функции). Более того, не менее существенным является факт общеизвестности (общего знания)6 рациональности игроков, т.е. все игроки не только рациональны, но и знают, что другие игроки рациональны, знают, что все игроки знают, что они рациональны и т.д. Формальное определение общеизвестности см. Aumann (1976).
Замечание 1.2.1. В последние годы появилось значительное число работ, посвященных исследованию моделей ограниченной рациональности. Основная мотивация этих работ — неудовлетворенность теорией, оперирующей с «совершенно рациональным человеком», поскольку мы является свидетелями весьма частого несоответствия реального поведения людей предположению «совершенной рациональности». Идея моделирования ограниченной рациональности восходит к работам Герберта Саймона (Simon, 1955, 1956;, см. также Simon, 1972, 1976). Обсуждение проблем, связанных с модели- ровнием ограниченной рациональности, можно найти, например, в книге Rubinstein (1998).
Различные взгляды на проблемы моделирования рациональных и ограниченных рациональных игроков изложены в работах Binmore (1987, 1988), Aumann (1996).Обратимся к тому случаю, когда I = {1,2} и множества стратегий каждого из двух игроков конечны. В этом случае игру можно «изобразить» с помощью матрицы (см. рис. 6), где М = | Si | — число возможных стратегий игрока 1, К = l^l —
Г> / (т) (к)\
число возможных стратегии игрока 2, amk = ui(s\ , sx2 '), bmk = M2(s[m), k = l,...,K, m = 1,..., M. 1 (К)
?s2 72
1
(ац,Ьц) ... (а1К,Ь1К) \ {амъЬм\) ??? (амк,Ьмк Рис. 6.
Эту же игру можно представить в виде двух матриц (поэтому такие игры называются часто бнматрнчными), элементами которых являются элементы amk и bmk , соответственно.
Для конечной антагонистической игры, т.е. игры двух лиц, такой, что tti(si,s2) = ~u2(si,s2) Для всех G Si, i = 1,2, справедливо равенство amk = —bmk для всех т и к , а поэтому такая игра может быть задана только одной матрицей (amk) m=i,...,м , и поэтому конечные антагонистические
к=1,...,К
игры называются матричными (см. подробнее Раздел 1.8).
Смешанная стратегий щ — это вероятностное распределение на множестве чистых стратегий Si. (Мотивацию введения смешанных стратегий мы оставляем на будущее.) Рандомизация каждым игроком своих стратегий статистически независима от рандомизаций его оппонентов, а выигрыши, соответствующие профилю (набору) смешанных стратегий, — это ожидаемое значение выигрышей соответствующих чистых стратегий (т.е. речь здесь идет об ожидаемой полезности). Одна из причин, по которой мы сосредоточиваемся на конечном случае, — стремление избежать «осложнений», связанных с теорией меры.
Будем обозначать пространство смешанных стратегий i- го игрока через ^ - , a a— вероятность того, что выбирается стратегия . Пространство наборов смешанных стратегий — = Пг?/j элементы которого мы будем обозначать через а. Носитель смешанной стратегии аг- — это множество тех чистых стратегий, которым «приписана» положительная вероятность.
Определение 1.2.1.
Если Si — конечное множество чистых стратегий игрока i, то смешанная стратегия Oi : Si —т- [0,1] ставит в соответствие каждой чистой стратегии Si ? Si вероятность <7;(s;) > 0 того, что она будет играться, причем Yls-eS- ai(si) = 1 •(Обратим внимание на то, что индекс i означает здесь, что речь идет о стратегии игрока i. Поэтому, если мы будем говорить о разных стратегиях игрока i, то мы будем обозначать их Si, s'-, s'',....) Нетрудно заметить, что множество смешанных стратегий игрока i — это (ki — 1) -мерный симплекс, где ki — число чистых стратегий г-го игрока.
(2.1)
(поскольку на наборах чистых стратегий значения этой функции совпадают со значениями исходной функции выигрышей Ui , мы сохраняем то же обозначение).
Важно отметить, что выигрыш г-го игрока есть линейная функция от вероятностей <7г-, а также является полиномом от профиля, а потому непрерывен. Наконец, чистые стратегии являются вырожденными смешанными стратегиями, приписывающими вероятность 1 данной чистой стратегии и вероятность 0 — остальным.
Определение 1.2.2. Смешанным расширением игры Г = {/, S, и} называется игра Г = {/, и}, где = Пг'е/^г'; а и(а) > гс*е ° ? > определяется равенством (2.1).
Выигрыш игрока i, соответствующий профилю (набору) стратегий а, есть Пример. Рассмотрим игру, изображенную на рис. 7. L м Р и ( (4,3) (5,1) (6,2) т (2,1) (8,4) (3,6) d V (з,о) (9,6) (2,8) Рис. 7.
Пусть ci = ^J (это означает, что смешанная стра
тегия игрока 1 предписывает ему играть стратегии и, т и d с вероятностями 1/3), = ^ (эта смешанная стра
тегия игрока 2 предписывает играть стратегии М и R с равными вероятностями и не играть стратегию L вовсе).
В данном случае мы получаем
щ (ст) = l(0-4+i.5 + i-6) + + ±(0-2+±-8 + ±-3] +
и2{ст) = f.
Еще по теме 1.2. Игры в нормальной форме:
- 16.2.1 Нормальная форма игры
- Нормальная форма игры
- 4.2. Закон нормального распределения вероятностей
- Нормальная устойчивость финансового состояния.
- Понятие нормальной области
- Выплаты за работу в условиях, отклоняющихся от нормальных
- Метод аппроксимации нормальной области
- § 12. Рыночное неравновесие как нормальное состояние реальных экономических систем
- Прибыль нормальная и экономическая
- Мессианство или нормальная жизнь?
- Общие соображения о построении нормально работающего административного управления
- 4.4.Эластичность спроса по доходу. Товары нормального и относительно низкого качества.
- РАЗДЕЛ 0. У БАРБОСА ЕСТЬ ВОПРОСЫ. Прибыль: бухгалтерская, экономическая или нормальная?
- 2.1. Позиционная форма игры
- Выплата заработной платы в неденежной форме
- ДЕЛОВЫЕ ИГРЫ
- ИГРЫ С СОВЕРШЕННОЙ ИНФОРМАЦИЕЙ