9.8. Статические игры с неполной информацией
Далее рассматриваются статические игры, в которых предпочтения каждого игрока определяются реализацией некоторой случайной переменной. Эту реализацию некоторой случайной переменной выбирает нулевой игрок Р0 (Природа). «Выбор» игроком Р0 определенной реализации означает, что осуществляется выбор определенного типа предпочтений каждого игрока, т.е. каждый игрок может реализоваться в нескольких вариантах, т.е. в нескольких своих типах. Каждый игрок может наблюдать реализации только своей случайной переменной, т.е.
наблюдать только свои типы. Вводя для каждого игрока Рк различные типы его предпочтений, мы «расширяем» первоначальную игру. Такие статические игры с неполной информацией называются статическими байесовскими играми.Инструмент байесовских игр активно востребован в экономических исследованиях, когда приходится учитывать случайные факторы. Дадим формальное описание статической байесовской игры.
433 |
В этой игре конечное число игроков Р{, ..., Рт (т > 2 — натуральное число) и нулевой игрок Р0 — Природа. Обозначим символом множество типов игрока Рк (множество может быть не только конечным или счетным, хотя дальше мы ограничимся только конечным вариантом).
Конкретный элемент 0^ е 0^ соответствует определенному типу игрока Рк, к = 1, ..., т. Появление конкретного элемента 0^ — случайное событие. Поэтому должно быть задано распределение вероятностей />(0) на 0 = 0, х ... х 0т, известное всем игрокам Р{,..., Рт. Здесь 0 = (0р ..., 0т) е ©. Вероятности должны быть неотрицательными, а их сумма по всем28 - 7620
0 е 0 должна равняться единице. После выбора типа 0^ игрока Рк, т.е. при выборе конкретного (типа) 0^ е 0^, игрок Рк выбирает свою стратегию (свой ход) ^(0^) е Бк9 где — множество ходов игрока Рк. Поэтому (чистая) стратегия ^(0^) игрока Рк есть функция (отображение), аргумент которой пробегает множество 0^ типов игрока Рк, а ее частные значения пробегают множество ходов игрока Рк. Множество всех таких функций обозначим символом ^(0*). Тогда ^(0) = (лг1(в1),..., ^т(0т)) есть профиль стратегий игроков Рр ..., Рт на множестве
5(0) = 5/0,) х... х £„(©„), т.е. 46) = (^(0,),.... 8тфт)) е 5,(0,) х -*Зт(®т) Для любого© е 0.
Выигрыш игрока Рк зависит не только от выбора ходов в,,..., ьт всех игроков Р{9..., Рт, в том числе и от хода ^ самого игрока Рк, но и от их типов, т.е. выигрыш игрока Рк равен значению и^О), 0) его функции выигрыша на профиле 5(0) = (^,(0,), ..., ^(0^)) стратегий 5,(0,),игроков Р{9..., Р . Более подробно значение и^О), 0) следует представить так ик(як(вк), я_к(в_к), &к, в_к), где 0_^ = (0_р Вк, 0*+1,9Ж), *_к=(з_19..., зт).
Ожидаемый выигрыш игрока Рк, имеющего тип 0* и выбравшего ход в предположении, что остальные игроки Р{9 ..., Ркштр Рк+ р ..., Рт выбрали стратегии (ходы) 5^(6^) = (^,(0^, ^(О^), *к+{(вк+1),...,*т(вт)), равен
где 0р ..., 0£_р вЛ+р ..., 0т — типы остальных игроков Р{9 ..., Рк_{9 Рк+р ..., Рт; и сумма имеет место быть, если множества 0р ..., &т не пусты, конечны или счетны.
В противном случае вместо суммы появится интеграл.В связи с тем что игрок Рк знает свой тип 0*, математическое ожидание является условным по этому типу. Поскольку условные вероятности в общем случае рассчитываются по формуле Байеса, постольку атрибутом игры и далее равновесия является термин «байесовский».
Кратко статическую байесовскую игру можно записать так:
икШ> в), е„/*в)>.
Таким образом, для описания статической байесовской игры необходимо иметь: 1) множество всех игроков Р{9 ..., Рт'9 2) для каждого игрока Рк — множество 0^ всех его типов; 3) распределение вероятностей /;(8) на множествах 0р ©т типов, известное всем игрокам; 4) для каждого игрока Рк множество Бк его возможных ходов и множество функций преобразующих множество ©^ во множество аЗк ходов игрока Рк; 5) для каждого игрока Рк функцию ^($(8), 8) выигрыша на профиле $(8) = (лг1(в1),
•-'тЮ)-
Определение 9.8.1. Равновесие Нэша — Байеса статической байесовской игры (с конечным числом типов игроков) есть равновесие Нэша в «расширенной игре», в которой множество (чистых) стратегий каждого игрока Рк есть множество Як(@к) функций (отображений) из ©^ в к - 1,.... т, а в качестве выигрыша игрока Рк фигурирует его ожидаемый выигрыш.
Формально профиль $(8) = (^(8^, ..., $Л(8т)) (чистых) стратегий 5т(0т) называется равновесием Нэша — Байеса, если для каждого номера к,к=1,.... т, справедливы неравенства
для любых Бк е Бк.
Аналогично определяется равновесие Нэша — Байеса в смешанных стратегиях.
Замечание 9.8.1. В статической байесовской игре вместо одного игрока Рк, к = 1, .... т, вводится множество его типов 0^, что фактически резко увеличивает число игроков. Однако множество ходов (стратегий) каждого игрока остается неизменным.
В связи с тем что каждый игрок Рк знает свой тип, а все другие игроки его тип не знают, другие игроки должны знать его ходы во всех случаях. Поэтому в качестве выигрыша игрока Рк предлагается использовать его ожидаемый выигрыш.Замечание 9.8.2. Понятие равновесие Нэша — Байеса было предложено Дж. Харшаньи в серии работ, опубликованных в 1967-1968 гг. (см. НакануИС. (1967-1968)).
Более точно равновесие Нэша — Байеса следовало бы назвать байесовским равновесием Нэша, а еще более точно (и справедливо) — байесовским равновесием Харшаньи.
9.8.2. Пример 9.8.1. Модель дуополии Курно как статическая игра с неполной информацией.
Обозначим символом б. выпуск фирмы /].,/= 1, 2, в некотором фиксированном периоде времени. Функция, обратная к функции спроса, имеет вид р = а- Ь(зх + $2), где а и Ъ — положительные параметры. Прибыль РЯ{ фирмы имеет вид
РК^ргс?гЛ1% (9.8.1)
где с. = А/С. — предельные издержки, а = /Г. — постоянные издержки фирмы
Фирма Рх имеет один тип предпочтения, а фирма — два типа предпочтения. Типы в^ характеризуются величиной с^ предельных издержек, т.е. 02№ = = 1, 2. Следовательно, предельные издержки с1 фирмы неизменны. То есть предельные издержки с1 фирмы принимают с1 с вероятностью единица, а предельные издержки с2 фирмы принимают значение с2(1) с вероятностью рх (рх > 0) (это тип один фирмы Р2) и значение с2 с вероятностью 1 — рх (это тип два фирмы Р2). Содержательно это интерпретируется следующим образом.
Фирма Р2 имеет полную информацию о фирме Р{, поэтому предельные издержки с1 неизменны. Фирма ^ полагает, что фирма Е2 имеет предельные издержки С2(1) с вероятностью р{9 а предельные издержки с2(2) — с вероятностью дх = \-рх.
Прибыль РЯ. фирмы есть выигрыш и. фирмы которая рассматривается в качестве игрока Р., /=1,2. Игроки Р{ и Р2 ходы делают одновременно, т.е. фирмы Р{ и Р2 выпускают свою продукцию, не зная о выпусках друг друга.
Покажем, что мы имеем дело со статической байесовской игрой.
1. Число игроков равно двум. Игроком Рх является фирма игроком Р2 — фирма Р2.
2. Для игрока Р{ множество ©1 = С{ его типов состоит из одного элемента — предельных издержек 01 = с1 фирмы Рх, которые являются неизменными. Для игрока Р2 множество ©2 = С2 его типов состоит из двух элементов: предельных издержек с2(1) и предельных издержек с2(2) фирмы Р2.
3. Распределение вероятностей на множестве С= С1 х С2 типов (Ср с2) игроков Р{ и Р2 имеет вид
с | (с„с2(1>) | (С„С2) |
р | Р\ | 1-1». |
т.е. случайная величина С принимает значение (ср с2(1)) с вероятностью />р а значение (ср с2(2)) — с вероятностью дх = 1 -рх. |
4. Для игрока Рх множество 5,(0,) = ^(С,) функций 5,(0,) = = $,(с,) состоит из функции равной объему выпуска фирмы Рх при предельных издержках су Для ифока Р2 множество 52(0,) = = 52(С») функций состоит из $2(с2), таких, что $2(1) = ^(с^) и ^ = = т.е. 52(1) есть выпуск фирмы Р2 при предельных издержках
а — выпуск фирмы Р2 при предельных издержках
Следовательно, набор 5 стратегий и ифоков Р, и Р2 имеет
ВИД5=(51,52(1),5^2)).
5. Для ифока рх функция ожидаемого выигрыша имеет вид прибыли ря{ фирмы ру
= 1а - + - =
= />,!_* - 6(5, + 52(1))5, - с,5, - ,, аналогично выпуск 52(2) с вероятностью поэтому фирме Рх естественно ориентироваться на ожидаемый выпуск + ^22) фирмы Р2, который и был включен в формулу прибыли фирмы Р{
РЛХ = (а - Ь(8Х + />Л(1) + ))5, - с, вместо объема
Последнее (четвертое) звено цепочки (9.8.2) следует обосновать так.
Прибыль фирмы Рх есть ее ожидаемая прибыль, которая равна произведению прибыли фирмы Рх
(при условии, что выпуск фирмы Р2 равен 52(1)) и вероятности рх того, что фирма Р2 будет иметь выпуск $2(1', плюс аналогичное произведение прибыли фирмы Рх
(при условии, что выпуск фирмы Е2 равен $2(2)) и вероятности того, что фирма Р2 будет иметь выпуск $2(2).
Для игрока Pv который знает свой тип, функция U2(s) имеет
вид
U2(s) = PR2(sv s2)= (а - b(s{ + s2))s2 - c^2 -dr Если предельные издержки фирмы F2 равны то мы имеем первый тип фирмы Р2. В этом случае
U2(s) = PR2(sv 0) = (а - b(sx + 52(1)» *2(1) - с}" s. «> - dr
Если предельные издержки фирмы F2 равны с2(2), то мы имеем второй тип фирмы Fr В этом случае
U2(s) = PR2(sv 0, s™) = (а- b(Sl + *2(2)» *2(2) - с2 (986)
Подставив (9.8.4) и (9.8.5) в выражение (9.8.6), получим соответственно
о0> = 2Д-(3+Д)С^1)-^2) + 2С1 (9 8 ?)
6Ь '
о(2> = 2д - (3+дх - /^с^ + 2сх (9 8 8)
6Ь
Набор (9.8.6), (9.8.7) и (9.8.8.) представляет собой равновесие Нэша — Байеса (в чистых стратегиях) дуополии Курно как статической байесовской игры.
Прирх = 1 (^ = 0) и с1 = с2(1) формулы (9.8.6) и (9.8.7) дают классическое равновесие Нэша дуополии Курно
о а—сх о а—
= ' , 32 =
ЗА ЗА
Аналогично при р{ = 0 (^ = 1) и с1 = с2(2) формулы (9.8.6) и (9.8.8) дают классическое равновесие Нэша дуополии Курно
о а—сх о а—сА
51=~й> 32-зГ
9.8.3. Пример 9.8.2 (A. Mas-Colell, M.D. Winston, J.R. Green (1995)).
Рассмотрим сначала хорошо известную биматричную игру «Дилемма заключенных» (в этом примере 9.8.2 игру 1), задаваемую табл. 9.12 (у разных авторов фигурируют разные цифры).
Таблица 9.12
|
Здесь и далее в этом примере буквы «П» и «НП» означают соответственно «Признаться», «Не признаться».
Содержательная интерпретация клеток 1—4 табл. 9.12 хорошо известна. Если оба заключенных не признаются, их выпускают на свободу через два года, приписав им не слишком серьезное правонарушение в целях оправдания их задержания на время ведения следствия. Если заключенный 1 признается, а заключенный 2 не признается (клетка 3), то заключенного 1 отпускают на свободу через один год. Заключенному 2 дают большой срок, равный 9 годам. Клетка 2 интерпретируется аналогично. Если оба заключенных признаются, им сокращают срок за признание и обоих отпускают на свободу через 4 года.
Модификацию игры 1 представляет игра «Брат следователя» (в этом примере игра 2), задаваемая табл. 9.13.
Таблица 9.13
|
В игре 2 клетки со второй по четвертую интерпретируются так же, как и в игре 1. Клетка первая в табл. 9.13 интерпретируется так. Заключенный 1 является братом следователя, который ведет дело этих заключенных. Если заключенные оба не признаются, то следователь отпустит заключенного 1 на свободу. Как и в игре 1, в игре 2 равновесие Нэша образуют стратегии (П, П).
Рассмотрим модификацию игра «Брат следователя» (в этом примере игра 3), задаваемую табл. 9.14.
Таблица 9.14
|
В игре 3 клетки первая и третья такие же, как и в (предыдущей) игре 2. Клетки вторая и четвертая интерпретируются так, что заключенный 2, признаваясь (П), хочет задержаться в тюрьме дополнительно еще на 6 лет (в случае клетки 2: -1 — 6 = -7, в случае клетки 4: —4 — 6 = —10), чтобы, например, исповедоваться тюремному священнику. Возможно, такое желание у заключенного 2 появилось в связи с некоторым душевным расстройством. В игре 3 равновесие Нэша образуют стратегии (НП, НП).
В игре 4 игрок Р{ имеет один тип предпочтений, игрок Р2 — два типа предпочтений. Формально единственный тип игрока Р{ характеризуется его матрицей выигрышей
4°. :)•
которая одна и та же в табл. 9.13 и 9.14. Это обстоятельство интерпретируется так: игрок Р2 имеет полную информацию о предпочтениях игрока Р{.
Первый и второй типы игрока Р2 характеризуются двумя его матрицами выигрыша
*1= _9 ^ -10
которые следует выписать из табл. 9.13 и 9.14 соответственно.
Игрок Р2 имеет первый тип предпочтений с вероятностью />р а второй тип предпочтений с вероятностью дх = 1 — рх, т.е. игрок Рх полагает, что с вероятностью рх игрок Р2 имеет первый тип предпочтений, с вероятностью д{ игрок Р2 имеет второй тип предпочтений. Строгое толкование первого и второго типов предпочтений игрока Р2 дается ниже.
Игра 4 в нормальной форме представлена в виде табл. 9.15.
Таблица 9.15
|