Продвинутые стратегии теории игр для принятия решений

Как играть на постфлопе www.ipokers.info (Ноябрь 2024)

Как играть на постфлопе www.ipokers.info (Ноябрь 2024)
Продвинутые стратегии теории игр для принятия решений

Оглавление:

Anonim

Теория игр, исследование стратегических решений, объединяет разрозненные дисциплины, такие как математика, психология и философия. Теория игр была изобретена Джоном фон Нейманом и Оскаром Моргенштерном в 1944 году и прошла долгий путь с тех пор. Важность теории игр для современного анализа и принятия решений может быть оценена тем, что с 1970 года до 12 ведущих экономистов и ученых были удостоены Нобелевской премии по экономическим наукам за их вклад в теорию игр.

Теория игр применяется в ряде областей, включая бизнес, финансы, экономику, политологию и психологию. Понимание стратегий теории игр - как популярных, так и некоторых относительно менее известных стратагемов - важно для повышения навыков мышления и принятия решений в сложном мире.

Дилемма заключенного - в двух словах

Одна из самых популярных и основных стратегий теории игр - это дилемма заключенного. В этой концепции рассматривается стратегия принятия решений, взятая двумя людьми, которые, действуя в своих собственных индивидуальных интересах, заканчивают худшие результаты, чем если бы они сотрудничали друг с другом в первую очередь.

В дилемме заключенного два подозреваемых, которые были задержаны за преступление, содержатся в отдельных комнатах и ​​не могут общаться друг с другом. Прокурор информирует каждого из них по отдельности, что если он (назовет его Подозревателем 1) признается и свидетельствует против другого, он может освободиться, но если он не будет сотрудничать, а Подозреваемый 2, Подозреваемый 1 будет приговорен к трем годам лишения свободы. Если оба признаются, они получат двухлетний срок, и, если они не признаются, они будут приговорены к одному году тюрьмы.

В то время как сотрудничество является лучшей стратегией для двух подозреваемых, столкнувшись с такой дилеммой, исследования показывают, что большинство разумных людей предпочитают признаваться и давать показания против другого человека, а не молчать и рисковать что другая сторона признается.

Стратегии игры

Дилемма заключенного закладывает основу для передовых стратегий теории игр, среди которых популярные:

Matching Pennies : игра с нулевой суммой, в которой участвуют два игрока (назовите их Player A и Player B), одновременно размещая копейки на столе, с выигрышем в зависимости от того, совпадают ли пенни. Если обе гроши - это головы или хвосты, игрок A выигрывает и удерживает пенни игрока B. Если они не совпадают, игрок B выигрывает и удерживает пенни игрока А.

Тупик : Это сценарий социальной дилеммы, такой как Дилемма заключенного в том, что два игрока могут либо сотрудничать, либо дефектировать (т.е.е. не сотрудничать). В тупике, если оба игрока A и Player B сотрудничают, каждый получает выигрыш в 1, и если оба они ошибаются, каждый получает выигрыш 2. Но если игрок A взаимодействует и дефекты игрока B, то A получает выигрыш от 0 и B получает выигрыш 3. В приведенной ниже схеме выигрыша первая цифра в ячейках (a) - (d) представляет выигрыш игрока A, а вторая цифра - в отношении игрока B:

Матрица выплат затвора < Игрок B

Сотрудник

Дефект

Игрок A

Сотрудничает

(a) 1, 1

(b) 0, 3

Дефект

(c) 3 , 0

(d) 2, 2

Тупик отличается от Дилеммы заключенного тем, что действие наибольшей взаимной выгоды (то есть как дефект) также является доминирующей стратегией. Доминирующая стратегия для игрока определяется как та, которая дает максимальный выигрыш любой доступной стратегии, независимо от стратегий, применяемых другими игроками.

Частым примером тупика является пример двух ядерных держав, пытающихся достичь соглашения об уничтожении своих арсеналов ядерных бомб. В этом случае сотрудничество подразумевает соблюдение соглашения, в то время как средство отступлений тайно отказывается от соглашения и сохраняет ядерный арсенал. К сожалению, лучшим результатом для любой нации является отказ от соглашения и сохранение ядерного варианта, в то время как другая нация уничтожает свой арсенал, поскольку это даст первому огромному скрытому преимуществу над последним, если между ними разразится война. Второй вариант заключается в том, чтобы обе они были дефекты или не сотрудничали, поскольку они сохраняют свой статус ядерных держав.

Конкурс Курно

: эта модель также концептуально похожа на дилемму заключенного и названа в честь французского математика Августина Курно, который представил его в 1838 году. Наиболее распространенное применение модели Курно заключается в описании дуополии или двух основных производителей на рынке. Например, предположим, что две компании A и B производят идентичный продукт и могут производить высокие или низкие количества. Если они оба будут сотрудничать и соглашаться производить на низких уровнях, то ограниченное предложение будет переводить на высокую цену на продукт на рынке и значительную прибыль для обеих компаний. С другой стороны, если они деформируются и производят на высоких уровнях, рынок будет завален и приведет к низкой цене на продукт и, следовательно, к снижению прибыли. Но если кто-то сотрудничает (т. Е. Производит на низких уровнях) и других дефектах (т. Е. Скрытно производит на высоких уровнях), то первый просто ломается, даже если последний получает прибыль, которая выше, чем если бы они оба сотрудничали.

Показана матрица выплат для компаний A и B (цифры представляют собой прибыль в миллионах долларов). Таким образом, если A взаимодействует и производит на низких уровнях в то время как дефекты B и производит на высоких уровнях, выигрыш проявляется в ячейке (b) - безубыточность для компании A и 7 миллионов долларов прибыли для компании B.

Cournot Payoff Матрица

Компания B

Сотрудничество

Дефект

Компания A

Сотрудничество

(a) 4, 4

(b) 0, 7

Дефект

(c ) 7, 0

(d) 2, 2

Координация

: По согласованию игроки получают более высокие выигрыши, когда они выбирают один и тот же курс действий. В качестве примера рассмотрим два технологических гиганта, которые решают между внедрением радикальной новой технологии в чипы памяти, которая может принести им сотни миллионов прибыли или пересмотренную версию более старой технологии, которая принесла бы им гораздо меньше. Если только одна компания решит перейти к новой технологии, принятие рынком потребителей будет значительно ниже, и в результате она будет зарабатывать меньше, чем если обе компании решат тот же курс действий. Матрица выплат показана ниже (цифры представляют прибыль в миллионах долларов).

Таким образом, если обе компании решат внедрить новую технологию, они будут зарабатывать 600 миллионов долларов за штуку, в то время как введение пересмотренной версии более старой технологии принесет им 300 миллионов долларов каждый, как показано в ячейке (d). Но если компания A решит в одиночку внедрить новую технологию, она будет зарабатывать только 150 миллионов долларов, хотя компания B будет зарабатывать $ 0 (предположительно потому, что потребители могут не желать платить за свою устаревшую технологию). В этом случае для обеих компаний имеет смысл работать вместе, а не самостоятельно.

Координационная матрица выплат

Компания B

Новая технология

Старая технология

Компания A

Новые технологии

(a) 600, 600

(b) 0, 150 < Старая техника

(c) 150, 0

(d) 300, 300

Игра в многоножки

: Это игра с обширной формой, в которой два игрока поочередно получают шанс взять больше доля медленно растущего денежного запаса. Игра «Многоножка» является последовательной, поскольку игроки делают свои движения один за другим, а не одновременно; каждый игрок также знает стратегии, выбранные игроками, которые играли перед ними. Игра заканчивается, как только игрок берет тайник, при этом игрок получает большую часть, а другой игрок получает меньшую часть.

В качестве примера, если игрок A и игрок B играют в игру «Многоножка», предположите, что игрок A идет первым и должен решить, должен ли он «взять» или «передать» тайник, который в настоящее время составляет 2 доллара. Если он берет, то A и B получают по 1 доллар каждый, но если A проходит, то решение «Take or Pass» теперь должно быть сделано игроком B. Если B берет, она получает 3 доллара (т. Е. Предыдущий тираж $ 2 + $ 1 ) и A получает $ 0. Но если B проходит, A теперь получает решение, принимать или передавать, и так далее. Если оба игрока всегда предпочитают проходить, каждый игрок получает выигрыш в размере 100 долларов в конце игры. Точка игры состоит в том, что если A и B взаимодействуют и «проходят» до конца игры, они получают максимальный выигрыш в размере 100 долларов США каждый. Но если они не доверяют другому игроку и ожидают, что они «примут» при первой возможности, то равновесие Нэша предсказывает, что игроки возьмут минимально возможное требование (в этом случае 1 доллар США). Экспериментальные исследования показали, однако, что это «рациональное» поведение (как и было предсказано теорией игр) редко проявляется в реальной жизни. Это не интуитивно удивительно, учитывая малый размер первоначальной выплаты по отношению к последней. Подобное поведение экспериментальных испытуемых также проявилось в дилемме путешественника.

Дилемма путешественника

: Это игра, отличная от нуля, в которой оба игрока пытаются максимизировать свою собственную прибыль без учета другой. Разработанный экономистом Каушиком Басу в 1994 году, в дилемме путешественника, авиакомпания соглашается выплатить двум путешественникам компенсацию за ущерб, нанесенный одинаковым предметам. Тем не менее, двум путешественникам требуется отдельно для оценки стоимости предмета, как минимум, 2 доллара США и максимум 100 долларов США. Если оба запишут одинаковое значение, авиакомпания возместит каждому из них такую ​​сумму. Но если значения отличаются, авиакомпания будет платить им более низкое значение с бонусом в размере 2 долларов для путешественника, который записал это более низкое значение и штраф в размере 2 долларов для путешественника, который записал более высокую стоимость.

Уровень равновесия Нэша, основанный на обратной индукции, составляет 2 доллара в этом сценарии. Но, как и в игре «Многоножка», лабораторные эксперименты последовательно демонстрируют, что большинство участников - наивно или иначе - выбирают номер намного выше, чем 2 доллара. Дилемма путешественника может применяться для анализа различных ситуаций в реальной жизни. Например, процесс обратной индукции может помочь объяснить, как две компании, участвующие в борьбе с жестокостью, могут неуклонно снижать цены на продукты ниже, чтобы получить долю на рынке, что может привести к тому, что они будут все больше увеличивать потери в этом процессе.

Дополнительные стратегии теории игр

Битва полов

: Это еще одна форма координационной игры, описанная ранее, но с некоторыми асимметриями выигрыша. По сути, это пара, пытающаяся согласовать свой вечер. В то время как они согласились встретиться либо в игре с мячом (предпочтение мужчины), либо в пьесе (предпочтение женщины), они забыли, что они решили, и чтобы усугубить проблему, не могут общаться друг с другом. Куда они должны идти? Матрица выплат показана, как показано - цифры в ячейках представляют собой относительную степень удовольствия от события для женщины и человека соответственно. Например, ячейка (а) представляет собой выигрыш (с точки зрения уровней удовольствия) для женщины и человека, соответственно, в пьесе (она пользуется им гораздо больше, чем он). Cell (d) - это выигрыш, если оба игрока попадают в игру с мячом (он пользуется им больше, чем она). Ячейка (c) представляет собой неудовлетворенность, если оба идут не только к неправильному местоположению, но также к тому событию, в котором они наименее наслаждаются - женщине в игре с мячом и мужчине в игру.

Битва за подиум Матрица Человек

Играть

Игра в мяч

Женщина

Играть

(a) 6, 3

(b) 2, 2 > Игра в мяч

(c) 0, 0

(d) 3, 6

Игра диктатора

: Это простая игра, в которой игрок A должен решить, как разделить денежный приз с игроком B , который не имеет никакого отношения к решению игрока A. Хотя это не стратегия стратегии игры

per se

, она действительно дает некоторые интересные идеи в поведении людей. Эксперименты показывают, что около 50% сохраняют все деньги для себя; 5% разделили его одинаково, а остальные 45% дали другому участнику меньшую долю. Игра диктатора тесно связана с игрой ультиматума, в которой игроку А предоставляется заданная сумма денег, часть которой должна быть предоставлена ​​игроку B, который может принять или отклонить указанную сумму.Уловка заключается в том, что если второй игрок отклоняет предложенную сумму, то и А, и В ничего не получают. Игры диктатора и ультиматума содержат важные уроки для таких вопросов, как благотворительная помощь и благотворительность. Peace-War : Вариант дилеммы заключенного, в котором решения «Сотрудничество или Дефект» заменяются «Миром или войной». «Аналогами могут быть две компании, участвующие в ценовой войне. Если оба воздерживаются от снижения цен, они пользуются относительным благосостоянием (ячейка а), но ценовая война резко сократит выплаты (ячейка d). Однако, если A участвует в ценовом сокращении (войне), но B не делает этого, у A будет более высокий выигрыш в 4 раза, так как он может привлечь значительную долю на рынке, и этот более высокий объем компенсирует более низкие цены на продукцию. Матрица выплат во время войны

Компания B Мир

Война

Компания A

Мир

(a) 3, 3

(b) 0, 4 > Война

(c) 4, 0

(d) 1, 1

Дилемма добровольца

: В дилемме добровольца кто-то должен взять на себя труд или работу для общего блага. Наихудший возможный результат реализуется, если никто не добровольно. Например, рассмотрите компанию, в которой бухгалтерия мошенничает, но высшее руководство не знает об этом. Некоторые младшие сотрудники бухгалтерии знают о мошенничестве, но стесняются сообщать руководству, потому что это приведет к тому, что сотрудники, участвующие в мошенничестве, будут уволены и, скорее всего, будут преследоваться по закону. Быть помеченным как «осведомитель» может также иметь некоторые последствия вниз по линии. Но если никто не добровольно, крупномасштабное мошенничество может привести к банкротству компании и потере работы каждого человека.

The Bottom Line

Теория игр может использоваться очень эффективно как инструмент для принятия решений, будь то в экономической, деловой или личной обстановке.