Рівновага по Нешу. Теорія ігор для економістів (Джон Неш)

Рівновага по Нешу. Теорія ігор для економістів (Джон Неш)

У 1930-ті роки Джон фон Нейман і Оскар Моргенштерн стали засновниками нового цікавого напряму математики, який отримав назву «» теорія ігор «». У 1950-ті роки цим напрямком зацікавився молодий математик Джон Неш. Теорія рівноваги стала темою його дисертації, яку він написав, будучи у віці 21 рік. Так народилася нова стратегія ігор під назвою «Рівновага за Нешем», яка заслужила Нобелівську премію через багато років - у 1994 році.

Довгий розрив між написанням дисертації і загальним визнанням став випробуванням для математика. Геніальність без визнання вилилася в серйозні ментальні порушення, але і це завдання Джон Неш зміг вирішити завдяки прекрасному логічному розуму. Його теорія «» рівновага за Нешем «» удостоїлася премії Нобеля, а його життя екранізації у фільмі «Beautiful mind» («Ігри розуму»).


Коротко про теорію ігор

Оскільки теорія рівноваги Неша пояснює поведінку людей в умовах взаємодії, тому варто розглянути основні поняття теорії ігор.

Теорія ігор вивчає поведінку учасників (агентів) в умовах взаємодії один з одним за типом гри, коли результат залежить від рішення і поведінки декількох людей. Учасник приймає рішення, керуючись своїми прогнозами щодо поведінки інших, що і називається ігровою стратегією.

Існує також домінуюча стратегія, при якій учасник отримує оптимальний результат при будь-якій поведінці інших учасників. Це найкраща безпрограшна стратегія гравця.

Дилема ув "язненого та науковий прорив

Дилема ув'язненого - це випадок з грою, коли учасники змушені приймати раціональні рішення, досягаючи спільної мети в умові конфлікту альтернатив. Питання полягає в тому, який з цих варіантів він обере, усвідомлюючи особистий і загальний інтерес, а також неможливість отримати і те, і інше. Гравці немов укладені в жорсткі ігрові умови, що часом змушує їх мислити дуже продуктивно.

Цю дилему досліджував американський математик Джон Неш. Рівновага, яку він вивів, стала революційною у своєму роді. Особливо яскраво ця нова думка вплинула на думку економістів про те, як роблять вибір гравці ринку, враховуючи інтереси інших, при щільній взаємодії і перетині інтересів.

Найкраще вивчати теорію ігор на конкретних прикладах, оскільки сама ця математична дисципліна не є сухо-теоретичною.


Приклад дилеми в "язня

Приклад, двоє людей скоїли грабіж, потрапили в руки поліції і проходять допит в окремих камерах. При цьому служителі поліції пропонують кожному учаснику вигідні умови, за яких він вийде на свободу в разі надання свідчень проти свого напарника. У кожного зі злочинців існує наступний набір стратегій, які він буде розглядати:

  1. Обидва одночасно дають свідчення і отримують по 2,5 роки у в'язниці.
  2. Обидва одночасно мовчать і отримують по 1 року, оскільки в такому випадку доказова база їх провини буде мала.
  3. Один дає свідчення і отримує свободу, а інший мовчить і отримує 5 років в'язниці.

Очевидно, що результат справи залежить від рішення обох учасників, але змовитися вони не можуть, оскільки сидять у різних камерах. Також яскраво видно конфлікт їхніх особистих інтересів у боротьбі за спільний інтерес. У кожного з ув'язнених є два варіанти дій і 4 варіанти результатів.

Ланцюг логічних умовиводів

Отже, злочинець А розглядає такі варіанти:

  1. Я мовчу і мовчить мій напарник - ми обидва отримаємо по 1 року в'язниці.
  2. Я здаю напарника і він здає мене - ми обидва отримаємо по 2,5 роки в'язниці.
  3. Я мовчу, а напарник мене здає - я отримаю 5 років в'язниці, а він свободу.
  4. Я здаю напарника, а він мовчить - я отримую свободу, а він 5 років в'язниці.

Наведемо матрицю можливих рішень і результатів для наочності.

Таблиця ймовірних результатів дилеми укладеного.

Питання полягає в тому, що обере кожен учасник?

«Мовчати, не можна говорити» або «мовчати не можна, говорити»

Щоб зрозуміти вибір учасника, потрібно пройти по ланцюжку його роздумів. Дотримуючись міркувань злочинця А: якщо я промовчу і промовчить мій напарник, ми отримаємо мінімум терміну (1 рік), але я не можу дізнатися, як він себе поведе. Якщо він дасть свідчення проти мене, то мені також краще дати свідчення, інакше я можу сісти на 5 років. Краще мені сісти на 2,5 роки, ніж на 5 років. Якщо він промовчить, то мені тим більше потрібно дати свідчення, оскільки так я отримаю свободу. Точно так само міркує і учасник B.


Неважко зрозуміти, що домінуюча стратегія для кожного зі злочинців - це дача свідчень. Оптимальна точка цієї гри настає тоді, коли обидва злочинці дають свідчення і отримують свій «приз» - 2,5 роки в'язниці. Теорія ігор Неша називає це рівновагою.

Неоптимальне оптимальне рішення щодо Неша

Революційність нешевського погляду в тому, що така рівновага не є оптимальною, якщо розглянути окремого учасника і його особистий інтерес. Адже найкращий варіант - це промовчати і вийти на свободу.

Рівновага щодо Неша - це точка дотику інтересів, де кожен учасник обирає такий варіант, який для нього оптимальний лише за умови, що інші учасники обирають певну стратегію.

Розглядаючи варіант, коли обидва злочинці мовчать і отримують всього по 1 року, можна назвати нього Парето-оптимальним варіантом. Однак він можливий, тільки якщо злочинці змогли б змовитися заздалегідь. Але навіть це не гарантувало б цього результату, оскільки спокуса відступити від вмовляння і уникнути покарання велика. Відсутність повної довіри один до одного і небезпека отримати 5 років змушує вибрати варіант з визнанням. Розмірковувати про те, що учасники будуть дотримуватися варіанту з мовчанням, діючи узгоджено, просто нераціонально. Такий висновок можна зробити, якщо вивчати рівновагу Неша. Приклади тільки доводять правоту.

Егоїстично чи раціонально

Теорія рівноваги Неша дала приголомшливі висновки, що спростували існуючі до цього принципи. Наприклад, Адам Сміт розглядав поведінку кожного з учасників як абсолютно егоїстичну, що і приводило систему в рівновагу. Ця теорія мала назву «невидима рука ринку».


Джон Неш побачив, що якщо всі учасники будуть діяти, переслідуючи тільки свої інтереси, то це ніколи не призведе до оптимального групового результату. Враховуючи, що раціональне мислення притаманне кожному учаснику, більш імовірний вибір, який пропонує стратегія рівноваги Неша.

Чисто чоловічий експеримент

Яскравим прикладом може служити гра «парадокс блондинки», яка хоча і здається недоречною, але є яскравою ілюстрацією, що показує, як працює теорія ігор Неша.

У цій грі потрібно уявити, що компанія вільних хлопців прийшла в бар. Поруч виявляється компанія дівчат, одна з яких краща за інших, скажімо блондинка. Як хлопцям повести себе, щоб отримати найкращу подругу для себе?

Отже, міркування хлопців: якщо всі почнуть знайомитися з блондинкою, то, швидше за все, вона нікому не дістанеться, тоді і її подруги не захочуть знайомства. Ніхто не хоче бути другим запасним варіантом. Але якщо хлопці оберуть уникати блондинку, то ймовірність кожному з хлопців знайти серед дівчат хорошу подругу висока.

Ситуація рівноваги по Нешу неоптимальна для хлопців, оскільки, переслідуючи лише свої егоїстичні інтереси, кожен вибрав би саме блондинку. Видно, що переслідування тільки егоїстичних інтересів буде рівнозначно краху групових інтересів. Рівновага по Нешу означатиме те, що кожен хлопець діє у своїх особистих інтересах, які стикаються з інтересами всієї групи. Це неоптимальний варіант для кожного особисто, але оптимальний для кожного, виходячи із загальної стратегії успіху.


Все наше життя гра

Прийняття рішень в реальних умовах дуже нагадує гру, коли ви очікуєте певної раціональної поведінки і від інших учасників. У бізнесі, в роботі, в колективі, в компанії і навіть у відносинах з протилежною підлогою. Від великих угод і до звичайних життєвих ситуацій все підпорядковується тому чи іншому закону.

Звичайно, розглянуті ігрові ситуації зі злочинцями і баром - це всього лише відмінні ілюстрації, що демонструють рівновагу Неша. Приклади таких дилем дуже часто виникають на реальному ринку, а особливо це працює у випадках з двома монополістами, які контролюють ринок.

Змішані стратегії

Часто ми втягуємося не в одну, а відразу в кілька ігор. Вибираючи один з варіантів однієї гри, керуючись раціональною стратегією, але потрапляєте в іншу гру. Після декількох раціональних рішень ви можете виявити, що ваш результат вас не влаштовує. Що ж робити?

Розглянемо два види стратегії:

  • Чиста стратегія - це поведінка учасника, яка виходить з роздумів над можливою поведінкою інших учасників.
  • Змішана стратегія або випадкова стратегія - це чергування чистих стратегій випадковим чином або вибір чистої стратегії з певною ймовірністю. Таку стратегію ще називають рендомізованою.

Розглядаючи таку поведінку, ми отримуємо новий погляд на рівновагу по Нешу. Якщо раніше говорилося про те, що гравець вибирає стратегію один раз, то можна уявити й іншу поведінку. Можна допустити той варіант, що гравці вибирають стратегію випадково з певною ймовірністю. Ігри, в яких не можна знайти рівноваги Неша в чистих стратегіях, завжди мають їх у змішаних.


Рівновага Неша в змішаних стратегіях називається змішаною рівновагою. Це така рівновага, де кожен учасник обирає оптимальну частоту вибору своїх стратегій за умови, що інші учасники обирають свої стратегії із заданою частотою.

Пенальті і змішана стратегія

Приклад змішаної стратегії можна привести в грі в футбол. Найкраща ілюстрація змішаної стратегії - це, мабуть, серія пенальті. Так, у нас є воротар, який може стрибнути тільки в один кут, і гравець, який буде бити пенальті.

Отже, якщо в перший раз гравець обере стратегію зробити удар в лівий кут, а воротар також впаде в цей кут і зловить м'яч, то як можуть розвиватися події вдруге? Якщо гравець буде бити в протилежний кут, це, швидше за все, занадто очевидно, але і удар в той же кут не менш очевидний. Тому і воротареві, і б'є нічого не залишається, як покластися на випадковий вибір.

Так, чергуючи випадковий вибір з певною чистою стратегією, гравець і воротар намагаються отримати максимальний результат.

Image

Publish modules to the "offcanvas" position.