прийняття рішень РОЗДІЛ 12 за допомогою матричних ігор 12.1. Матрична парна гра

Розглянемо антагоністичну парну скінченну матричну гру з нульовою сумою, в якій два гравця А і В. Інтереси гравців А і В прямо протилежні: один гравець виграє те, що програє другий. Такий підхід дозволяє вказувати тільки виграш одного гравця. Домовимося, що гравець А прагне збільшити свій виграш, а гравець В - зменшити свій програш.

Нехай гравець А має m стратегій (А1, A2,..., Am), а гравець В n стратегій (B1,B2,...,Bn). В результаті застосування гравцем А стратегії А і гравцем В стратегії Bj однозначно визначається результат гри йу - це сума яку виграє гравець А і програє гравець В.

Гру вважають заданою, якщо відомі всі значення йу , які записують у вигляді матриці, яку називають платіжною матрицею, і яку представлено в табл. 12.1. Це матрична гра, яка має розмірність m X n.

Таблиця 12.1

Платіжна матриця гри m X n

 

Bi

B2

 

Bn

А

й11

й12

 

й1п

А2

й21

й22

 

a2n

 

 

 

 

 

Am

am1

am 2

 

^тп

Рядки таблиці 12.1 відповідають стратегіям гравця А, а стовпці - гравця В.

Платіжну матрицю гри також можна представити у вигляді матриці (12.1):

(12.1)

V. ami

Платіжна матриця представляє собою табличний запис функції виграшу матричної гри. Партія в матричній грі реалізується так: гравець А вибирає один з рядків платіжної матриці (одну зі своїх стратегій). Гравець В, не знаючи вибору гравця А, вибирає один зі стовпчиків платіжної матриці (одну зі своїх стратегій). Елемент матиці, якій стоїть на перетині рядка і стовпця, що вибрані, визначає виграш гравця А і програш гравця В.

Ціль гравців полягає у виборі таких стратегій, при застосуванні яких гравець А має максимальний виграш, а гравець В мінімальний програш. В теорії ігор виходять з того, що кожний гравець вважає свого пробника розумним і таким, що прагне помішати йому отримати найкращій результат.

Гра називається приведеною до нормальної форми, якщо вона записана у вигляді матриці.

Будь-яка скінченна гра може бути зведена до нормальної форми.

m2

Для того, щоб розв'язати гру потрібно вказати оптимальні стратегії для кожного гравця.

Головний принцип теорії антагоністичних ігор полягає в тому, що гравцю слід вибирати свою поведінку таким чином, щоб вона була розрахована на найгірший для нього характер дій противника.

Приклад 12.1. Гравець А вибирає одну з двох сторін монети. Гравець В, не знаючи вибору гравця А, також вибирає одну з сторін монети. Після вибору обору обох гравців, гравець В платить гравцю А 1 грн., якщо сторони співпали і гравець А платить гравцю В 1 грн. у протилежному випадку. Гравець А прагне збільшити свій виграш, гравець В - зменшити свій програш. Побудувати платіжну матрицю гри для гравця

Розв  Гравець А має дві стратегії (A1, A2), де A1 - об

рано сторону монети з зображенням герба, A2 - обрано сторону монети з зображенням цифри. Гравець В також має дві стратегії (B1,B2), де В1 - обрано сторону монети з зображенням герба, В2 - обрано сторону монети з зображенням цифри.

В результаті застосування гравцем А стратегії A1 і гравцем В стратегії B1 , тобто обидва гравця оберуть сторону монети з зображенням герба, однозначно визначається результат гри аи =1, який представляє собою суму, яку виграє гравець А і програє гравець В (гравець А виграє 1 грн., а гравець В програє 1 грн.) Якщо гравець А буде застосовувати стратегію A1, а гравець В стратегію B2, то однозначно визначається результат гри а12 = -1, який означає, що гравець А програє 1 грн., а гравець В виграє 1 грн. З аналогічних міркувань отримаємо, що при застосуванні стратегій A2 і B1 , результат гри дорівнюватиме а21 = -1; а при застосуванні стратегій

A2 і B2 - а22 = 1.

Таким чином отримаємо платіжну матрицю у вигляді табл. 12.2.

Таблиця 12.2 Платіжна матриця гри про вибір сторони монети

 

B1

B2

4

1

-1

4

-1

1

Приклад 12.2. Нехай є дві фірми А і В, які торгують одним і тим же товаром, яки користується попитом впродовж п одиниць часу. Нехай s - доход від продажу товару в одиницю часу, причому продаж товару за зниженими цінами заборонено. Якість товару залежить від часу попадання його на ринок: чим пізніше товар попаде на ринок, тім вище його якість, причому реалізується товар більш високої якості. Фірма А прагне максимізувати свої доходи, фірма В прагне розорити фірму А, не піклуючись про свої доходи. З цією метою фірма В може використовувати як законний засіб лише момент попадання товару на ринок. Нехай i - момент попадання товару на ринок фірми А, j - момент попадання товару на ринок фірми В, вибір моментів - єдиноможливі управлінські рішення. Побудувати платіжну матрицю гри.

Розв  Якщо фірма А поставить товар на ринок в момент

(12.2)

(12.3)

часу i, а фірма В - в момент часу j , причому i < j , фірма А не буде мати конкурентів впродовж часу j — i і за цей період отримає доход: s(j — i). Починаючи з моменту часу j на ринку буде "свіжий" товар фірми В, тому з моменту часу j фірма А буде втрачати свій доход. Якщо i > j, тобто фірма В раніше поставляє свій товар на ринок, доход фірми А буде дорівнювати s(n +1 — i). Якщо фірми А і В одночасно поставлять товар, тобто i = j , то їхні товари будуть мати однаковий попит, і кожна з фірм А і В отримає доход, який буде дорівнювати s(n +1 — i) /2 . З наведених міркувань можна записати функцію виграшу фірми А, яка одночасно буде функцію програшу фірми А:

s( j — i), i < j V(i, j) = j s(n +1 — i)/2, i = j s(n +1 — i), i > j

Наприклад, п = 5, тоді, використовуючи формулу (12.2), отримаємо платіжну матрицю гри:

ґ 2,5 s s      2s      3 s     4 s "

4s      2s      s        2s      3s

3s      3s      1,5s   s        2s

2s      2s      2s      s s

s        s        s        s        0,5sy

На інтуїтивному рівні видно, що величину s можна опустити, тому платіжна матриця гри буде мати вигляд

(12.4)

2,5

1

2

3

4 >

4

2

1

2

3

3

3

1,5

1

2

2

2

2

1

1

1

1

1

1

0,5^