3.6. Прийняття рішень в умовах часткової невизначеності

Якщо при ухваленні рішення ОПР відомі ймовірності Pj станів Пj, то будемо вважати, що розглядається ситуація в умовах часткової невизначеності.

Гравець приймає i -те рішення (використовувати стратегію ) в умовах часткової невизначеності. Він очікує отримати доход

70     

qv при реалізації стану Пj, який є випадковою величиною з рядом розподілу, що представлено в табл. 3.9.

Таблиця 3.9

Ряд розподілу випадкової величини Q

Q>

q,i

q 2

 

q,n

p

Pi

Pi

 

Pn

У цьому випадку для прийняття рішення можна використовувати один з наступних критеріїв.

3.6.1. Критерій Байєса

Це критерій максимізації середнього очікуваного доходу. Критерій Байєса називається також критерієм максимуму середнього виграшу.

Як відомо, математичне очікування M(Q) випадкової величини Qt представляє собою середній очікуваний дохід, який позначається також можна знайти за формулою (3.21):

n

M(Q,) = ХqPj.       (3.21)

j =1

Для кожної стратегії Аі (i -го варіанта рішення) слід розрахувати середній очікуваний дохід (математичне очікування) за формулою (3.21), і відповідно до критерію Байєса слід вибирати варіант (стратегію А ), для якого досягається найбільше значення:

n

max M(Q ) = max ^qljpj .        (3.22)

j =1

Критерій Байєса використовують в ситуації, в якій приймається рішення, що задовальняє наступним умовам:

ймовірність появи стану Пj відома і не залежить від часу; ухвалене рішення теоретично допускає нескінчену велику кількість реалізацій;

допускається певний ризик при малих числах реалізацій.

Приклад 3.8. Для гри, яку задано матрицею виграшів у

1 2

прикладі 3.2, відомі ймовірності станів П, р1 =— , р2 =— ,

j 8 8

3 1 1 р3 = — , р4 = —, р5 = — . За критерієм Байєса з'ясувати при якому 8 8 8

варіанті рішення досягається найбільший середній дохід і яка величина цього доходу.

Розв' язання. Запишемо матрицю виграшів з додатковим рядком з ймовірностями станів Пj у вигляді таблиці 3.10.

Таблиця 3.10

Матриця виграшів гри

 

П1

П2

П3

П4

П5

4

2

5

4

3

2

4

5

7

2

1

8

Аз

8

3

7

9

4

4

6

1

8

3

3

 

1

2

3

1

1

Pi

8

8

8

8

8

Знайдемо для кожної стратегії А середній очікуваний дохід за формулою (3.21):

. „ 1.2, 3,1,1 29 M(Q.) = 2 — + 5—+4 — + 3 •- + 2 — = —;

8 8 8 8 8 8

1 2 3 1 1 29 M(Q2) = 5 •1 + 7 •2+2 •3 +1-1 + 8 •1 = 29;

2 8 8 8 8 8 8

M(Q3) = 8 •1+3 •2 + 7 •3 + 9 •1 + 4 •1 = — ;

8 8 8 8 8 8

M(Q4) = 6 •1 +12+8 •3+3 •1 + 3 •1 = 38.

8 8 8 8 8 8

.„ .     46 .

Максимальний середній очікуваний дохід дорівнює — і відповідає стратегії А3 .      8

Ряд розподілу випадкової величини R

При застосуванні стратегії ОПР може отримати доход, який відрізняється від максимального, що й приймається за величину ризику. Ризик є випадковою величиною R з рядом розподілу, який наведено в табл. 3.11.

Таблиця 3.11

R

r 1

Г 2

• • •

rin

P

P1

Pi

• • •

Pn

Математичне очікування M(R) випадкової величини R і є середній очікуваний ризик, який позначається також Ri :

n

M(Ri) = £W .        (3.23)

j=1

Для кожної стратегії А (і -го варіанта рішення) слід розрахувати середній очікуваний ризик (математичне очікування) за формулою (3.23), і відповідно до критерію Байєса слід вибирати варіант, для якого досягається найменше значення:

minM(Ri) = min^rvPs .  (3.24)

j=1

В цьому випадку критерій Байєса виступає як критерій мінімізації середнього очікуваного ризику. Критерій Байєса можна назвати як критерій мінімуму середнього програшу.

Приклад 3.9. Для вихідних даних прикладу 3.8 на основі матриці ризиків за критерієм Байєса з'ясувати, при якому варіанті рішення досягається найменший середній ризик і яка величина цього ризику.

Розв  Запишемо матрицю ризиків гри з додатковим

Матриця ризиків гри

рядком з ймовірностями станів Пj у вигляді таблиці 3.12.

Таблиця 3.12

 

пх

П2

П3

П4

П5

А

6

2

4

6

6

А

3

0

6

8

0

А

0

4

1

0

4

А

2

6

0

6

5

 

1

2

3

1

1

Pi

8

8

8

8

8

Знайдемо для кожної стратегії а, середній очікуваний ризик за формулою (3.23):

1 2 3 1 1 34 M(R) = 6 •- + 2 — + 4 •- + 6 •- + 6 •- = — ; 8 8 8 8 8 8

1 2 3 1 1 29 M(R) = 3 — + 0—+6 •-+8 •- + 0 •- = — ;

M(R ) = 0 •1+4 •2 +1-- + 0 •1 + 4 •1 =15 ; ^ 8 8 8 8 8 8

1 2 3 1 1 25 M(R4) = 2 •1 + 6 •2 + 0 •3+6 •1+5-1 = 25.

8 8 8 8 8 8

15

Мінімальний середній очікуваний ризик дорівнює — і відповідає стратегії A3. 8

3.6.2. Критерій Бернуллі-Лапласа

Критерій Бернуллі-Лапласа використовують у випадку, коли можна припусти, що будь-який з варіантів середовища не більш ймовірний, ніж інший. Тут передбачається, що всі стани середовища (всі варіанти реальної ситуації) рівноймовірні.

Будемо вважати, що ймовірності Pj, j = 1,n однакові для кожної стратегії Aj (i -го варіанта рішення) та всі ймовірності

дорівнюють Pj = —, j = 1,n . Тоді математичне очікування M(QA n

випадкової величини Qi представляє собою середній очікуваний доход, який позначається також можна знайти за формулою (3.25):

1 n

M(Q) = -Xq.          (3.25)

1 1

Для кожної стратегії А (i -го варіанта рішення) слід розрахувати середній очікуваний доход (математичне очікування) за формулою (3.25), і відповідно до критерію Бернуллі-Лапласа слід вибирати варіант (стратегію Ai ), для якого досягається найбільше значення:

1 n

max M(Qj) = - max У q,, .       (3.26)

n 1=1 1

Приклад 3.10. Нехай для гри, яку задано матрицею виграшів у прикладі 3.2, ОПР вважає рівно ймовірними всі стан природи

Пj: р1 = р2 = р3 = р4 = р5 = 1. За критерієм Бернуллі-Лапласа

5

з'ясувати при якому варіанті рішення досягається найбільший середній дохід і яка величина цього доходу.

Розв'язання. Запишемо матрицю виграшів з додатковим рядком з ймовірностями станів Пj у вигляді таблиці 3.13.

Таблиця 3.13

Матриця виграшів гри

 

П1

П2

П3

П4

П5

А1

2

5

4

3

2

А2

5

7

2

1

8

A3

8

3

7

9

4

А4

6

1

8

3

3

 

1

1

1

1

1

pi

5

5

5

5

5

Знайдемо для кожної стратегії Ai середній очікуваний дохід за формулою (3.25):

MQ ) = 5 (2 + 5 + 4 + 3 + 2) =15 ; M(Q2) = 1 (5 + 7 + 2 +1 + 8) = 2- ; M(Q3) =1 (8 + 3 + 7 + 9 + 4) = — ;

M(Q4) =1 (6 +1 + 8 + 3 + 3) = 21.

31

Максимальний середній очікуваний дохід дорівнює — і відповідає стратегії А3.       5

Ряд розподілу випадкової величини Rj

Розглянемо ризик як випадкову величину R з рядом розподілу, який наведено в табл. 3.14.

Таблиця 3.14

R

r -

Г 2

• • •

Гп

P

і

1

• • •

1

 

п

п

 

п

Математичне очікування M(R) випадкової величини R. представляє собою середній очікуваний ризик, що обчислюється за формулою (3.27)

і п

M(R) = -XГ .         (3.27)

1 1

Для кожної стратегії А. (і -го варіанта рішення) слід розрахувати середній очікуваний ризик (математичне очікування) за формулою (3.27), і відповідно до критерію Бернуллі-Лапласа слід вибирати стратегію (варіант), для якої досягається найменше значення:

1п

minM(R) = min-У rin .    (3.28)

1 11

Приклад 3.11. Для вихідних даних прикладу 3.10 на основі матриці ризиків за критерієм Бернуллі-Лапласа з'ясувати, при якому варіанті рішення досягається найменший середній ризик і яка величина цього ризику.

Розв  Запишемо матрицю ризиків гри з додатковим

рядком з ймовірностями станів Пj у вигляді таблиці 3.15.

Таблиця 3.15

Матриця ризиків гри

 

П1

П2

П3

П4

П5

4

6

2

4

6

6

4

3

0

6

8

0

4

0

4

1

0

4

4

2

6

0

6

5

 

1

1

1

1

1

p.

5

5

5

5

5

Знайдемо для кожної стратегії А середній очікуваний ризик за формулою (3.27):

M(R1) = 1 (5 + 2 + 4 + 6 + 6) = 23 ; M(R2 ) = 1 (3 + 0 + 6 + 8 + 0) = у ; M(R3) = 1 (0 + 4 +1 + 0 + 4) = 9; M(R4) = 1 (2 + 6 + 0 + 6 + 5) = у.

9

Мінімальний середній очікуваний ризик дорівнює — і відповідає стратегії А3 .         5

Слід відмітити, що критерій Бернуллі-Лапласа безпосередньо не відноситься до випадку часткової невизначеності, і його застосовують в умовах повної невизначеності.