3.5. Критерії прийняття рішень в умовах повної невизначеності

магниевый скраб beletage

Критерій прийняття рішень - це функція, що виражає переваги особи, що приймає рішення, і що визначає правило, за яким вибирається прийнятний або оптимальний варіант рішення.

Всяке рішень в умовах неповної інформації приймається в з урахуванням кількісних характеристик ситуації, в якій приймаються рішення.

Критерії можна використовувати по черзі, причому після обчислення їх значень серед декількох варіантів доводиться довільним чином виділяти деяке остаточне рішення. Що дозволяє, по-перше, краще проникнути в усі внутрішні зв'язки проблеми ухвалення рішень і, по-друге, ослабити вплив суб'єктивного фактору.

3.5.1. Критерій Вальда

Критерій Вальда є критерієм крайнього песимізму, оскільки статистик вважає, що "природа" діє проти нього найгіршим чином. Це критерій гарантованого результату.

Нехай гру задано матрицею виграшів гравця А. Тоді на думку статистика - гравця А, дії гравця "природа", якій діє проти нього найгіршим чином, відображуються в реалізації гравцем "природа" таких своїх стані Пj, при яких величина виграшу гравця А (статистика) приймає найменше значення minav . Виходячи з цього статистик обирає таку чисту стратегію A , при якій найменший виграш minaH буде максимальним, тобто забезпечувати j

максимш:

ав = maxminatt.   (3.12)

i j J

Велична аВ , що розраховується за формулою (3.12), називається нижньою ціною гри - це максимальний виграш, що є гарантованим в грі з певним противником шляхом вибору однієї зі своїх стратегій при мінімальних результатах.

Нехай гру задано матрицею програшів гравця А, тоді найгірші дії гравця "природа", будуть реалізовуватися в таких станах Пj, при яких величина програшу гравця А (статистика) приймає найбільше значення maxa^. Виходячи з цього статистику необхідно обрати таку чисту стратегію A , при якій найбільший програш maxaH буде мінімальним, тобто забезпечувати

j

мішмакс:

вв = minmaxa„.    (3.13)

Критерій Вальда забезпечує максимізацію мінімального виграшу або, що теж саме, мінімізацію максимального програшу (втрат), який може виникнути при реалізації однієї зі стратегій. Цей критерій орієнтує ОПР дотримуватися вкрай обережної поведінки. Така поведінка прийнятна наприклад, коли гравець не має зацікавленості в крупному виграші, але хоче себе застрахувати від неочікуваних програшів. Вибір такої поведінки визначається відношенням гравця до ризику. Критерій Вальда застосовують у тих випадках, коли необхідно забезпечити успіх в будь-якій ситуації.

Приклад 3.3. Для гри, яку задано матрицею виграшів у прикладі 3.2, за критерієм Вальда вибрати стратегію, яка є найбільш вигідною.

Розв' язання, Запишемо матрицю виграшів у вигляді таблиці

3.2 і знайдемо найменше значення minaH для кожного рядка.

j 1

Таблиця 3.4

Матриця виграшів гри

 

Пі

П2

П3

П4

П5

m ina„

j J

А

2

5

4

3

2

2

4

5

7

2

1

8

1

A3

8

3

7

9

4

3

4

6

1

8

3

3

1

Слід вибрати таку стратегію серед стратегій A i = (14) , яка є найбільш вигідною (оптимальною), тому за формулою (3.12) маємо:

ав = max(2; 1; 3; 1) = 3 ,

і

що вказує на перевагу стратегії А3.

Це означає, що незалежно від того яку стратегію буде застосовувати гравець "природа", тобто який зі станів складеться на ринку, гравець А (статистик), при застосуванні стратегії А3, тобто техніки виду А3, отримає гарантований виграш не менше 3 одиниць. При використанні гравцем А будь-якої іншої стратегії, тобто випуску іншого виду техніки, у випадку гіршої ситуації може бути отриманий виграш менший ніж 3 одиниці.

Застосування критерію Вальда буває виправдано, якщо ситуація, в якій приймається рішення наступна:

про можливість появи зовнішніх станів Пj нічого не відомо; доводиться зважати на появу різних зовнішніх станів Пj; рішення реалізується тільки один раз; необхідно виключити який би то не було ризик.

3.5.2. Критерій оптимізму

Критерій оптимізму, який називають критерієм максимаксу, використовують коли особа, що приймає рішення орієнтується на найбільш сприятливі умови.

У випадку, коли гру задано матрицею виграшів за критерієм оптимізму визначається варіант рішення, який максимізує максимальні виграші (наприклад, доходи) для кожного варіанта ситуації. Критерій оптимізму записують у вигляді

ао = maxmaxa...  (3.14)

i j

У випадку, коли гру задано матрицею програшів за критерієм оптимізму визначається варіант рішення, який мінімізує мінімальні програші (наприклад, витрати) для кожного варіанта ситуації.

Критерій оптимізму записують у вигляді

в0 = minmina...   (3.15)

i j

Критерій оптимізму доцільно застосовувати у тих випадках, коли статистик має можливість впливати на вибір стратегій гравцем "природа".

Приклад 3.4. Для гри, яку задано матрицею виграшів у прикладі 3.2, за критерієм оптимізму вибрати стратегію, яка є найбільш вигідною.

Розв' язання. Запишемо матрицю виграшів у вигляді таблиці 3.5 і знайдемо найбільше значення maxa^ для кожного рядка.

Слід вибрати таку стратегію серед7 стратегій A i = (1,4) , яка є найбільш вигідною (оптимальною), тому за формулою (3.14) маємо:

ао = max(5; 8; 9; 8) = 9,

і

що вказує на перевагу стратегії А3.

Це означає, що незалежно від того яку стратегію буде застосовувати гравець "природа", тобто який зі станів складеться на ринку, гравець А (статистик), при застосуванні стратегії A3, тобто техніки виду А3, отримає гарантований виграш 9 одиниць. При використанні гравцем А будь-якої іншої стратегії, тобто випуску іншого виду техніки, у випадку гіршої ситуації може бути отриманий виграш 9 одиниць.

Слід відмітити, що висновки, отримані за критерієм Вальда і критерієм оптимізму, співпадають, та надають перевагу стратегії

А.

Таблиця 3.5

Матриця виграшів гри

 

Пі

П2

П3

П4

П5

maxaH

j J

Аі

2

5

4

3

2

5

A

5

7

2

1

8

8

А

8

3

7

9

4

9

A

6

1

8

3

3

8

3.5.3. Критерій песимізму

У випадку, коли ОПР орієнтується на найменш сприятливі умови та неконтрольовані фактори застосовують критерій песимізму.

Для гри, яку задано матрицею виграшів за критерієм песимізму визначається варіант рішення, який мінімізує мінімальні виграші для кожного варіанта ситуації. Критерій песимізму записують у вигляді

аП = min min a„.  (3.16)

i j J

Для гри, яку задано матрицею програшів за критерієм песимізму визначається варіант рішення, який максимізує максимальні програші для кожного варіанта ситуації. Критерій песимізму записують у вигляді

ап = max max a„. (3.17)

Матриця виграшів гри

i j J

За критерієм песимізму передбачається, що неконтрольовані фактори можуть бути використані несприятливим чином. В реальних ситуаціях можуть в багатьох задачах неможливий контроль за неконтрольованими факторами. Це відноситься до задач, в яких є необхідність урахування фактору часу; задач соціально- економічного прогнозування; задач довгострокового планування тощо.

Наприклад, витрати виробництва є контрольованими факторами на короткострокових часових інтервалах, але при аналізі довгострокових проектів певні елементи витрат виробництва стають неконтрольованими: вартість електроенергії, вартість матеріалів тощо.

Приклад 3.5. Для гри, яку задано матрицею виграшів у прикладі 3.2, за критерієм оптимізму вибрати стратегію, яка є найбільш вигідною.

Розв' язання. Запишемо матрицю виграшів у вигляді таблиці

3.6 і знайдемо найменше значення mina, для кожного рядка.

j 1

Таблиця 3.6

 

Пі

П2

П3

П4

П5

m ina„

j J

А

2

5

4

3

2

2

4

5

7

2

1

8

1

4

8

3

7

9

4

3

4

6

1

8

3

3

1

За формулою (3.16) маємо:

аП = min(2; 1; 3; 1) = 1,

і

що вказує на перевагу стратегій А2 і А4 .

Це означає, що незалежно від того яку стратегію буде застосовувати гравець "природа", тобто який зі станів складеться на ринку, гравець А (статистик), при застосуванні стратегій А1 і А4, тобто техніки видів А і А4, отримає гарантований виграш не менше 1 одиниці. При використанні гравцем А будь-якої іншої стратегії, тобто випуску іншого виду техніки, у випадку гіршої ситуації може бути отриманий виграш менший ніж 1 одиниця.

3.5.4. Критерій мінімаксного ризику Севіджа

Виникають ситуації, в яких неконтрольовані фактори діють більш приємним чином у порівнянні з найкращім становищем, на яке орієнтувалась ОПР. Наприклад, погодні умови оказалися краще прогнозованих; конкуренція зменшилась на ринку у порівнянні з прогнозованими очікуваннями. У цих умовах виникає необхідність визначення можливих відхилень отриманих результатів від їх оптимальних значень. У цьому випадку застосовують критерій Севіджа.

Цей критерій аналогічний попередньому критерію Вальда, але ОПР використовує не матрицю виграшів А, а матрицю ризиків R .

За критерієм Севіджа кращим є рішення, при якому максимальне значення ризику буде найменшим, тобто

аС = min max r„.  (3.18)

i j J

Тобто розглядаючи i -ту стратегію, допускаємо ситуацію максимального ризику r = maxr-j., та вибираємо стратегію з найменшим ризиком r .       j

Для застосування критерію Севіджа до ситуації пред'являються ті ж самі умови, що й для критерію Вальда.

Приклад 3.6. Для вихідних даних прикладу 3.2 за критерієм Севіджа вибрати стратегію, яка є найбільш вигідною.

Розв  Запишемо матрицю ризиків гри у вигляді таблиці

3.7 і знайдемо найбільше значення maxr. для кожного рядка.

Матриця ризиків гри

j 1

Таблиця 3.7

 

Пі

П2

Пз

П4

X

maxr.

j 1

4

6

2

4

6

6

6

4

3

0

6

8

0

8

Аз

0

4

1

0

4

4

0 <X< 1

2

6

0

6

5

6

Слід вибрати таку стратегію серед стратегій А i = (1,4) , яка має найменший ризик, тому за формулою (3.18) маємо:

ас = min(6; 8; 4; 6) = 4 ,

і

тобто вибираємо стратегію А3, при застосуванні якої статистиком величина ризику, що дорівнює 4 одиниці, приймає мінімальне значення у самій гіршій ситуації.

Помітимо, що цей вибір оптимальної стратегії збігається з вибором за критеріями Вальда і оптимізму.

Суть критерію Севіджа полягає у прагненні уникнути великого ризику при виборі рішення (стратегії).

3.5.5. Критерій песимізму-оптимізму Гурвіца

Цей критерій рекомендує в процесі прийняття рішення використовувати певний середній результат, що характеризує стан між крайнім песимізмом і крайнім оптимізмом.

У випадку, коли гру задано матрицею виграшів за критерієм Гурвіца перевага віддається варіанту рішення, яке визначається максимумом серед лінійних комбінацій мінімального і максимального виграшів:

де 0 <X< 1.

Коефіцієнт X можна розглядати як показник оптимізму.

При X = 0 критерій Гурвіца співпадає з максимаксним критерієм, тобто орієнтація на граничний ризик, оскільки великий виграш спрягається з великим ризиком. При X = 1 критерій Гурвіца співпадає з критерієм Вальда, тобто орієнтація на обережну поведінку. Тому критерій Гурвіца це називають критерієм узагальненого максиміну.

Значення X є проміжними між ризиком і обережністью і вибирається із суб'єктивних (інтуїтивних) міркувань в залежності від конкретних умов та схильності до ризику ОПР.

У випадку, коли гру задано матрицею програшів за критерієм Гурвіца перевага віддається варіанту рішення, яке визначається мінімумом серед лінійних комбінацій мінімального і максимального виграшів:

(3.20)

де 0 <X< 1.

Формулу (3.20) застосовують також у випадку, коли задано матрицю ризиків.

Критерій Гурвіца застосовується у випадку, коли: про ймовірність появи стану П. нічого не відомо; з появою стану П. необхідно вважатися; реалізується тільки мала кількість рішень; допускається деякий ризик.

Приклад 3.7. Для гри, яку задано матрицею виграшів у прикладі 3.2, за критерієм Гурвіца при X = 0,6 вибрати стратегію, яка є найбільш вигідною.

Розв  Запишемо матрицю виграшів у виглядії таблиці

аґ = m        ,        (3.19)

3.8 і знайдемо найменше значення min aj і найбільше значення max aj для кожного її рядка.          J

Таблиця 3.8

Матриця виграшів гри

 

П

П2

П3

П

П5

min a

j }

max af

і

Аі

2

5

4

3

2

2

5

 

5

7

2

1

8

1

8

А3

8

3

7

9

4

3

9

А

6

1

8

3

3

1

8

Визначимо максимум серед лінійних комбінацій мінімального і максимального виграшів за формулою (3.19):

аГ = max{0,6-2 + (1-0,6)-5; 0,6-1 + (1-0,6)-8; 0,6-3 + (1-0,6)9; 0,6-1 + (1-0,6)-8} = max{3,2; 3,8; 5,4; 3,2} = 5,4.

Таким чином, за критерієм Гурвіца при значенні показнику оптимізму X = 0,6 слід вибрати стратегію А3.

Помітимо, що цей вибір оптимальної стратегії збігається з вибором за критеріями Вальда, оптимізму і Севіджа.