<< Предыдушая Следующая >>

8.15. Теория игр

Методами обоснования решений в условиях неопределенности и риска занимается математическая теория игр.

В теории игр рассматриваются такие ситуации, когда имеются два участника выполнения операции, каждый из которых преследует противоположные цели. В качестве участников могут выступать коллективы, конкурирующие предприятия и т. д. Во всех случаях предполагается, что операция проводится против разумного противника (конкурента), преследующего свои собственные цели и сознательно противодействующего достижению цели другим участником.

Так как цели противоположны, а результат мероприятия каждой из сторон зависит от действий конкурента, то эти действия называют конфликтными ситуациями. В конфликтной ситуации сталкиваются противоположные интересы двух участников. Формализованная (схематизированная) модель конфликтной ситуации называется игрой. Результат игры — победа или поражение, которые не всегда имеют количественное выражение, можно выразить (условно) числами (например, в шахматах: 1, 0, 1/2).

Игра называется игрой с нулевой суммой, если один из игроков выигрывает ровно столько, сколько проигрывает другой.

Развитие игры во времени представляется как ряд последовательных ходов. Ходы могут быть сознательными и случайными. Случайный ход — результат, получаемый не решением игрока, а каким-либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т. п.). Сознательный ход — выбор игроком одного из возможных вариантов действия (стратегии) и принятие решения об его осуществлении.

Возможные варианты (исходы) игры сводятся в прямоугольную таблицу — платежную матрицу, в которой строки соответствуют различным стратегиям игрока А, столбцы — стратегиям игрока В, д называется ценой игры (табл. 8.23).

Таблица 8.23 Ві В2 Вп А1 411 Ц12 41 П А2 421 Ц22 Ц2п А

Ат Цт 1 Цт2 Цтп Цель теории игр — выработка рекомендаций для различного поведения игроков в конфликтной ситуации, т. е. выбор оптимальной стратегии для каждого из них.

Пример. Конструктор получил задание разработать определенное новое изделие. В результате исследований он определил три возможных варианта изделия У1, У2, У3, каждый из которых может быть реализован каким-либо из трех техпроцессов Т1, Т2, Т3.

Если первый вариант конструкции У1 реализуется по первой технологии Т1, то внешний вид изделия оказывается наилучшим и оценивается экспертами в 9 баллов, а при реализации по второй технологии — в 6 баллов, по третьей — в 5 баллов и т. д. (табл. 8.24).

Таблица 8.24 Конструкция Технология а = тіп Чу

і Ті Т2 Тз Уі 9 6 5 5 (Тз) V 8 7 7 7 (Т2 или Т3) Уз 7 5 8 5 (Т2) р, = тах 9 7 8 тах тіп ц. = 7 = тіп тах ци

7 І І 7 7 Решение. Конфликтная ситуация возникает из-за того, что затраты на реализацию каждого конструкторско-технологического решения (варианта) не одинаковы. Для простоты полагаем, что затраты пропорциональны внешнему виду (чем выше балл, тем больше затраты).

Конструктор должен представить только один вариант, конечно самый красивый. Но он понимает, что тогда найдутся сторонники самого дешевого варианта. Поэтому его задача — выбрать оптимальный вариант по внешнему виду и стоимости.

Если конструктор выберет У1, то экономисты будут настаивать на технологии Т3. На вариант У2 будет ответ Т2 или Т3 и т. д.

Очевидно, что, с точки зрения конструктора, преимущество имеет вариант У2, а так как даже при неблагоприятных обстоятельствах получится изделие, оцениваемое в 7 баллов (выигрыш 7), а может быть, даже 8, если удается уговорить экономистов на вариант Т1.

С точки зрения экономистов, в смысле снижения затрат: при выборе технологии Т1 в варианте У1 затраты наибольшие — 9 баллов, при Т2 в У2 (7), при Т3 в У3 (8). То есть для экономистов оптимальным является техпроцесс Т2, так как он требует меньших затрат при различных вариантах конструкции. Следовательно, стратегия Т2У2 с выигрышем 7 — наиболее выгодная сразу для обеих сторон — максимальный выигрыш У совпадает с минимальным проигрышем Т.

Однако не все матрицы имеют седловую точку. Тогда решение находят, применяя смешанные стратегии, т. е. чередуя случайным образом несколько чистых стратегий (гибкая тактика).

Обычно смешанную стратегию первого игрока обозначают как вектор и = (и1, и2, .

.., ит), а второго игрока — как вектор Z=(z1, г2, ..., 2т), где

щ > 0 (I = 1... т);

г} > 0 ( = 1... п);

т п

Е и=Е 2-=1

1=1 ]=1

Если и0 — оптимальная стратегия первого игрока, 2 — оптимальная стратегия второго игрока, то число

п т

и=ЕЕаи0 20

] =1 !=1

называют ценой игры.

Для того чтобы число и было ценой игры, а и0 и 2 — оптимальными стратегиями, необходимо и достаточно выполнение неравенств:

т

ЕаЦи<° > и 0' =!... п);

г=1

п

Е аа2° - и ( =1... т)-

1=1

Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш равен цене игры и вне зависимости от того, с какими частотами будет применять второй игрок стратегии, вошедшие в оптимальную, в том числе и чистые стратегии.

Пример. Задача двух осужденных.

Рассмотрим илюстративную задачу о двух осужденных (обозначим их через А и В), которым необходимо принять независимое решение о взаимодействии со следствием. Каждый из них знает условия (табл. 8.25).

Таблица 8.25 В сознается В не сознается А сознается Каждому по 8 лет осуждения А — 2 года В — 10 лет А не сознается В — 2 года А — 10 лет Каждому по 5 лет осуждения Если один из осужденных сознается, а другой нет, то первый получает 2 года осуждения, а второй 10 лет. Если сознаются оба, то осуждение по 8 лет каждому. Конечно, осужденные заинтересованы в уменьшении своего срока наказания. Если использовать критерий минимум наказания в худшем варианте действия напарника, то оба осужденных должны выбирать «отказ» и получить наказание в размере 5 лет.

«Игры с природой»

В случае, когда между сторонами (участниками) отсутствует «антагонизм» (например, в процессе работы предприятий и торговых посредников), такие ситуации называют играми с природой.

Здесь первая сторона принимает решение, а вторая сторона — «природа» — не оказывает первой стороне сознательного, агрессивного противодействия, но ее реальное поведение неизвестно.

Пусть торговое предприятие имеет т стратегий: Т1, Т2, ..., Tm и имеется п возможных состояний «природы»: П1, П2, ..., Пп. Так как «природа» не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем bj первой стороны для каждой пары стратегий Т1 и Пу. Все показатели игры заданы платежной матрицей {b..} . 1

^ I ijmxn

По платежной матрице можно принять ряд решений. Например, оценить возможные исходы: минимальный выигрыш, т. е. наименьшая из величин в каждой i-й строке как пессимистическая оценка; максимальный выигрыш — то наилучшее,

что дает выбор i-го варианта В™ = maxВу. 1

1

При анализе «игры с природой» вводится показатель, по которому оценивают, насколько то или иное состояние «природы» влияет на исход ситуации. Этот показатель называют риском.

Риск Гу при пользовании стратегией Т и состоянии «природы» П оценивается разностью между максимально возможным выигрышем при данном состоянии «природы» Bmax и выигрышем Ву при выбранной стратегии Т-.

Г =в max - В...

ij i ij

Исходя из этого определения можно оценить максимальный риск каждого решения:

Гтах = max Гу.

1

Решения могут приниматься по результатам анализа ряда критериев. 1.

Критерий, основанный на известных вероятностных состояниях «природы» (например, спроса по данным анализа за прошлые годы): •

если известны вероятности состояний «природы»:

pi = p(ni); Р2 = р(П2); ..; р = полагая, что Р. + Рп + ... + Р. + ... + Р = 1. Тогда в качестве показателя

’12 j п ^

эффективности (рациональности, обоснованности) стратегии Т берется среднее (математическое ожидание) — выигрыш применения этой стратегии:

_ п

В=? Bfi. j=i

а оптимальной считают стратегию, для которой этот показатель эффективности имеет максимальное значение, т. е. В = max Bl. •

если каждому решению Т соответствует множество возможных результатов В^ с вероятностями Pj то среднее значение выигрыша определится:

_ П

Bi=? ВР >

j=1

а оптимальная стратегия выбирается по условию В = maxBi.

i

В этом случае можно воспользоваться и стратегией минимального среднего риска для каждого i-го состояния «природы»:

П

г = mn r = mn ? rp.

i i j=i 2.

Максиминный критерий Вальда. Здесь выбирается решение торговой организации, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния «природы»):

W = maxmin Bj = max В"“.

i

j i 3.

Критерий пессимизма-оптимизма Гурвица. Здесь представляется логичным, чтобы при выборе решения вместо двух крайностей в оценке ситуации (оптимум-пессимизм) придерживаться некоторого компромисса, учитывающего возможность как наихудшего, так и наилучшего поведения «природы». В соответствии с этим компромиссным критерием для каждого решения будет линейная комбинация минимального и максимального выигрышей и выбирается тот, для которого эта величина окажется наибольшей:

G = max[х min Bj + (1 - x)max Bj ],

ij

где x — показатель пессимизма-оптимизма (чаще всего 0,5). 4.

Критерий минимаксного риска Сэвиджа. Здесь выбирают ту стратегию, при которой величина риска имеет минимальное значение в самой неблагоприятной ситуации: S = min max Гц, чтобы избежать слишком большого риска при выборе решения. ! 1

Пример. Рассмотрим игровую ситуацию при следующей платежной матрице (табл. 8.26).

Таблица 8.26 Старые товары Новые товары Н\ Н Нз Ci 9 (0,6) 6 (0,3) 4 (0,6) C2 8 (0,2) 3 (0,7) 7 (0,2) Сз 5 (0,1) 5 (0,4) 8 (0,5) Известна матрица условных вероятностей Pj продажи старых товаров С1, C2, C3 при наличии новых товаров Hv Н2, Н3 (табл. 8.26). Определить наиболее выигрышную политику продаж.

Решение. Минимальный выигрыш Д™п = min Bj.

Минимальный выигрыш при продаже старого товара:

С1: В™ = т іп {Вш В12, В1 3} = тіп{9, 6, 4} = 4 = В13;

;=і-3

С2 : В™п = тіп{8, 3, 7} = 3 = В22;

С3 : В3тіп = тіп{5, 5, 8} = 5 = В31,

где В13, В22, В31 образуют систему пессимистических оценок выигрыша от продаж старых товаров.

Максимальный выигрыш при продаже старых товаров:

С1: В'Т = тах{Ви, Ви} = 9 = Ви;

]=1-3

С2 : В2тах = тяхВ, В22, В2г} = 8 = В2Х;

)=1- 3

С3 : В3пах = тах{5, 5, 8} = 8 = В33,

где В11, В21, В33 образуют систему оптимистических оценок выигрыша от продаж старых товаров.

При анализе «игры с природой» вводится показатель влияния какого-либо состояния «природы» на исход продаж, т. е. показатель риска: г.. = Втах - В.., каждый

у і у

из которых составит матрицу рисков:

Н1 Н2 Н3

С1 (0 3 5Ї 0 5 1 3 3 0

С2

С3

Максимальное значение риска для каждого решения:

rmax = max тц, j

т. е. при продаже товаров:

C1 : r1max = maxjrr12 , r13} = max{0,3,5} = 5 = r13; j=i... 3 C2: r2max = max{0, 5,1} = 5 = r22; C3: r3max = max{3, 3,0} = 3 = r31.

Решения о плане продаж принимается исходя из анализа системы критериев. Критерий по известным вероятностным состояниям «природы» Pj оптимальной считают стратегию, для которой этот показатель наибольший, т. е. B = max Б{, где Б{ — математическое ожидание выигрыша при i-й стратегии:

_ 3

Б = ? Щ, j=1

где Bj — результат (выигрыш при применении j-й стратегии):

B =9 X 0,6 + 6 X 0,3 + 4 X 0,1 = 7,6; В2 =8 x 0,2 + 3 x 0,7 + 7 x 0,1 = 4,4; В3 = 5 x 0,1 + 5 x 0,4 + 8 x 0,5 = 6,5.

Тогда B = max{Bs-} = max{7,6; 4,4; 6 ,5} = 7,6 = В^т. е. оптимальной стратегией по

i

этому критерию будет продажа изделия С1.

Максиминный критерий Вальда:

W = maxmin Bij = max Дшп;

i j i

W = max{B1min, B^, B3min} = max{6,3,5} = 6 = B^,

i

т. е. при продаже изделия С1 гарантируется выигрыш даже в наихудших условиях.

Критерий пессимизма-оптимизма Гурвица:

G = max[ xBmin + (1 - x) Bmx],

i

где x — доля оптимизма-пессимизма (0,5).

G = max[0,5{6, 3,5} + 0,5{9,8 ,8}] =

i

= max{(3 + 4,5); (1,5 + 4) ; (2,5 + 4) } = max{7 , 5; 5,5; 6,5 } = 7, 5,

т. е. исходя из уравновешенной точки зрения принимается решение о продажах С1.

Критерий минимаксного риска Сэвиджа, по которому принимают решение с минимальным значением риска в самой неблагоприятной ситуации:

S = minmax п = min r™x, i j j i

где rmax вычислена по матрице рисков.

S = min{r1max, r2max , r3max } = min{5, 5, 3} = 3,

i

что соответствует целесообразности в смысле этого критерия продажам изделия С3.

Комплексный анализ всех критериев позволяет предположить, что наилучшей стратегией продаж будет продажа изделий Н1, Н2, Н3, С1, С3. Изделие С2 должно быть снято с продаж.

Пример. Предприятие планирует на массовый рынок производство нового изделия. Спрос на это изделие не может быть точно определен. Однако можно предположить, что его величина будет характеризоваться тремя возможными состояниями (I, II, III). С учетом этих состояний анализируются три возможных варианта (модификации) конструкции изделия (А, Б, В), каждый из которых требует своих затрат и обеспечивает различный эффект (цену, прибыль).

Прибыль, которую получит предприятие при данном объеме производства и соответствующем состоянии спроса, определяется матрицей: I II III А ' 22 2 2 22 > Б 21 2 3 23 В 2

О 2 1 24 , Требуется выбрать такой вариант изделия, величина предложения которого обеспечит среднюю прибыль при любом уровне спроса.

Решение. Прежде всего проверяется, имеет ли исходная платежная матрица сед-

ловую точку:

а = max(min a{j) = max (22, 21, 20) = 22 — нижняя цена;

i j J

? = min(max aj) = min (22, 23, 24) = 22 — верхняя цена игры,

J i iJ

т. е. а = ? = 22 — цена игры (седловая точка).

Таким образом, оптимальная политика предприятия на рынке — производство первой модификации изделия в объеме, обеспечивающем среднюю прибыль 22 ден. ед. при любом состоянии спроса.

Пример. Предприятие планирует производство двух изделий А, Б с неопределенным спросом, предполагаемый уровень которого характеризуется двумя состояниями — I, II. В зависимости от этих состояний прибыль предприятия различна и определяется платежной матрицей

(52 22^

А = [22 49J.

Определить объемы производства каждого изделия, при котором предприятию гарантируется средняя величина при любом состоянии спроса.

Решение. Проверка платежной матрицы на наличие седловой точки:

а = max(min aj) = max (22, 22) = 22 — нижняя цена; i J

? = min(max aij) = min(52, 49) = 49 — верхняя цена. ji

Следовательно, чистых стратегий продаж у предприятия нет, и для игры без седловой точки (а < ?) используют смешанные стратегии:

52u1 + 22u2 = и;

< 22u1 + 49u2 = и;

u1 + u2 = 1,

т. е. u, = — = 0,47; u2 = 0,53; и = 36,1.

1 19 2

Следовательно, в общем объеме предложения предприятия 53% должны составлять изделия Б, 47% — изделия А. Такая стратегия продаж обеспечит среднюю прибыль 36,1 ден. ед. при любом состоянии спроса.

Сведение задач теории игр к задачам линейного программирования

Пусть задана платежная матрица игры: / a11 a12- a1n ' Amxn a21 a22‘ a2n V am1 am2 amn у Для оптимальной стратегии первого игрока и0 = (ц0, и°,.. ., и^) и цены игры и выполняется неравенство

Е аїиі - и (і =1- п)

І=І

или (разделив на и)

? аі^ >1 (і =1... п).

і=1

Обозначая — = у0, получим:

Е і0 -1 О'=1... п);

І=І

у0 -1 (і = 1... га; и > 0);

т А

ЇУ0 =1

І=І

Так как первый игрок стремится получить максимальный выигрыш, то он должен обеспечить минимум величине 1/и. С учетом этого определение оптимальной стратегии сводится к нахождению минимума функции

к = Е Уг

і=1

при условиях

?аіУі -1 (і=1...п); у- ^0( г=1.- .т).

і=1

Аналогично определение оптимальной стратегии второго игрока сводится к нахождению максимума функции

Х;

і=1

при условиях

?а;Х; < 1 (г = 1... т); х;- > 0 (і = 1 . .. п), где = /и.

і=1

Таким образом, чтобы найти решение данной игры по матрице А, нужно составить следующую пару двойственных задач и найти их решение: Прямая задача

Х

;=1

Е а;Х; < 1 (г = 1... т);

;=1

х,- - 0 (і = 1... п ).

Двойственная задача

т

тт I = ? У;

г=1

т

? >1 О' =1... п);

!=1

у > 0 (г = 1... т). Используя решения пары задач, можно выявить оптимальные стратегии и цену игры: 1

1

Х,

• = и У0; z'j =

и0 =

• = ихj; и = -

X х0 Ху0

X

j=1

х,

і=1

(1 2 0^ 1 0 1 2 1 0

Пример. Найти решение игры, определяемой матрицей А = Решение. Пара двойственных задач:

(і = 1... ш; j = 1... и).

X у0 i=1

j=1

Уі

Прямая

max L=x]+ х2+ х3; х1+ 2х2 < 1; х1 + х3 < 1;

2xt+ х2 < 1; х1, х2, х3 > 0. х0=(0; 1/2; 1).

2;

3’

Двойственная min L=yt+ y2+ y3; y1 + y2 + 2y3 > 1;

2y1 + y3 > 1;

У2 > 1

yi, y2, УЗ > 0. y0=(1/2; 1; 0).

Из решения пары задач 1 1

и = 1

ч 1 ,

-+1 -+1 2

2

и0=(1/3; 2/3; 0); z0=(0; 1/3; 2/3).

<< Предыдушая Следующая >>
= Перейти к содержанию учебника =
Информация, релевантная "8.15. Теория игр"
  1. Глава 58. ПРОВЕДЕНИЕ ИГР И ПАРИ
    Комментарий к главе 58 Пари - это основанное на риске соглашение о выигрыше, заключенное двумя или несколькими участниками между собой либо с организатором игорного заведения (организатором тотализатора), исход которого зависит от обстоятельства, относительно которого неизвестно, наступит оно или нет. Под азартной игрой понимается основанное на риске соглашение о выигрыше, заключенное
  2. 6. Теория обмена
    Теория обмена представляет попытку применить принципы бихевиоризма в совокупности с другими идеями к задачам социологии. Хотя теория обмена зародилась довольно давно [32], пик ее в 50—60-х годах связан с именем Джорджа Хоманса [7]. Хомансовская теория обмена может рассматриваться во многом как реакция на парадигму социальных фактов, в особенности на структурный
  3. ЧАСТЬ II ОБЩАЯ ТЕОРИЯ ГОСУДАРСТВА И ПРАВА Раздел III ТЕОРИЯ ГОСУДАРСТВА
    ЧАСТЬ II ОБЩАЯ ТЕОРИЯ ГОСУДАРСТВА И ПРАВА Раздел III ТЕОРИЯ
  4. 5.2.2. Предмет теории игр. Основные понятия
    Теория игр является теорией математических моделей принятия решений в условиях конфликтов. Здесь под конфликтом будем понимать явление, применительно к которому можно говорить, кто и как в этом явлении участвует, какие у него могут быть исходы и кто и как в этих исходах заинтересован. Поэтому для формального задания конфликта необходимо указать: 1) множество участвующих в нем действующих
  5. Вопрос 132 ЧТО ТАКОЕ ЛИЧНОСТНАЯ ТЕОРИЯ ЛИДЕРСТВА?
    Ответ Подход с позиций личных качеств (личностная теория лидерства, теория великих людей). Согласно этой теории, лучшие из руководителей обладают определенным набором общих для руководителей личных качеств. Некоторые из этих качеств: • уровень интеллекта и знаний; • впечатляющая внешность; • честность; • здравый смысл; • инициативность; • социальное или экономическое
  6. 1.4. Иррациональность и гиперрациональность, в том числе в теории игр
    Модель рационального выбора, лежащая в основе ортодоксального экономического анализа, вызывала сомнения по нескольким позициям. На поверхности лежало возражение, что она не объясняет, как ^люди принимают свои решения или описывают их. Другим, тоже поверхностным возражением, как мы видели, было то, что людям не хватает информации, чтобы действовать рационально. Люди не всеведущи, но решения при
  7. 3.3. Статистические и экономико-математические методы анализа
    В экономическом анализе используются следующие статистические методы: 1) группировки экономических показателей по определенным признакам; 2) абсолютных и относительных показателей (коэффициентов, процентов); 3) средних величин: средних арифметических простых, взвешенных, хронологических; 4) индексов; 5) рядов динамики, которые характеризуются показателями
  8. 1.3.4. Математические методы оценки экономических рисков
    Роль количественной оценки экономического риска значительно возрастает, когда существует возможность выбора из совокупности альтернативных решений оптимального решения, обеспечивающего наибольшую вероятность наилучшего результата при наименьших затратах и потерях в соответствии с задачами минимизации и программирования риска. Здесь следует выявить, количественно измерить, оценить и сопоставить
  9. 3.3. Технологии принятия решений в условиях поведенческого риска
    Пусть теперь главным фактором, определяющим "механизм проблемной ситуации", оказывается поведение одного или нескольких субъектов, оказавшихся втянутыми в операцию ЛПР и вынужденных взаимодействовать с ним, возможно, даже против своей воли. Чтобы при изложении матер нала однозначно понимать, кто есть кто, будем ЛПР, в интересах которого мы вырабатываем решения, называть "наше ЛПР", а остальных
  10. § 21. Г) Auctoramentum (поступление в гладиаторы)
    Это договор, в соответствии с которым гладиаторы (auctorati), завербованные устроителем игр (lanista, хозяин гладиаторской школы), брали на себя в момент вербовки обязательство принимать участие в поединках в цирках (на арене), в том числе рискуя быть убитыми (uri, vinciri, ferroque necari, «быть сожженным, в кандалы вверженным, мечом умерщвленным»). Уже говорилось, что позорное занятие делало
  11. 1. Теория З. Фрейда.
    1. Теория З.
  12. 1. ТЕОРИЯ МОДЕРНИЗАЦИИ
    1. ТЕОРИЯ
  13. ТЕОРИЯ РОСТА
    ТЕОРИЯ
  14. Глава 4.Теория
    Глава
  15. 11.2. ТЕОРИЯ ОЖИДАЕМОЙ ПОЛЕЗНОСТИ
    11.2. ТЕОРИЯ ОЖИДАЕМОЙ
  16. ТЕОРИЯ ИНТЕРШПНЫХ ОТНОШЕНИЙ
    ТЕОРИЯ ИНТЕРШПНЫХ
  17. 11.3. ТЕОРИЯ РАЦИОНАЛЬНОГО ПОВЕДЕНИЯ
    11.3. ТЕОРИЯ РАЦИОНАЛЬНОГО
  18. 4. ТЕОРИЯ ВОСПИТАНИЯ ВОЕННОСЛУЖАЩИХ
    4. ТЕОРИЯ ВОСПИТАНИЯ
Портал "Учебник" © 2014
info@uchebniki-besplatno.com
Рейтинг@Mail.ru