Приемы разработки и выбора управленческих решений в условиях риска и неопределенности

Методы принятия управленческих решений

Контрольные вопросы по предмету

0


Подпишитесь на бесплатную рассылку видео-курсов:

Текст видеолекции

Методы принятия управленческих решений

Лекция 3

Тема лекции 3: «Приемы разработки и выбора управленческих решений в условиях риска и неопределенности»

Разделы лекции:

1.    Принятие решений в условиях риска и неопределенности.
2.    Технологии принятия решений в условиях поведенческой неопределенности.
3.    Технологии принятия решений в условиях полной и стохастической неопределенности.

РАЗДЕЛ 1. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ.

КАКОВЫ ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ ОБОСНОВАНИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ?

Задачи обоснования решений в условиях неопределенности имеют ряд отличительных особенностей по сравнению с уже рассмотренными задачами на лекции 2 «Методы оптимизации для разработки и выбора управленческих решений в условиях определенности». Поскольку для задач в условиях неопределенности каждой фиксированной альтернативе соответствует не один (вполне определенный), а множество возможных результатов, ЛПР испытывает существенные затруднения в выборе наилучшей альтернативы. При принятии решения для ЛПР значимыми обстоятельствами становятся не только размерность векторного критерия и важность отдельных его компонентов, но и величины предполагаемых выигрышей и потерь в каждой ситуации, а также характеристики степени возможности проявления тех или иных исходов. Другими словами, в подобных условиях для ЛПР становится далеко не безразличной степень риска, обусловленного возможностью получения неблагоприятных результатов из-за неопределенности ситуации принятия решений. Следует иметь в виду, что, обосновывая решение в условиях риска, ЛПР вынуждено упрощать ситуацию, учитывать минимум основных компонентов. В результате при описании  рискованных исходов ЛПР оперирует значениями оценок результатов, степенью подверженности возможным потерям, а также оценками возможности получения выигрышей. Естественно, что при этом для рационально мыслящего ЛПР наименее рискованной следует признать ту альтернативу, которой одновременно присущи:
1)    наибольшая уверенность суждений об исходах;
2)    наибольшая точность оценки степени возможности исходов;
3)    наибольшая предпочтительность величины выигрышей;
4)    наибольшая вероятность выигрышей;
5)    наименьшие потери;
6)    наименьшая степень возможности подвергнуться неблагоприятному исходу.
Однако, как правило, значения указанных характеристик исхода для разных альтернатив сочетаются так, что не позволяют ЛПР сразу, с одного взгляда, вынести суждение о предпочтительности. В подобных ситуациях приходится глубже разбираться в обстоятельствах, применять специальные эвристические и формальные методы решения задачи выбора. И не всегда эти методы просты. Иная задача требует от ЛПР специальных теоретических знаний, специальных умений и т. п. Но ведь ЛПР не может (и не обязано) знать всего, что может потребоваться для решения произвольной задачи выбора в условиях риска. Следовательно, рациональный подход в изучении технологии и методов разработки решений должен состоять в том, чтобы выяснить, с какими типами «механизмов» рискованных ситуаций чаще всего сталкивается ЛПР того или иного уровня руководства. Если это будет сделано, тогда далее можно будет целенаправленно, по мере необходимости, по частям изучать сложные методы анализа риска и совершенствоваться в их применении. Выбор наилучшего решения в условиях неопределенности существенно зависит от того, какова степень этой неопределенности, т.е. от того, какой информацией располагает ЛПР. Поскольку предположения являются субъективными, постольку должны различаться степени неопределенности со стороны лица, принимающего решение.

КАКИЕ ОСНОВНЫЕ ПОДХОДЫ К ПРИНЯТИЮ РЕШЕНИЙ ПРИМЕНЯЮТСЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И РИСКА?
 
Практикуются два основных подхода к принятию решения в условиях неопределенности. Лицо, принимающее решение, может использовать имеющуюся у него информацию и свои собственные личные суждения, а также опыт для идентификации и определения субъективных вероятностей возможных внешних условий, а также оценки, вытекающие в результате отдач, для каждой имеющейся стратегии в каждом внешнем условии. Это, в сущности, делает условия неопределенности аналогичными условиям риска, а процедура принятия решения для условий риска, выполняется и в этом случае.  На рисунке 1 представлена диаграмма упорядочения основных типов задач принятия решений в условиях неопределенности на различных уровнях иерархии управления.

 

Рисунок 1.  Диаграмма упорядочения основных типов задач принятия решений.

Упорядочение произведено на основе анализа частоты решения тех или иных «рискованных» задач ЛПР различных концептуальных уровней иерархии управления. 

КАКИЕ ОСНОВНЫЕ ТИПЫ ЗАДАЧ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И РИСКА МОЖНО ВЫДЕЛИТЬ?

Для удобства отображения на диаграмме основным типам «рискованных» задач присвоены краткие наименования, отражающие свойства того или иного источника риска.  Так, задача принятия решений в условиях стохастической неопределенности получила краткое обозначение «Случайность», в условиях поведенческой неопределенности — «Конфликт», а в условиях действия природно-неопределенных факторов — «Природа».

КАКИЕ ТИПИЧНЫЕ ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ ВСТРЕЧАЮТСЯ НА РАЗЛИЧНЫХ КОНЦЕПТУАЛЬНЫХ УРОВНЯХ РУКОВОДСТВА?

На горизонтальной линии диаграммы (рисунок 1) отмечены «зоны ответственности» ЛПР на различных концептуальных уровнях руководства — «Исполнитель», «Администратор», «Руководитель звена отрасли» и «Высшее руководство». Частоты обращения ЛПР к тем или иным типам задач моделируются высотами прямоугольников и задают уровни упорядочения задач. При этом, чем высота прямоугольника больше, тем соответствующая задача чаще встречается в практике руководства ЛПР данного иерархического уровня. Внутри прямоугольников вписаны краткие наименования типов задач.  Анализ диаграммы на рисунке 1 показывает, что, например, для ЛПР уровня «Исполнитель» типичной оказывается задача принятия решений в условиях стохастического риска. Здесь действуют типичные механизмы случайности типа: ошибки измерения, поломок, отказы и т. п. Примерно такая же частота решения задач в условиях случайности наблюдается и для категории «Высшее руководство». Однако причина того, что основным типом задачи принятия решений здесь оказывается «Случайность» — иная. На столь высоком уровне руководства результат взаимодействия огромного числа взаимодействующих факторов самой разнообразной природы нивелирует их последствия до статистической закономерности. Примерно столь же часто на высшем уровне руководства приходится решать задачи в условиях природного риска. Задачи принятия решений в условиях природной неопределенности весьма характерны для деятельности «Руководителя звена», а разрешение «Конфликта» — типичная работа «Администратора» и все того же «Руководителя звена отрасли».

КАКИЕ ОСНОВНЫЕ  ИСТОЧНИКИ ИНФОРМАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ТИПА НЕОПРЕДЕЛЕННОСТИ ИСПОЛЬЗУЮТСЯ НА РАЗЛИЧНЫХ УРОВНЯХ ИЕРАРХИИ УПРАВЛЕНИЯ?

Отметим также, что когда ЛПР анализирует проблемную ситуацию с неопределенным исходом, оно одновременно принимает для себя решение о том, каков «ведущий тип неопределенности». В основу суждения им кладутся информация, полученная на основе объективных научных данных, сообщения по линии средств массовой информации, личные наблюдения (собственные представления о типе механизма ситуации), мнения экспертов, слухи и многое другое. Но хорошо известно, что на разных уровнях иерархии управления ЛПР по-разному оценивают точность, надежность, достоверность сведений, поступающих из разных источников. Другими словами, они по-разному им верят, придают разный вес. Степень доверия ЛПР информации о типе риска, природе «механизма ситуации», полученной из того или иного источника, также удобно отобразить в виде прямоугольной диаграммы. На рисунке 2 представлена диаграмма упорядочения источников информации для принятия решения о типе «механизма ситуации» для ЛПР на различных уровнях иерархии управления.

 

Рисунок 2. Диаграмма упорядочения источников информации для принятия решения о типе «механизма ситуации» для ЛПР на различных уровнях иерархии управления.

Так, из анализа диаграммы на рисунке 2 следует, что на уровне «Исполнителя» в качестве основных источников информации рассматриваются слухи и сведения, полученные из средств массовой информации. А вот на уровне «Высшего руководства» предпочитают больше доверять объективным научным данным, а также личным наблюдениям и опыту. «Администратору» в силу особенностей его деятельности почти не приходится оперировать точными научными данными. Он действует, используя в основном текущую информацию, слухи, опираясь на интуицию и личный опыт. Что касается «Руководителя звена отрасли», то львиную долю необходимой для руководства информации такое ЛПР получает от своего ближайшего окружения, на уровне слухов. Однако статус такого руководителя требует от него постоянно прибегать к информации из официальных источников, справочников, из приказов вышестоящего руководства и должностных инструкций, а также из средств массовой информации. Это, в определенной степени, делает его заложником навязываемых извне мнений, сковывает личную инициативу для принятия решений о типе «механизма ситуации». Следовательно, все из перечисленных обстоятельств также будут влиять на то, какой из возможных типов неопределенности ЛПР отнесет к «ведущему типу» и какие модели анализа решений ЛПР применит. И все же, ради систематизации знаний, ради перспективы целесообразно обязательно получить хотя бы минимум теоретических знаний по каждому из известных методов обоснования решений в условиях полной неопределенности и риска.

КАКОВЫ ОСНОВНЫЕ СОСТАВЛЯЮЩИЕ РИСКА, ВИДЫ РИСКОВ, ИСТОЧНИКИ ИХ ПОЯВЛЕНИЯ?

Рискуют всегда конкретные люди. Иных заставляют рисковать их амбиции, стремление к лидерству, честолюбие или авантюризм. Других толкает на риск профессия, их социальный и общественный статус. Любая организация, чтобы добиться высокой эффективности своего функционирования, действует в соответствии с принципом разделения труда. В таком случае одни отдают распоряжения и несут ответственность за их последствия, другие — выполняют конкретные поручения и здесь добиваются успеха или их постигает неудача. Другими словами, и одни и другие рискуют, но по-своему. В то же время разделение труда предполагает, в первую очередь, делегирование определенных полномочий и свободы принятия решений членам организации. И здесь кроется определенная ловушка для организации: индивидуальный риск отдельного субъекта становится ее риском. Кроме того, следует иметь в виду, что на различных должностях, для разных статусов субъектов уровни риска могут существенно различаться, однако сказать, кто или что "главный источник риска" подчас далеко не просто. Поэтому ответы на вопросы об источниках и составляющих риска, несомненно, помогут грамотному управленцу принять верное решение и о расстановке кадров, и о том, какими полномочиями их наделить, и о том, каких рискованных последствий от деятельности подчиненных следует ждать.  Каковы же основные составляющие риска, виды рисков, источники их появления?

На рисунке  3  представлена схема, отображающая составляющие риска.
 

КАКИЕ ГЛАВНЫЕ СОСТАВЛЯЮЩИЕ РИСКА МОЖНО ВЫДЕЛИТЬ?

В зависимости от того, какие группы факторов в наибольшей степени определяют риск в проблемной ситуации, выделены две главные составляющие риска: индивидуальный и ситуационный. Индивидуальный риск обусловлен исключительно самим субъектом, принимающим решения и проводящим операцию. В то же время человек как часть общества, организации, действует в соответствии со своей профессией и с занимаемой должностью, вступает в деловые контакты, отдает распоряжения и исполняет чужие решения. Все это определяют его общественная роль, социальный статус. Так, например, охранник фирмы обязан рисковать, не только выполняя конкретную поставленную ему задачу, но помимо этого — прикрывать товарищей, спасать жизнь руководителю. К ситуационной составляющей риска отнесем все, что непосредственно не зависит от рискующего индивида, а составляет, так сказать, операциональный контекст.

КАКОВЫ ИСТОЧНИКИ ИНДИВИДУАЛЬНОГО РИСКА?

На рисунке 4 приведены источники индивидуального риска.


 

Рисунок 4. Источники индивидуального риска.

Ясно, что практически в любой операции ЛПР испытывает ряд затруднений из-за того, что ему не хватает или времени, или ресурсов, или информации для принятия решений и проведении операции. Кроме того, интересы и действия других лиц, втянутых в операцию ЛПР, возможно, даже против их воли, могут существенно повлиять на качество исхода операции, а иногда даже — привести к срыву операции ЛПР. Следовательно, для ЛПР важно знать и учитывать возможные ответы на следующие вопросы.

- Кто эти другие субъекты, чьи интересы затрагиваются операцией, проводимой ЛПР?
- Почему это их «трогает» и почему они будут реагировать?
- Как конкретно могут отреагировать эти «другие лица» на действия ЛПР и в какой форме?
- С какой интенсивностью будут протекать эти реакции и будут ли они кратковременными, «взрывными» или примут «затяжной» характер, будут ли достаточно устойчивыми во времени?
- Какие дополнительные решения в связи с этим потребуется принять?

От полноты и правильности ответов на подобные вопросы зависят подверженность ЛПР ущербу и сам возможный ущерб его интересам. Ведь, в конечном итоге людьми всегда управляют их интересы. Наконец, значительный риск возникает при принятии ЛПР решений без учета того, какой уровень потребностей других лиц эти решения затрагивают. Например, большинство решений человека, связанных с удовлетворением его личных потребностей, связанных с обеспечением необходимой защиты и безопасности, с биологическим выживанием для него и его семьи, заставляют его подчас жестоко рисковать. Решение указанных «бытовых» проблем довлеет над психикой человека, делает его эгоистичным, заставляет проявлять невиданную склонность к риску. А раз это так, то ЛПР следует помнить, что чем более низкий уровень потребностей субъекта затрагивает деятельность ЛПР, тем более решительно будет действовать этот субъект ради удовлетворения своих потребностей. Другими словами, если ЛПР не хочет сознательно повышать ситуационный риск, ему не следует без необходимости своими действиями затрагивать первичные потребности и интересы других людей. И еще. Чем сильнее у субъекта агрессивные установки и потребность в доминировании, тем более высокий уровень риска он допускает.

КАКОВЫ ИСТОЧНИКИ СИТУАЦИОННОГО РИСКА?
На рисунке 5 представлены источники ситуационного риска.
 
Рисунок 5. Источники ситуационного риска.

Необходимо отметить, что, как правило, решения, принимаемые коллегиально, оказываются более рискованными, чем принимаемые индивидуально. Решения, последствия которых проявляются спустя значительное время, также обычно более рискованные, чем решения, чьи последствия проявляются почти мгновенно или с небольшой задержкой после их реализации. А как насчет нерешительности, которая также может быть источником риска? Оказывается, что нерешительность чаще всего проявляется и имеет наиболее тягостные последствия во время принятия решений стратегического характера, на уровне «Высшего руководства».  Кроме того, нерешительность возникает на любом уровне, когда у ЛПР есть трудности в оценке полезности альтернатив или когда оценки полезности близки по величине. К сожалению, знание этих закономерностей не означает, что ЛПР успешно может этим знанием воспользоваться. Руководители разного уровня часто ошибочно полагают, что если некая организационная структура или некий род деятельности прекрасно «работают» на бумаге, то они также хорошо будут работать и в жизни. Это далеко не так. Прежде всего, он должен подбирать людей на должности так, чтобы было как можно большее соответствие их личной склонности к риску и тем уровнем риска, который эта должность допускает. Нужно обучать будущих исполнителей знаниям и умениям по занимаемой должности. Но при этом постоянно помнить, как сказал Монтень, что можно передать знания и опыт, но нельзя передать умения воспользоваться ими. Поэтому нужно готовить исполнителей так, чтобы они постепенно приобрели такое умение — воспользоваться в нужный момент приобретенными знаниями. А это возможно, только если обучение и тренировки не будут идти по шаблону. Для снижения уровня риска ЛПР должно конкретно ставить исполнителям задачу и одновременно сообщать им четкие критерии  достижения цели, предоставлять исполнителям необходимую свободу принятия локальных решений в рамках конкретных обстоятельств.   В целях снижения уровней риска ЛПР обязано лично постоянно координировать работу исполнителей и побуждать их выполнять ее как можно более качественно. Короче говоря, ЛПР должно РУКОВОДИТЬ. Руководство должно быть непрерывным. Оставаясь длительное время без руководства, любое дело, как и автомобиль, может двигаться только в одном направлении — под откос! Таким образом, для обеспечения необходимого соответствия между возможным уровнем индивидуального риска в операции и допустимым, для обеспечения наименьшего уровня ситуационного риска ЛПР следует хорошо знать составляющие риска в операции и особенности проявления тех или иных из них.

РАЗДЕЛ 2. ТЕХНОЛОГИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОВЕДЕНЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ.

Пусть теперь главным фактором, определяющим «механизм проблемной ситуации», оказывается поведение одного или нескольких субъектов, оказавшихся втянутыми в операцию ЛПР и вынужденных взаимодействовать с ним, возможно, даже против своей воли. Чтобы при изложении материала однозначно понимать, кто есть кто, будем ЛПР, в интересах которого мы вырабатываем решения, называть «наше ЛПР», а остальных самостоятельно действующих суверенных субъектов — «другие ЛПР». Эти «другие ЛПР» на самом деле могут и не противостоять «нашему ЛПР», и не желать ему зла. Однако «нашему ЛПР» при обосновании им своих решений важно знать, как эти «другие» поступят или могут поступить. Если такой информации у «нашего ЛПР» не будет, то у него не будет иного выхода, как воспринимать «других ЛПР» как агрессивную среду. Причин подобного отношения к проблемной ситуации у ЛПР может быть несколько:
1) «наше ЛПР» точно знает, что его интересы вошли в противоречие, столкнулись с интересами «других ЛПР»;
2) «наше ЛПР» не знает, являются ли его устремления конфликтующими с интересами «других ЛПР», однако что-то заставляет его опасаться, что это так;
3) «наше ЛПР» знает, что его интересы совпадают с интересами «других ЛПР», что объективно оно желает им добра, однако эти «другие ЛПР» могут этого не понять или не принять из-за различия в позициях, точек зрения, культурных традиций, а это обязательно приведет к столкновению;
4) «наше ЛПР» знает, что иных субъектов кроме него в операции нет и действовать оно будет в объективной обстановке («в природе»); однако эта «природа» — «terra incognita». Поэтому ЛПР опасается подобной неопределенности, непредсказуемости, боится ее. Из-за этого ЛПР вынуждено считать «природу» как бы агрессивной, принимать ее возможные проявления как действия агрессивно настроенного «другого ЛПР».

Разработкой технологий и методов разработки решений в перечисленных проблемных ситуациях занимаются психологическая теория решений и теория игр. Но это своеобразные и сложные дисциплины. Воспользоваться напрямую результатами этих двух теорий обыкновенному управленцу, не специалисту по ТПР, не математику подчас довольно трудно. Например, только по-крупному в психологической теории решений выделяют психологию поведения индивида, психологию малых групп, психологию масс. В теории игр аналогично рассматривают игры двух и N лиц, антагонистические и неантагонистические игры, матричные, биматричные, оперативные игры и т. д. Даже альтернативы ЛПР в теории игр принято называть стратегиями, чтобы подчеркнуть принципиальное отличие подобных проблемных ситуаций от иных. Не раз в литературе подчеркивалось, что именно в подобных проблемных ситуациях значительную роль в выборе наилучшей стратегии играют искусство, интуиция, мнения и иллюзорные оценки ЛПР, а не наука, не строгий расчет, не строгие измерения. Однако современные достижения в теории игр более чем скромны, если применять критерии типа «искусство», «интуиция», «мнения» и т. п. В общем, трудно не специалисту! А как же быть? Постараться применить моделирование.

КАКИЕ МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПРИМЕНЯЮТСЯ ДЛЯ ИЗУЧЕНИЯ И АНАЛИЗА КОНФЛИКТОВ?

В практических ситуациях часто появляется необходимость согласования действий компаний, объединений, министерств и других участников проектов в случаях, когда их интересы не совпадают. В подобных ситуациях теория стратегических игр позволяет найти оптимальное решение для поведения всех участников проектов, обязанных согласовывать действия при столкновении интересов.  Риск и неопределенность исходов игры обусловлены случайным состоянием среды, или выбором образа действия противоположной стороны, или вероятностным характером появления желаемого результата по возможным стратегиям. 

В практической деятельности часто приходится рассматривать явления и ситуации, в которых участвуют две (или более) стороны, имеющие различные интересы и обладающие соответствующими возможностями применять для достижения своих целей разнообразные действия. Подобные явления и ситуации называются конфликтными или просто конфликтами.

Типичная конфликтная ситуация характеризуется тремя основными составляющими:

1) заинтересованными сторонами (это потребители, фирмы, отдельные страны, финансовые и экономические союзы и т. д.);
2) интересами сторон (удовлетворение различных финансовых, экономических и политических потребностей, вытеснение конкурентов с рынка сбыта, повышение доходов и т. д.);
3) их возможными действиями (выбор объема потребления, способы формирования инвестиционного портфеля, выбор объема производства, выбор дивидендной политики и «демпинговая» политика и т. д.).

Любая конфликтная ситуация, взятая из реальной жизни, как правило, довольно сложна.  Ее изучение затруднено наличием многих разных обстоятельств, часть из которых не оказывает сколь-нибудь существенного влияния ни на развитие конфликта, ни на его исход. Поэтому для того, чтобы анализ конфликтной ситуации оказался возможным, необходимо удалить эти второстепенные факторы, что при удачном стечении обстоятельств позволяет построить упрощенную формализованную математическую модель конфликта, которую принято называть игрой и которая отличается от реальной конфликтной ситуации еще и тем, что ведется по вполне определенным правилам. Необходимость изучения и анализа конфликтов, представляемых в виде упрощенных моделей (игр) вызвала к жизни специальный математический аппарат — теорию игр. Обычно теорию игр определяют как раздел математики для изучения конфликтных ситуаций. Это значит, что можно выработать оптимальные правила поведения каждой стороны, участвующей в разрешении конфликтной ситуации. Кроме того, в экономике, например, оказался недостаточным аппарат математического анализа, занимающийся определением экстремума функций. Появилась необходимость изучения так называемых оптимальных минимаксных и максиминных решений. Следовательно, теорию игр можно рассматривать как раздел методов оптимизации, позволяющий решать задачи теории принятия решений, в частности управленческих решений в экономике.  Модельными компонентами теории игр являются игроки, цели игроков, доступная игрокам информация для принятия решений и правила реализации игроками собственных стратегий (осуществления ходов в игре). В зависимости от того, как конкретно сочетаются перечисленные элементы игр, их относят к тому или иному классу. В качестве классификационных признаков, характеризующих ту или иную игру, обычно используют следующие признаки:

1)    количество субъектов (игроков), интересы которых затрагиваются при проведении операции и которые могут влиять на ее результаты, а также возможность создания коалиций игроков;
2)    тип отношений между игроками, возникающих при стремлении игроков обеспечить наивыгоднейшее положение в игре для себя;
3)    возможность обмена информацией между игроками в целях сообщения своих возможных стратегий и оценочных функций;
4)    возможность образования коалиций игроков;
5)    типы множеств стратегий игроков;
6)    типы шкал для описания функций выигрышей игроков;
7)    возможность провести лишь небольшое количество (в частности — только одну) или достаточно много партий игры.

Например, по количеству игроков выделяют парные  множественные игры (игры N лиц); по типу отношений между игроками — игры со строгим соперничеством, нестрогим соперничеством или содействием друг другу; по возможности обмена информацией между игроками — кооперативные и некооперативные; по возможности образования коалиций игроков — коалиционные и бескоалиционные и др.

Математико-игровые модели находят свое применение не только в конфликтных ситуациях социально-экономической области, но и во взаимодействии человека с природой, в политике биологии, военной области и т. д.  Игра — это упрощенная формализованная модель реальной конфликтной ситуации. Формализация означает выработку определенных правил действия сторон в процессе игры: варианты действия сторон, исход игры при данном варианте, степень информированности каждой стороны о поведении всех других сторон. Заинтересованные играющие стороны (в частности, лица) называются игроками. Причем одну играющую сторону может представлять как один игрок, так и целый коллектив. Стратегией игрока называется любое возможное для игрока действие в рамках заданных правил игры. В условиях конфликта каждый игрок выбирает свою стратегию, в результате чего складывается набор стратегий, называемых ситуацией. Заинтересованность игроков в ситуации проявляется в том, что каждому игроку в каждой ситуации приписывается число, выражающее степень удовлетворения его интересов в этой ситуации и называемое его выигрышем в ней. Хотя не каждый выигрыш можно оценить количественно, но в теории игр качественные выигрыши не рассматриваются. Отметим также, что оценка игроком ситуации путем указания его количественного выигрыша, вообще говоря, возможна не всегда, а иногда просто не имеет смысла.  В этом случае численное значение выигрыша в каждой ситуации заменяют на сравнительную предпочтительность ситуаций для отдельных игроков. Что касается типов шкал для описания функций выигрышей игроков, то различают игры с предпочтениями (шкалы качественные) и игры с полезностями (шкалы количественные). Тогда речь ведут о теории игр с предпочтениями, которая включает в себя теорию игр с выигрышами как частный случай.

Основной целью теории игр является выработка рекомендаций для удовлетворительного поведения игроков в конфликте, то есть выявления для каждого из них «оптимальной стратегии».  Понятие оптимальной стратегии — одно из важнейших понятий теории игр, может пониматься в различных смыслах в зависимости от показателя оптимальности (эффективности). Стратегия, оптимальная по одному показателю, может не быть оптимальной по другому показателю. Поэтому чаще всего оптимальная стратегия, определенная в результате применения теории игр к реальным конфликтным ситуациям, является оптимальной теоретически и в большинстве случаев реально удовлетворительной.

Изучить все типы игр одинаково хорошо и сразу вряд ли удастся. Как всегда, следует сосредоточиться на чем-то и пожертвовать чем-то другим. При этом по-прежнему главным ключом разрешения этого познавательного затруднения следует выбрать уровень иерархии управления «нашего ЛПР» и перечень решаемых им задач.

Так, например (рисунок 1), мы уже отмечали, что «Исполнителю» почти не приходится сталкиваться с поведенческой неопределенностью. А вот если взять концептуальный уровень типа «Администратор», то здесь все как раз наоборот. Как правило, главный тип неопределенности, с которым приходится сталкиваться такому «нашему ЛПР» — это «Конфликт». Теперь можем уточнить, что обычно это нестрогое соперничество. Несколько реже «Администратор» принимает решения в условиях «природной неопределенности», и еще реже он сталкивается со строгим, антагонистическим конфликтом. Кроме того, столкновение интересов при принятии решений «Администратором» происходит, так сказать, «однократно», т. е. в нашей классификации он чаще разыгрывает только одну (иногда весьма небольшое количество) партий игры. Шкалы для оценки последствий чаще качественные, чем количественные. Стратегическая самостоятельность у «Администратора» довольно ограничена. Принимая во внимание сказанное, можно утверждать, что проблемные ситуации подобного масштаба чаще всего приходится анализировать с помощью бескоалиционных неантагонистических биматричных игр, причем, в чистых стратегиях. Если рассматривается проблемная ситуация на уровне «Руководитель звена отрасли», то здесь примерно одинаково часто приходится сталкиваться с природной неопределенностью или строгим конфликтом с повторяющимися ситуациями. Адекватными здесь будут методы теории игр с природой и решения матричных или биматричных игр в смешанных стратегиях. Для обоснования решений на уровне «Высшее руководство» в наибольшей степени подходят модели биматричных игр с угрозами, модели группового выбора и игр N лиц, а также особый игровой подход к разрешению поведенческой неопределенности — деловые беседы.

В ЧЕМ ЗАКЛЮЧАЕТСЯ СУЩНОСТЬ ТЕХНОЛОГИИ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА ПРОБЛЕМНОЙ СИТУАЦИИ С ИСПОЛЬЗОВАНИЕМ ТЕОРИИ МАТРИЧНЫХ ИГР?

Разработку решений в условиях поведенческой неопределенности целесообразно декомпозировать по этапам усложняющегося использования информации о проблемной ситуации. На первом этапе целесообразно провести предварительный анализ собственных стратегических возможностей при упрощенном подходе к обоснованию решений в схеме «один против всех». При этом для повышения надежности представлений, выводов и рекомендаций целесообразно предварительные оценки получить в качественных шкалах и без учета поведения «других ЛПР» как самостоятельных субъектов. Затем следует уточнить шкалы измерения предпочтений, а затем на основе дополнительной информации или рефлексий уточнить собственные предпочтения и предпочтения отдельных субъектов среди «других ЛПР». На завершающем этапе разработки решений следует оценить возможности блефа, угроз, кооперирования и вступления в коалиции с некоторыми из «других ЛПР». В целом использование принципов рефлексии и адаптации потенциально позволяет существенно повысить ожидаемую выгодность будущей стратегии поведения «нашего ЛПР». Итак, предварительный формальный анализ проводим в наиболее простой форме, а именно — для однократно разыгрываемой парной бескоалиционной некооперативной игры со строгим соперничеством и дискретными множествами стратегий игроков. Математической формой такой конфликтной ситуации является матричная игра в чистых стратегиях. В стратегических играх создание модели должно начинаться с построения платежной матрицы. Это наиболее трудоемкий и ответственный этап подготовки принятия решения, так как ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и могут привести к неверному итоговому результату.

КАКИМИ МЕТОДАМИ РЕАЛИЗУЕТСЯ ТЕХНОЛОГИЯ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА ПРОБЛЕМНОЙ СИТУАЦИИ С ИСПОЛЬЗОВАНИЕМ ТЕОРИИ МАТРИЧНЫХ ИГР?

Матричные игры исследуют на основе принципа наибольшего гарантированного результата. Понятие гарантированного результата базируется на гипотезе о крайне неблагоприятном стечении обстоятельств для ЛПР. Согласно принципу наибольшего гарантированного результата рациональным следует считать такое поведение, которое обеспечивает наилучший из самых неблагоприятных результатов. В силу этого данный принцип часто называют принципом максимина (хотя, как это будет показано ниже, подобное утверждение не всегда семантически корректно). Помимо принципа наибольшего гарантированного результата руководствуются также принципом равновесия. Принцип равновесия означает, что рациональным поведением субъектов операции следует считать такое, при котором каждый из них стремится к ситуации, обеспечивающей ему наибольший гарантированный результат, отклонение от которой невыгодно никому.

Количественный анализ на основе применения принципов наибольшего гарантированного результата и равновесия ведется по следующей технологической схеме:
1)    формирование игры, т. е. множеств возможных стратегий игроков;
2)    оценка величин результатов, получаемых субъектами в каждой из ситуаций (предпочтительнее качественная шкала);
3)    выделение множества недоминируемых стратегий для каждого из игроков;
4)    выбор наилучшего варианта решения на основе принципов наибольшего гарантированного результата и равновесия.

Пусть первый игрок — это «наше ЛПР», а все остальные (если их несколько) — «другое ЛПР», или — второй  игрок. Обозначим через A и B множества стратегий первого и второго игроков соответственно. Для проведения формального анализа обозначим через v1(a, b), v2(a, b) оценочные функции игроков, заданных на множестве (а,b) ситуаций игры.  Эти функции скалярные, шкала их значений должна позволять оценивать как минимум «Тенденции». Качественная шкала «тенденций» позволит сравнительно легко упорядочить ситуации (а, b) игры по предпочтительности. Затем на качественной шкале вводят градации, чтобы можно было бы выявить хоть какие-то пропорции. Далее вводят допущение о том, что первый игрок выигрывает ровно столько, сколько ему проигрывает второй, и на этом основании полагают v1(a, b) = - v2 (a, b). После этого можно оставить только одну из оценочных функций, например функцию первого игрока, которая будет адекватно описывать предпочтительность исходов игры. Для определенности будем полагать, что это функция v(a,b) = v1 (a,b), т. е. она совпадает с оценочной функцией первого игрока. Чтобы сформировать матричную игру, сначала нужно сформировать множества стратегий игроков. Каждое из них должно быть обозримым. Достичь этого можно благодаря принципам цели, декомпозиции и композиции.

Как нам известно, любая альтернатива ЛПР может быть описательно задана следующими основными ее элементами:
• что сделать? — определяется целью предстоящих действий;
• когда? где? с помощью чего сделать? — диктуется обстоятельствами времени, места, характеристиками имеющегося активного ресурса;
• на что направить усилия? — определяется объектом приложения усилий.

Если зафиксировать некоторые из перечисленных элементов альтернативы, а остальные изменять по определенным правилам, то можно формировать различные варианты действий.
Именно эта схема положена в основу большинства из известных методов формирования вариантов решения, однако все они различаются степенью формализации основных операций. Обычно при формировании игры эвристические методы применяют одновременно с рефлексивными, которые как раз и ориентированы на случай, когда ведущим типом неопределенности является поведенческая. Вначале эвристически формируют множество стратегий первого игрока. В него включают альтернативы, которые обеспечивают достижение цели первого игрока хотя бы в принципе. Затем из полученного множества отсеиваются физически нереализуемые альтернативы, т. е. те, которые не могут быть осуществимы в отведенные на операцию сроки. Полученное множество дополняют альтернативами, придающими стратегиям гибкость и устойчивость. При этом руководствуются двумя основными идеями. Во-первых, стремятся обеспечить некую инвариантность, примерно одинаковую приемлемость альтернатив ЛПР по отношению к изменяющимся или неизвестным на данный момент составляющим условий проведения операции. Предпочтение следует отдавать тем стратегиям, которые можно оперативно, сравнительно просто и с незначительными потерями ресурсов скорректировать, когда прояснится обстановка. Во-вторых, следует внимательно изучить всю информацию о личности второго игрока. Главное внимание при этом сосредоточить на его морально-ценностных ориентирах и предпочтениях, сделать вывод о его подозрительности или доверчивости, самоуверенности или нерешительности, его склонности или несклонности к риску и др. Выводы из подобной оценки помогут первому игроку эффективно использовать блеф и сгенерировать достаточное количество псевдостратегий. При генерации псевдостратегий следует помнить важный принцип блефа: все, что привлекает внимание конкурента, может быть использовано в качестве приманки. Например, тщеславного, самоуверенного, рискованного субъекта с низкими моральными качествами, несомненно, соблазнит то, что вы, как его конкурент, выглядите слабым, неопасным и даже — не очень привлекательной жертвой. В подобной ситуации такое ваше поведение обычно провоцирует самоуверенного конкурента не очень скрывать от вас свои планы, подталкивает его к использованию не самых сильных его стратегий. Наоборот, если конкурент осторожен, неуверен, чрезмерно пессимистичен и т. п., вам следует показать себя сильным, решительным, готовым к самым безрассудным поступкам. Тогда вы сможете достаточно уверенно предположить, что или он задействует самые сильные из его стратегий, которые вы можете себе представить, или пойдет на уступки и переговоры. В любом случае у вас появится достаточная уверенность в том, какая ситуация в конфликте сложится, а это совсем немало.   Как только матричная игра сформирована, приступают к поиску ее решения на основе принципов рационального поведения.

ОСНОВНЫЕ ПОНЯТИЯ МАТРИЧНОЙ ИГРЫ.

Рассмотрим простейшую статическую модель — матричную игру, в которой участвуют два игрока, множество стратегий каждого из игроков конечно, а выигрыш одного игрока равен проигрышу другого. Для того чтобы составить экономико-математическую модель конфликтной  ситуации в виде матричной игры, необходимо построить матрицу выигрышей. Это весьма нетривиальная задача особенно для игр большой размерности. В общем виде матрица игры (платежная матрица) строится следующим образом:
1)    перечисляем все возможные чистые стратегии  Ai и Bj игроков;
2)      формализуем правила, по которым развивается конфликт, в виде функции выигрышей
 

В общем случае  платежная матрица матричной игры является прямоугольной (рисунок 6).

     Игрок 2
 
Игрок 1    B1    B2    …    Bn
A1    a11    a12    …    a1n
A2    a21    a22    …    a2n
…    …    …    …    …
Am    am1    am2    …    amn

       

Рисунок 6. Платежная матрица.

Номер строки матрицы соответствует номеру стратегии, применяемой игроком 1. Номер столбца соответствует номеру стратегии игрока 2. Выигрыш игрока 1 является элементом матрицы. Выигрыш игрока 2 равен проигрышу игрока 1.  Матричные игры всегда имеют решения в смешанных стратегиях. Они могут быть решены методами линейного программирования.

ИСХОДНАЯ МОДЕЛЬ МАТРИЧНОЙ ИГРЫ. ПОНЯТИЕ НУЛЕВОЙ СУММЫ. ПЛАТЕЖНАЯ МАТРИЦА.

Пусть игрок 1 («наше ЛПР») имеет m стратегий A1, A2, …,  Am , а игрок 2 имеет n  стратегий B1, B2, …, Bn . Игра может быть названа «игрой m x n».  Представим матрицу эффективности (платежную матрицу) игры двух лиц с нулевой суммой, сопроводив ее необходимыми обозначениями (рисунок 8).
          
     Игрок 2
 
Игрок 1    B1    B2    …    Bn    αi
A1    a11    a12    …    a1n    α1
A2    a21    a22    …    a2n    α2
…    …    …    …    …    …
Am    am1    am2    …    amn    αm
βj    β1    β2    …    βn   

Рисунок 8.  Платежная матрица игры «m x n».

В данной матрице элементы aij — это значения выигрышей игрока 1, они могут означать и  математическое ожидание выигрыша (среднее значение), если выигрыш является случайной величиной.
Величины α1, α2, …, αm – это минимальные значения элементов a ij по строчкам.
Величины β1, β2, …, βn – это максимальные значения элементов  a ij по столбцам.
 
 
 
Их содержательный смысл будет отражен ниже.

Рассмотрим матричную игру, представленную матрицей выигрышей m x n,  где число строк  равно  числу m, а число столбцов равно  числу  n (рисунок 8).

Применим принцип получения максимального гарантированного результата при наихудших условиях.

Игрок 1 («наше ЛПР») стремится принять такую стратегию, которая должна обеспечить максимальный проигрыш игрока 2.

Соответственно игрок 2 («другое ЛПР») стремится принять стратегию, обеспечивающую минимальный выигрыш игрока 1.

Рассмотрим оба этих подхода.

Подход игрока 1 («наше ЛПР»). Он должен получить максимальный гарантированный результат при наихудших условиях.

Значит, при выборе отвечающей этим условиям своей чистой i-й стратегии (на рисунке 8 этой стратегии соответствует i-я строка выигрышей) он должен выбрать гарантированный результат в наихудших условиях, т.е. наименьшее значение своего выигрыша a ij , которое обозначим αi  .
 

Чтобы этот гарантированный эффект в наихудших условиях был максимальным, нужно из всех αi выбрать наибольшее значение. 

Обозначим его α  и назовем чистой нижней ценой  игры («максимин»): 

 

Таким образом, максиминной стратегии отвечает строка матрицы, которой соответствует элемент α. Какие бы стратегии ни применял игрок 2, игрок 1 максиминной чистой стратегией гарантировал себе выигрыш не меньший, чем α.
Таково оптимальное поведение игрока 1.

Подход игрока 2 («другое ЛПР»). Своими оптимальными стратегиями он стремится уменьшить выигрыш игрока 1, поэтому при каждой j-й чистой стратегии он отыскивает величину своего максимального проигрыша βj в каждом j-м столбце
 

То есть игрок 2  определяет максимальный выигрыш игрока 1, если игрок 2 применит j-ю чистую стратегию.

Из всех своих n чистых стратегий B1, B2, …, Bn  игрок 2 отыскивает такую, при которой игрок 1 получит минимальный выигрыш, то есть  игрок 2 определяет   - чистую верхнюю цену игры («минимакс»):
 

Чистая верхняя цена игры показывает, какой максимальный выигрыш может гарантировать игрок 1, применяя свои чистые стратегии, – выигрыш, не меньший, чем α.

Игрок 2 за счет указанного выше выбора своих чистых стратегий не допустит, чтобы иuрок 1 мог получить выигрыш, больший, чем β. Таким образом, минимаксная стратегия отображается столбцом платежной матрицы, в котором находится элемент β (рисунок 8).

Она является оптимальной чистой гарантирующей стратегией игрока 2, если он ничего не знает о действиях игрока 1.

Чистая цена игры ν   есть  цена данной игры, если нижняя и верхняя ее цены совпадают, то есть
 

В этом случае игра называется игрой с седловой точкой.

ПРИМЕР 1. Определить верхнюю и нижнюю цены при заданной матрице игры и указать максиминную и минимаксную стратегии.

Задана матрица игры (рисунок 9).
            
     Игрок 2
 
Игрок 1    B1    B2    B3    αi
A1    2    1    3    1
A2    4    5    6    4
βj    4    5    6   

Рисунок 9. Матричная игра 2 x 3 с седловой точкой.

Решение. Определим нижнюю цену игры α:
α 1 = 1; α 2 = 4; α = 4 (см. столбец αi).
Определим верхнюю цену игры β:
β 1 = 4; β 2 = 5;  β 3 = 6;  β = 4 (см. строку βj).
Таким образом, α = β = 4, т.е.

 

Значит, α = β = ν  = 4 – чистая цена игры при стратегиях А2 и В 1 .  Следовательно, имеем игру с седловой точкой. Максиминная стратегия игрока 1: A2, минимаксная стратегия игрока 2: B1.

Стратегии игроков, определенные по принципам максимина и минимакса, будут удовлетворять принципу равновесия, если реализуемая ситуация (a*, b*) обеспечивает равенство нижней и верхней цены игры. То есть игра имеет ситуацию равновесия в чистых стратегиях. Если равновесный по степени его предпочтительности не устраивает первого игрока, то ему следует либо попробовать сформировать новую игру с использованием других стратегий, либо оценить возможности введения в игру стратегий угроз, либо пойти со вторым игроком на переговоры и тогда — заняться планированием деловой беседы. В общем случае ситуация в максиминных стратегиях не всегда является равновесной. Рассмотрим следующий пример.

ПРИМЕР 2. Определим максиминную и минимаксную стратегии игроков при заданной платежной матрице (рисунок 10).

     Игрок 2
 
Игрок 1    B1    B2    B3    B4    αi
A1    2    7    9    10    2
A2    8    5    4    6    4
βj    8    7    9    10   

Рисунок 10. Матричная игра «2 x 4»  без седловой точки.

Решение. Определим максиминную стратегию:

α 1 = 2; α 2 = 4; α = 4 (см. столбец αi).

Максиминная стратегия игрока 1 –  А2 .

Определим минимаксную стратегию:

β 1 = 8; β 2 = 7;  β 3 = 9;   β 4 = 10; β = 7 (см. строку βj).

Минимаксная стратегия  игрока 2:  В2 . Здесь α< β, следовательно, седловой точки нет.

КАКОВЫ ОСОБЕННОСТИ ВЫБОРА ОПТИМАЛЬНЫХ СТРАТЕГИЙ В МАТРИЧНОЙ ИГРЕ?

1.    В игре с седловой точкой.
Если матрица игры содержит элемент, минимальный в своей строке и максимальный в своем столбце, то он, как уже сказано выше, является седловой точкой. В этом случае мы имеем игру с седловой точкой.
Если в игре с седловой точкой один игрок придерживается седловой точки, тогда другой получит лучший результат, если также будет придерживаться этой точки. Лучшее поведение игрока не должно повлечь уменьшение его выигрыша. Зато худшее поведение может привести к этому. В данном случае решением игры являются:

• чистая стратегия игрока 1;
• чистая стратегия игрока 2;
• седловой элемент.

В данном случае оптимальные чистые стратегии – это чистые стратегии, образующие седловую точку.

2.    В игре без седловой точки.
Если игрок 1 информирован о стратегии, принятой игроком 2, он сможет принять оптимальную стратегию, которая не совпадает с максиминной.

Рассмотрим следующий пример.

ПРИМЕР 3. Дана матрица игры (рисунок 11):

     Игрок 2
 
Игрок 1    B1    B2    B3    B4    B5    αi
A1    7    5    3    6    11    3
A2    8    4    6    7    9    4
βj    8    5    6    7    11   

Рисунок 11. Матричная игра «2 x 5»  без седловой точки.

Определим минимаксную стратегию игрока 2:

β 1 = 8; β 2 = 5;  β 3 = 6;   β 4 = 7;    β 5 = 11; β = 5 (см. строку βj).
Верхняя цена игры β = 5; минимаксная стратегия  игрока 2 –  В2 .
Допустим, что игроку 1 стало известно, что игрок 2 принял минимаксную стратегию. Игрок 1 должен выбрать оптимальную стратегию при условии, что В2 – стратегия игрока 2 (β =5).

Решение. Определим максиминную стратегию игрока 1:

α 1 = 3; α 2 = 4; α = 4 (см. столбец αi).

Максиминная стратегия игрока 1 –  А2 .

Здесь α< β (4<5), следовательно, седловой точки нет.

Выберем оптимальную стратегию для игрока 1 при условии, что игрок 1 знает, что игрок 2 принял минимаксную стратегию B2. 
Ею будет не максиминная А2, дающая игроку 1 выигрыш α = 4, а та стратегия, которая соответствует максимальному элементу в столбце В2.  То есть  max a i2 = 5 – это элемент a 12, который находится в первой строке матрицы  - в строке A1. В этом случае максимальный гарантированный выигрыш игрока 1 будет равен верхней цене игры β = 5, поэтому игрок 1 выбирает свою оптимальную стратегию А1 , зная, что игрок 2 выбрал свою стратегию В2 .

Таким образом, рассмотренный пример дает результат, отличный от результата при игре с седловой точкой. На примере 3 показано, что бывают ситуации, когда игрок 1 может получить выигрыш, превосходящий максиминный, если ему известны намерения игрока 2. Стратегия является оптимальной, если ее применение обеспечит игроку наибольший гарантированный выигрыш при любых возможных стратегиях другого игрока. При многократном повторении игры в сходных условиях можно добиться гарантированного среднего выигрыша, превосходящего для игрока 1 («наше ЛПР») максиминный. Это заставляет игроков адаптироваться друг к другу, выдвигать последовательно усложняющиеся гипотезы об ответных реакциях конкурента и собственных контрмерах. Такое поведение называют рефлексивным. Оно побуждает каждого игрока отклоняться от своей максиминной (минимаксной) стратегии с целью улучшения значения выигрыша в свою пользу. В таком случае первый игрок («наше ЛПР») может только предполагать, как поступит второй: будет ли он придерживаться своей максиминной стратегии B* или отклонится от нее. В значительной степени на решения игроков по-прежнему будут влиять их личностные качества, величина предполагаемого выигрыша v(a*, b*), а также их искусство блефовать и рефлексировать. В конечном итоге выиграет тот, кто более искусно маскировал свои истинные намерения и удачнее предсказал намерения своего соперника. Если игра может повторяться достаточно большое количество раз (не менее 25—30), а шкала оценочной функции v(a,b) достаточно близка к количественной, то для получения равновесной ситуации первому игроку следует прибегнуть к применению не чистых, а так называемых смешанных стратегий. Ситуация равновесия в смешанных стратегиях существует всегда, это доказано строго математически.

ЧТО ТАКОЕ СМЕШАННАЯ СТРАТЕГИЯ?

СМЕШАННЫЕ СТРАТЕГИИ.

Рассмотрим теперь подробнее случай, когда в игре отсутствует седловая точка, то есть случай, когда α <  β.

Если в матричной игре отсутствует седловая точка в чистых стратегиях, то находят верхнюю и нижнюю цены игры. Они показывают, что игроку 1 гарантирован выигрыш, не меньший нижней цены игры α. А игрок 2 может обеспечить себе проигрыш, не больший β, то есть  игрок 1 не получит выигрыша, превосходящего верхнюю цену игры β. В примере 3 игрок 1 получил при своей оптимальной стратегии А1, отличной от максиминной,  выигрыш, равный верхней цене игры β = 5. Такова плата за информированность о стратегии игрока 2. Это крайний случай.  Не улучшится ли результат игрока 1, если информация о действиях противной стороны будет отсутствовать, но игрок будет многократно применять чистые стратегии случайным образом с определенной вероятностью? Возникает вопрос, как «справедливо»  разделить разность (β – α > 0) между игроками? Оказывается, что компромиссного распределения разности (β – α) между игроками можно добиться путем случайного чередования игроками чистых стратегий. При этом игрок 1 может получать выигрыши, в среднем большие нижней цены игры α, но меньшие верхней цены игры β. 

Для этого применяют смешанные стратегии, которые можно представить в виде случайных величин, возможными значениями которых являются  чистые стратегии.  

Пусть для игрока 1 смешанная стратегия S1  заключается в применении чистых стратегий А1,  А2,...,  Аm с соответствующими вероятностями р1, р2, ..., pm:

 

где
 

Число     –  это вероятность того, что игрок 1 применит чистую стратегию  

Для  игрока 2 смешанная стратегия S2 заключается в применении чистых стратегий B1, B2, … Bn  с вероятностями q1, q2, …, qn:

 

                   
где
 

Число     – это вероятность того, что игрок 2 применит чистую стратегию  .

В случае, когда pi = 1 , для игрока 1 имеем чистую стратегию:
                     

Если мы окажемся в ситуации  {Ai, Bj}, то есть когда игрок 1 применит стратегию Ai, а игрок 2 при этом применит стратегию Bj, то она реализуется с вероятностью
 .
В матричной игре, зная платежную матрицу A (она относится и к игроку 1, и к игроку 2), можно определить средний выигрыш игрока 1:
 
где  p, q – векторы с компонентами pi, qj, соответственно.

Стратегии       и    
называются оптимальными смешанными стратегиями игроков, если выполнено следующее условие оптимальности:
                     (*)

Поясним полученные соотношения.
Левая часть этого неравенства
 
означает, что если первый игрок отклоняется от оптимальной стратегии p0, то его выигрыш может только уменьшиться при условии, что второй игрок придерживается оптимальной стратегии q0.
Аналогично, неравенство
 
означает, что если второй игрок отклоняется от оптимальной стратегии q0, то его проигрыш может только увеличиться.
Условие  оптимальности (*) аналогично условию:

 
Величина

  
называется ценой игры

Решить игру означает найти цену игры и оптимальные стратегии. То есть решением игры является нахождение «набора»  ( 

Естественно, что возникают следующие вопросы.

КАКИЕ МАТРИЧНЫЕ ИГРЫ ИМЕЮТ РЕШЕНИЕ В СМЕШАННЫХ СТРАТЕГИЯХ И КАК НАЙТИ ЭТО РЕШЕНИЕ, ЕСЛИ ОНО СУЩЕСТВУЕТ?

Ответ на этот вопрос дает основная теорема теории матричных игр.

Теорема (Неймана). 
Для матричной игры с любой матрицей A величины 

 
 

существуют и равны между собой:
 
Более того, существует, по крайней мере, одна ситуация
 ),  для которой выполняется соотношение:

 
 
Другими словами, любая матричная игра имеет решение в смешанных стратегиях. В состав оптимальных смешанных стратегий  игроков могут входить не все чистые стратегии  Ai, B j. То есть вероятности некоторых из них будут равны нулю:  ,     Значит, не все заданные чистые стратегии игроков будут входить априори в их оптимальные смешанные стратегии.  Тогда те чистые стратегии, которые входят в оптимальные смешанные стратегии, называются активными чистыми стратегиями. 

Справедлива следующая теорема.

Теорема.
Оптимальная смешанная стратегия p0 первого игрока смешивается только из тех чистых стратегий Ai,    , для которых справедливы равенства:
 

А в оптимальной смешанной стратегии q0 второго игрока смешиваются только те стратегии Bj,    , для которых справедливы равенства:
 


КАКОВЫ УСЛОВИЯ ПРИМЕНЕНИЯ СМЕШАННЫХ СТРАТЕГИЙ?

Перечислим условия применения смешанных стратегий:
1.    Игра без седловой точки;
2.    Игроки используют случайную смесь чистых стратегий с заданными вероятностями;
3.    Игра многократно повторяется в сходных условиях;
4.    При любом ходе ни один из игроков не информирован о  стратегии другого игрока;
5.    Допускается усреднение результатов игр.

ОПТИМАЛЬНЫЕ СМЕШАННЫЕ СТРАТЕГИИ В МАТРИЧНОЙ ИГРЕ 2x2.

Рассмотрим простейшую матричную игру, описываемую матрицей 2х2.  При отсутствии седловой точки можно полу¬чить две оптимальные смешанные стратегии. Как уже отмеча¬лось, эти смешанные стратегии записываются так:
                 
Значит, имеется платежная матрица
                 
При этом
                     
откуда получаем оптимальные значения   и  :
                 
Зная   и   находим ?:
             
Вычислив ?, находим   и  :
             
Задача решена, так как найдены векторы
 
и цена игры ?.

Общим подходом решения к решению игры в смешанных стратегиях является сведение ее к задаче линейного программирования.

МЕТОДЫ ОБОСНОВАНИЯ РЕШЕНИЙ С ИСПОЛЬЗОВАНИЕМ БИМАТРИЧНЫХ БЕЗКОАЛИЦИОННЫХ И БИМАТРИЧНЫХ КООПЕРАТИВНЫХ ИГР.

ИГРЫ С НЕНУЛЕВОЙ СУММОЙ. ПОНЯТИЕ БИМАТРИЧНОЙ  ИГРЫ.

Предыдущие рассмотрения касались игр двух лиц, в которых  интересы игроков были прямо противоположны (антагонистические, или матричные игры). Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще. Рассмотрим, например, конфликтную ситуацию, в которой  каждый из двух участников имеет следующие возможности для  выбора своей линии поведения: игрок A — может выбрать любую из стратегий А1..., Аm, игрок B — любую из стратегий В1 ..., Вn. При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок А выбрал i-ю стратегию Ai,  а игрок В — j-ю стратегию Вj,  то в итоге выигрыш игрока А будет равен  некоторому числу aij, а выигрыш игрока В некоторому, вообще говоря, другому числу bij. Иными словами, всякий раз каждый из игроков получает свой приз. Последовательно перебирая все стратегии игрока A и все  стратегии игрока B, мы сможем заполнить их выигрышами две таблицы.  Здесь A — платежная матрица игрока А, а В - матрица игрока В.
При выборе игроком A  i-й стратегии Ai, а игроком B — j-й стратегии Bj их выигрыши находятся в матрицах выплат на пересечении i-х строк и j-х столбцов: в матрице А это элемент aij,   а в матрице В — элемент bij.
Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку A, другая — матрица  выплат игроку В.  Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре — биматричная игра. Рассматриваемые ранее матричные игры, разумеется, можно  рассматривать и как биматричные, где матрица выплат игроку B  противоположна матрице выплат игроку A:  bij = - aij.

Тем не менее, в общем случае биматричная игра — это игра с ненулевой суммой. Вполне естественно время от времени сопоставлять наши рассмотрения с рассуждениями, проведенными ранее для  матричных игр (особенно при попытках разрешения схожих проблем). Подобные сопоставления часто оказываются одновременно и  удобными и полезными. Конечно, класс биматричных игр значительно шире класса матричных (разнообразие новых моделируемых  конфликтных ситуаций весьма заметно), а, значит, неизбежно  увеличиваются и трудности, встающие на пути их успешного разрешения.

Рассмотрим, например, принципы принятия решений на примере биматричных игр.
ПРИМЕР БИМАТРИЧНОЙ ИГРЫ «БОРЬБА ЗА РЫНКИ».

Небольшая фирма (игрок А) намерена сбыть  партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова предпринять на одном из  рынков соответствующие приготовления (например, развернуть рекламную  компанию). Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры  (разумеется, в рамках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий — терпит поражение. Будем считать для определенности, что проникновение фирмы А на  первый рынок более выгодно для нее, нежели проникновение на второй.  Естественно также считать, что и борьба за первый рынок потребует вложения больших средств. Например, победа фирмы А на первом рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при попытке освоиться на первом рынке полностью разорит ее, избавив фирму В от конкурента. Что же касается второго рынка, то при поражении фирмы A ее потери будут не столь разорительны, но и победа принесет немного.

Таким образом, у фирмы A две стратегии:
Α1 — «выбор первого рынка», Α2 — «выбор второго рынка».
Такие же стратегии и у фирмы B:
B1 — «выбор первого рынка»,  B2 — «выбор второго рынка».
Для того,  чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных  единицах:
 

Взглянем на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В.
То, что в ситуации (A1,Β1) выигрыш игрока В равен 5, а в ситуации
(Α2,Β2) = 1, подчеркивает, что первый рынок более выгоден (удобно  расположен, хорошо посещаем и т.п.), чем второй. Выигрыш (-10) игрока A в ситуации (Α1,Β1) (а точнее, проигрыш) в сопоставлении с его выигрышем (— 1) в ситуации (А2,B2) выглядит, разумеется, вполне сокрушительно.

Что же касается ситуации, когда фирмы уделяют основное внимание разным  рынкам (А1,B2)   и (А2, Β1), то здесь фирму A ждет настоящий выигрыш, больший на более выгодном рынке. Потери, которые при этом несет фирма B,  оказываются прямо противоположными. Ясно, что точно рассчитать выгоду и ущерб сторон в этом  конфликте заранее довольно трудно. 

ЧТО ПОНИМАЮТ ПОД РЕШЕНИЕМ БИМАТРИЧНОЙ ИГРЫ?

В приведенном  примере описана ситуация, в которой интересы  игроков не совпадают. Естественно встает вопрос о том, какие  рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы  будем понимать под решением биматричной игры? Вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле  удовлетворяло обоих игроков. Попробуем найти некую равновесную ситуацию, явное отклонение от которой одного из игроков уменьшало бы его выигрыш. Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, как оказалось, существует далеко не  всегда — конечно, если ограничиваться только чистыми стратегиями игроков A и B, т. е. стратегиями A1, …, Am и B1, …, Bn. Естественно ожидать, что в более сложном случае биматричной игры дело вряд ли обстоит проще. На вопрос о существовании ситуации равновесия отвечает следующая теорема.
Теорема (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Рассмотренные примеры являются иллюстративными в смысле условности значений выигрышей сторон. Эти выигрыши назначались нами в соответствии с простым предпочтением одного исхода над другим без детализации, на сколько или во сколько раз сильнее то или иное предпочтение. Для таких игр — «игр с предпочтениями» — бессмысленно говорить о применении смешанных стратегий. Если же биматричная игра описывается в шкале полезностей не менее совершенной, чем интервальная, то рассмотрение смешанных стратегий оправдано, если это допустимо их интерпретацией в рамках данного конфликта.  Итак, ситуация равновесия по Нэшу — это схема анализа, пригодная для случая, когда никакое кооперирование не допускается.

ЧТО ДЕЛАТЬ, ЕСЛИ И РАВНОВЕСНЫЙ (ПО НЭШУ) ВЫИГРЫШ УЧАСТНИКОВ НЕ УСТРАИВАЕТ? 

В таком случае им ничего не остается, как начать обмениваться информацией и договариваться о совместном поведении в игре.  Математической моделью конфликта при таком подходе становится кооперативная игра, которая ведется по следующим правилам:
• разрешено заключать совместные соглашения;
• допускается совместный выбор стратегий (в общем случае — смешанных);
• допускается передавать полезность от одного игрока к другому (хотя, возможно, и не всегда линейно).

Каждый из приведенных пунктов правил ведения кооперативных игр в целом означает следование принципу групповой рациональности. Однако последний пункт, хотя и предполагает, что игроки могут «покупать и продавать» друг другу имеющуюся в их распоряжении полезность, чтобы улучшить собственное положение в игре, не накладывает каких-либо ограничений на то, как это должно делаться.

ПОНЯТИЕ КООПЕРАТИВНОЙ ИГРЫ.
Выше мы рассматривали игры, в которых игроки не имели права вступать в соглашения, образовывать коалиции. Рассмотрим теперь так называемые кооперативные игры, в которых игроки могут вступать в соглашения, образовывать коалиции. Такие ситуации могут возникать особенно часто, если рассматриваются игры n лиц. Следует отметить, что при содержательном анализе процедур совместного принятия решений в таких кооперативных играх необходимы дополнительные сведения, касающиеся возможных действий коалиций, их предпочтений, способов обмена ими информацией о принимаемых решениях и т. д. Как отмечалось выше, равновесие является важнейшим принципом оптимальности в бескоалиционных играх, в которых не рассматривается образование коалиций. Коалиция является формой кооперации, направленной на увеличение персональных возможностей игроков, то есть на увеличение их выигрышей. В матричной игре кооперация игроков лишена смысла, так как в такой игре улучшение положения одного из них приводит к ухудшению положения другого. Ситуация меняется при переходе от матричной игры к биматричной, так как в биматричных играх кооперация может улучшить положение обоих игроков. В биматричной игре имеется лишь одна нетривиальная коалиция (коалиция, состоящая более чем из одного игрока) — коалиция обоих игроков. Для пояснения отличий между индивидуальным выбором решений обоими игроками и совместным принятием решения коалицией этих игроков рассмотрим следующий пример.
ПРИМЕР БИМАТРИЧНОЙ ИГРЫ «КОНКУРС НА РЕАЛИЗАЦИЮ ПРОЕКТА». 

Две фирмы участвуют в конкурсе на реализацию проекта, причем доход от реализации проекта составит 10 у.е. Каждая фирма может либо подать простую заявку на участие в конкурсе (затраты равны 1 у.е.), либо представить программу реализации проекта (затраты составят 3 у.е.). По условиям конкурса, если обе фирмы выбирают одинаковый способ подачи заявки, то заказ (и доход) на реализацию проекта делится между ними пополам. Если же фирмы выбирают различные способы действий, то предпочтение отдается фирме, которая представит программу. Требуется разрешить эту конфликтную ситуацию. 
РЕШЕНИЕ. Представим описанную конфликтную ситуацию в виде биматричной игры. Игроками A и B здесь выступают фирмы, стратегия A1 (B1) — подача заявки на участие в конкурсе, стратегия A2 (B2 ) — представление программы действий.
Количественно выигрыши игроков можно выразить следующим образом:
 

Решив эту игру, найдем единственную равновесную ситуацию p = q = 0 , или (A2 , B2)
с выигрышем H1(0, 0) = H2 (0, 0) = 2 . В этом случае каждая фирма получает прибыль, равную 2 у.е. Для этого обе фирмы должны представить программу действий и поделить пополам доход от реализации проекта. Ни одному из этих игроков невыгодно отклоняться от этой стратегии, так как это может только уменьшить его выигрыш. Но если игроки одновременно отклоняются от оптимальной (равновесной по Нэшу) стратегии, то возникает ситуация (A1,B1), которая очевидно является более выгодной для обоих из них с выигрышем H1(1,1)=  H2(1,1) = 4. Однако переход к этой ситуации возможен только как результат договора между игроками, что осуществимо лишь при создании коалиции этих игроков. Объединение игроков в коалицию требует как минимум возможности обмена информацией между ними. Если же игроки не могут обмениваться информацией, то каждый из них будет опасаться менять выбранную им чистую стратегию A2 (B2) на стратегию A1 (B1) , так как это приводит к уменьшению выигрыша отклонившегося игрока.
Рассмотренный пример демонстрирует важную особенность биматричных игр — возможность наличия противоречия между выгодностью и устойчивостью (положением равновесия). Действительно, ситуация (A2 , B2) является устойчивой, но невыгодной; а ситуация (A1 , B1) — выгодной, но неустойчивой. Поэтому если игроки заключают между собой договор — обоим придерживаться стратегии (A1 , B1) , то этот договор будет находиться под угрозой нарушения, так как каждому игроку выгодно его одностороннее нарушение.
ОПТИМАЛЬНОСТЬ В КООПЕРАТИВНЫХ ИГРАХ.

При исследовании кооперативного аспекта в теории игр внимание обращается, как правило, не на ситуации игры, а на ее исходы. В соответствии с этим в основе оптимальности лежит идея выгодности. Проанализируем, как может реализовываться идея выгодности в рамках неантагонистической игры двух лиц. Пусть Ai — множество стратегий первого игрока, а Bj — множество стратегий второго игрока. Если игроки образуют коалицию, то они могут создавать любую ситуацию (Ai , Bj), и, таким образом, реализовать любой исход игры. Возникает вопрос, какой исход игры следует считать в этом случае наиболее выгодным для коалиции, то есть оптимальным для нее.
Так, в рамках примера «КОНКУРС НА РЕАЛИЗАЦИЮ ПРОЕКТА»  игроки, объединившись в коалицию, предпочтут исход (A1 , B1) исходу (A2 , B2), однако исходы (A1, B2) и (A2, B1) также являются «кандидатами» на оптимальность.
В общем случае для биматричной игры рассмотрение вопроса о ее оптимальности с точки зрения коалиции удобно представить в геометрической форме. На координатной плоскости (Н1 , Н2 ) изобразим точки, координатами которых являются выигрыши игроков (aij , bij) для каждой возможной ситуации (Ai, Bj). При этом возникает «картинка», похожая на ту, что изображена на рисунке 12.
Так как коалиция может выбирать любой из представленных девяти исходов, то фактически получается задача двухкритериальной оптимизации, где первый игрок стремится максимизировать критерий H1 , а второй — критерий H2 . Анализ такой многокритериальной задачи можно провести в два этапа.

1)    На первом этапе мы проводим мажорирование (доминирование) стратегий по Парето. Отбрасывая исходы, доминируемые по Парето, получаем множество Парето-оптимальных исходов. В примере, представленном на рисунке 12,  Парето-оптимальными являются исходы {4, 5, 6, 8} .  Выбор оптимального исхода следует производить из множества Парето-оптимальных исходов.
2)    На втором этапе необходимо решить вопрос — какое из Парето-оптимальных решений следует считать оптимальным? На первом этапе игроки выступают как союзники, так как этот шаг выгоден обоим из них. Однако на втором этапе, при сравнении любых двух Парето-оптимальных решений, игроки из союзников превращаются в противников: так как увеличение выигрыша одного из них влечет за собой уменьшение выигрыша другого.

H2











0                                                                                                      H1
Рисунок 12.  Нахождение Парето-оптимальных решений.

Для решения задачи нахождения оптимального исхода в кооперативной игре сделаем еще одно допущение: возможно использование не только чистых, но и смешанных стратегий.
Это приводит к тому, что вместе с двумя чистыми исходами (H1 , H2 ) и ( H1’ , H2’) коалиция может реализовать также исход:
λ × (H1, H2) + (1-λ) × ( H1’, H2’) = (λ × H1 + (1-λ) ×  H1’,  λ × H2 + (1-λ) ×  H2’), 

где число λ  удовлетворяет условию 0 ≤ λ ≤ 1.

С геометрической точки зрения, это означает, что множество исходов биматричной игры превращается в многоугольник D (рисунок 13), вершинами которого будут точки (aij, bij). При этом исходы, оптимальные по Парето, образуют «северо-восточную» границу этого многоугольника, а именно, это ломаная (8, 6, 4, 5).


H2











0                                                                                             H1
Рисунок 13. Многоугольник исходов D.

Задача нахождения кооперативного решения биматричной игры сводится теперь к построению правила, которое для каждого такого многоугольника исходов D указывает единственный оптимальный исход, принадлежащий его «северо-восточной» границе.  Рассмотрим решение этой задачи, известное как АРБИТРАЖНОЕ РЕШЕНИЕ НЕША.
ЧТО ТАКОЕ АРБИТРАЖНОЕ РЕШЕНИЕ НЭША?

Арбитражное решение представляет собой некую систему требований (аксиом), с помощью которых для любой игры выделяется ее единственное решение — оптимальный исход этой игры.
Пусть νA и νB — цены матричных игр с матрицами A и B соответственно. Тогда в явном виде арбитражное решение Нэша для пары (H1, H2) — это точка (H1* , H2*), для которой произведение (функция полезности):
U = (H1  –  νA) × (H2 –  νB)
достигает своего наибольшего значения в той части области D возможных исходов биматричной игры, в которой выполняются условия:
H1 >  νA, H2 >  νB.

РАЗДЕЛ 3. ТЕХНОЛОГИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ И СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ.

В ЧЕМ СОСТОИТ ОСОБЕННОСТЬ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ДЕЙСТВИЯ ПРИРОДНО-НЕОПРЕДЕЛЕННЫХ ФАКТОРОВ («ПРИРОДА»)?

Многие экономические задачи принятия решений в условиях неопределенности содержат    неопределенность особого вида.  Эта неопределенность заключается в том, что лицо, принимающее решение, недостаточно информировано об объективных внешних условиях, в которых будет приниматься это решение. Неопределенность такого вида не связана с сознательным целенаправленным противодействием противника; такая неопределенность  может порождаться различными причинами: нестабильностью экономической ситуации, рыночной конъюнктурой, курсами валют, уровнем инфляции, налоговой политикой, изменяющимся покупательским спросом и т.д. То есть в задачах подобного рода выбор решения зависит от состояний объективной экономической действительности, называемой в модели «ПРИРОДОЙ», а математические модели подобных конфликтных  ситуаций называются ИГРАМИ «С ПРИРОДОЙ».  Термин «ПРИРОДА» характеризует некую объективную действительность, которую не следует понимать буквально. Хотя вполне могут встречаться ситуации, в которых игроком может действительно выступать природа. Например, обстоятельства, связанные с погодными условиями  или с природными стихийными  силами. Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но «стихийным силам природы» нельзя приписать разумные действия, направленные против человека  и тем более какой-либо «злой умысел». Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы, но без явной антагонистической окраски.

ОСНОВНЫЕ ПОНЯТИЯ ИГРЫ С «ПРИРОДОЙ».

В игре «с природой» участвуют два игрока.

Игрок 1 – это лицо, принимающее решение (ЛПР), обозначим его «А».

Игрок 2 – это «ПРИРОДА», обозначим его «Q».

В играх «с природой» сознательно действует только один из участников  – лицо, принимающее решение (ЛПР).  «ПРИРОДА» является вторым игроком, но не противником игрока А. Так как «ПРИРОДА» осознанно против первого игрока не действует, принимает то или иное свое состояние определенным образом, конкретных целей в игре не преследует и безразлична к результату игры.  То есть «ПРИРОДА», являясь игроком в игре «с природой», не является ни противником, ни союзником игрока А. Формально изучение игр «с природой», так же как и стратегических, должно начинаться с построения матрицы выигрышей (платежной матрицы), что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки, допущенные при формировании матрицы выигрышей (платежной матрицы), не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.
Матрица игры «с природой» аналогична платежной матрице стратегической игры «m x n» (рисунок 14).  Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) – состояниями или условиями природы.
Пусть игрок 1 –  «A» (лицо, принимающее решение),  имеет m стратегий Ai, i = 1, …, m.   Игрок 2 – «ПРИРОДА»,  может находиться в одном из n возможных состояний Qj, j = 1, …, n. Состояния природы Qj можно рассматривать как ее возможные «стратегии».   Обычно предполагается, что игрок A (ЛПР) в состоянии оценить результаты выбора им каждой из своих стратегий Ai,  i=1,…,m, при каждом состоянии природы Qj, j=1,…,n. Эти результаты количественно выражаются действительными числами aij, и называются выигрышами игрока A (ЛПР) в игре «с природой». 

Так как в играх «с природой» в качестве первого игрока всегда выступает человек (ЛПР), то можно составить матрицу выигрышей (платежную матрицу)  игры «с природой»  –  матрицу размера «m x n» с элементами {aij}.  Номер строки матрицы соответствует номеру стратегии, применяемой первым игроком – человеком (ЛПР).  Номер столбца соответствует номеру состояния  «ПРИРОДЫ»   – второго игрока. 
Элемент матрицы aij – это выигрыш  игрока 1 (ЛПР), если он выбрал стратегию Ai при состоянии природы Qj.

В ЧЕМ СОСТОИТ СОДЕРЖАТЕЛЬНОЕ ОТЛИЧИЕ МАТРИЦЫ ВЫИГРЫШЕЙ В ИГРЕ С «ПРИРОДОЙ»?

Содержательное отличие матрицы выигрышей в игре «с природой» от платежной матрицы антагонистической игры заключается в том, что элементы столбцов этой матрицы не являются проигрышами «природы» при соответствующих ее состояниях. Выигрыши aij платит, естественно, не «ПРИРОДА», а некая третья сторона или совокупность сторон, влияющих на принятие решения игроком 1, и объединенных в понятие «ПРИРОДА».

                      СОСТОЯНИЯ  «ПРИРОДЫ»

СТРАТЕГИИ ЛПР     Q1    Q2    …    Qn
A1    a11    a12    …    a1n
A2    a21    a22    …    a2n
…    …    …    …    …
Am    am1    am2    …    amn

Рисунок 14. Матрица игры «с природой» (матрица выигрышей).

Если в распоряжении игрока A всего одна стратегия A1, то есть  m =1, то проблема выбора им оптимальной стратегии отпадает. Поэтому в дальнейшем целесообразно считать m ≥ 2.

Если «ПРИРОДА» Q может пребывать только в одном состоянии Q1, то есть n =1, то проблема выбора игроком A оптимальной стратегии превращается в тривиальную: игрок A  должен выбрать стратегию Ak  такую, что выигрыши аk1 ≥ ai1, i=1,…, m. Поэтому будем предполагать, что n ≥ 2.

В ЧЕМ ЗАКЛЮЧАЮТСЯ ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ И СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ?

Методы принятия решений в играх «с природой» зависят от того, известны или нет вероятности состояний (стратегий) «ПРИРОДЫ» Q.
 
Случай 1. Пусть события, состоящие в том, что «ПРИРОДА» Q находится в одном из своих состояний Q1, …, Qn,  несовместны  и составляют полную группу событий.   При этом  вероятности pj  состояний «ПРИРОДЫ» Qj известны, то есть известны значения

 

где выполнены условия:   
 

В этом случае имеет место ситуация риска, и решения принимаются в условиях риска (СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ).

Случай 2. Если вероятности, с которыми «ПРИРОДА»  Q может находиться в том или ином своем состоянии,  неизвестны и отсутствует возможность получения о них какой-либо статистической информации, то имеет место ситуация полной неопределенности, и решения принимаются в условиях полной неопределенности (ДЕЙСТВИЯ ПРИРОДНО-НЕОПРЕДЕЛЕННЫХ ФАКТОРОВ).

Цель в играх «с природой»: независимо от вида матрицы игры требуется выбрать такую стратегию игрока A (ЛПР), которая была бы наиболее выгодной по сравнению с другими.

КАКОВЫ ОСНОВНЫЕ КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ В УСЛОВИЯХ ДЕЙСТВИЯ ПРИРОДНО-НЕОПРЕДЕЛЕННЫХ ФАКТОРОВ?

Рассмотрим игру «с природой», в которой вероятности pj состояний природы Qj неизвестны, и отсутствует всякая возможность получения о них какой-либо статистической информации. То есть мы находимся в состоянии полной неопределенности, связанной с отсутствием  информации о вероятностях состояний природы. Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной». В случаях неопределенности такого вида («безнадежной» неопределенности) для выбора наилучших решений в играх «с природой» применяются следующие классические критерии.
 
КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

Первая группа критериев – это КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ  относительно выигрышей.  Здесь мы рассмотрим следующие критерии.  

1)    МАКСИМИННЫЙ КРИТЕРИЙ ВАЛЬДА (КРИТЕРИЙ ГАРАНТИРОВАННОГО РЕЗУЛЬТАТА).
2)    КРИТЕРИЙ МАКСИМАКСА (КРИТЕРИЙ КРАЙНЕГО ОПТИМИЗМА).
3)    КРИТЕРИЙ ПРОИЗВЕДЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.
4)    КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С ПОКАЗАТЕЛЕМ ОПТИМИЗМА λ.
5)    ОБОЩЕННЫЙ КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С КОЭФФИЦИЕНТАМИ   (КРИТЕРИЙ ОБОБЩЕННОГО МАКСИМИНА ГУРВИЦА). 

Вторая группа критериев – это КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ относительно рисков. К ним относятся следующие критерии.
6)    КРИТЕРИЙ МИНИМАКСНОГО РИСКА СЭВИДЖА.
7)    КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО РИСКОВ. 

КАК  ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С МАКСИМИННЫМ КРИТЕРИЕМ ВАЛЬДА?  

При применении данного критерия «ПРИРОДА» рассматривается  как агрессивно настроенный и сознательно действующий противник,  как в матричной игре. Поэтому выбирается стратегия, гарантирующая выигрыш не меньший, чем «нижняя цена игры с природой».

В соответствии с этим критерием из всех самых неудачных результатов выбирается самый лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, когда, например, игрок не столько заинтересован в крупной удаче, сколько хочет «застраховать» себя от неожиданных проигрышей.  Выбранное таким образом решение полностью исключает риск.  Это означает, что ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать максиминный критерий Вальда одним из фундаментальных. Поэтому в технических и экономических задачах он применяется чаще всего как сознательно, так и неосознанно. Таким критерием часто пользуются и в обиходе. Использование критерия Вальда подтверждается известными поговорками: «Береженого Бог бережет», «Лучше синица в руках, чем журавль в небе», «Семь раз отмерь, один отрежь».

Максиминный критерий Вальда (критерий гарантированного результата) обеспечивает максимизацию минимального выигрыша, или, что то же самое, минимизацию максимальных потерь, которые могут произойти при выборе одной из стратегий.  Выбор такой стратегии определяется отношением игрока к риску.

Обозначим показатель эффективности стратегии Аi по максиминному критерию Вальда через Wi.

Для показателя эффективности Wi имеем формулу:

 

Таким образом, показатель эффективности Wi стратегии Аi по максиминному критерию Вальда есть минимальный выигрыш игрока A при применении им этой стратегии.

Цена игры по максиминному критерию Вальда (обозначим ее через W) находится по формуле:

 

Оптимальной среди чистых стратегий по критерию Вальда является стратегия Ak с максимальным показателем эффективности:
 

ПРАВИЛО ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ ПО МАКСИМИННОМУ КРИТЕРИЮ ВАЛЬДА.

Сформулируем правило выбора оптимальных решений в соответствии с максиминным критерием Вальда. 

Матрица выигрышей дополняется ещё одним столбцом с элементами Wi , i = 1, …, m,  – показателями эффективности стратегий Ai  . Действительное  число Wi  равно минимальному выигрышу игрока A при применении им стратегии Ai  и определяется по формуле (1). 
Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Wk  является максимальным (то есть Wk = W, где W определяется по формуле (2)).

Таким образом, оптимальной среди чистых стратегий по максиминному критерию Вальда считается  та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий.  Выбор оптимального решения, в общем случае, не является однозначным. Этому критерию оптимальности может соответствовать несколько чистых стратегий.   Выбранные таким образом варианты решений полностью исключают риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Какие бы условия ни встретились, соответствующий результат не может оказаться ниже W. Оптимальная чистая стратегия по критерию Вальда гарантирует при любых состояниях «ПРИРОДЫ» выигрыш, не меньший «максимина» W. Максиминный критерий Вальда является критерием крайнего пессимизма игрока A, поскольку игрок A,  принимая решение, действует по принципу наибольшей осторожности.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ МАКСИМАКСА (КРИТЕРИЙ КРАЙНЕГО ОПТИМИЗМА)? 

При использовании данного критерия игрок A (ЛПР) ориентируется на то, что условия функционирования анализируемых систем будут для него благоприятными. Вследствие этого оптимальным решением является та стратегия, которая приводит к получению максимального значения критерия оптимальности в платежной матрице.  Критерий максимакса максимизирует максимальные выигрыши для каждого состояния природы. Критерий максимакса (крайнего оптимизма) противоположен максиминному критерию Вальда (крайнего пессимизма). Игрок A, пользуясь максимаксным критерием, предполагает, что природа Q будет находиться в благоприятнейшем для него состоянии. Поэтому игрок A ведет себя легкомысленно, с «шапкозакидательским» настроением, так как уверен в наибольшем выигрыше. Ситуации, требующие применения критерия максимакса в экономике нередки. Пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение. Например, когда перед игроком A стоит дилемма: или получить наибольший выигрыш, или стать банкротом. В быту подобные ситуации иллюстрируются  поговорками: «или пан, или пропал», «кто не рискует, тот не выигрывает».

Оптимальная чистая стратегия по критерию максимакса гарантирует игроку A возможность выигрыша, равного «максимаксу».

Показатель эффективности стратегии Ai по максимаксному критерию обозначим через Mi и определим по формуле:

 

Таким образом, показатель эффективности чистой стратегии Ai по критерию максимакса равен максимальному выигрышу игрока A при выборе им этой стратегии.

Цена игры M по критерию максимакса определяется по формуле:

 

Оптимальная стратегия по критерию максимакса определяется как стратегия Аk с максимальным показателем эффективности:
 

ПРАВИЛО ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ ПО КРИТЕРИЮ МАКСИМАКСА.

Сформулируем правило выбора оптимальных решений в соответствии с критерием максимакса. 

Матрица выигрышей дополняется ещё одним столбцом с элементами Mi , i = 1, …, m,  –  показателями эффективности стратегий Ai  . Действительное  число Mi  равно максимальному  выигрышу игрока A при применении им стратегии Ai  и определяется по формуле (3). 
Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Mk  является максимальным (то есть Mk = M, где M определяется по формуле (4)).

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ ПРОИЗВЕДЕНИЙ В УСЛОВИЯХ  ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ?

С самого начала этот критерий ориентирован на величины выигрышей, то есть  на положительные значения aij. Данный критерий применяется в случае, когда все элементы матрицы выигрышей положительны:  aij > 0, i= 1, …,  m; j = 1, …, n. Опишем критерий произведений применительно к ситуациям полной неопределенности, то есть когда вероятности состояний природы неизвестны.

Показатель эффективности стратегии Ai в соответствии с критерием произведений в условиях полной неопределенности  обозначим через Pi и определим  по формуле:

 

Таким образом, показатель эффективности Pi чистой стратегии Ai по критерию произведений (в условиях полной неопределенности)  равен произведению всех выигрышей игрока A при выборе им этой стратегии.

Цена игры P по критерию произведений определяется по формуле:

 
   
Оптимальная стратегия Ak по критерию произведений определяется как стратегия с максимальным показателем эффективности Pk = P.

ПРАВИЛО ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ ПО  КРИТЕРИЮ ПРОИЗВЕДЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

Правило выбора оптимальной стратегии по критерию произведений в условиях полной неопределенности формулируется так.

Матрица выигрышей дополняется ещё одним столбцом с элементами Pi , i = 1, …, m,  –  показателями эффективности стратегий Ai  . Действительное  число Pi  равно произведению всех  выигрышей игрока A при применении им стратегии Ai  и определяется по формуле (5). 
Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Pk  является максимальным (то есть Pk = P, где P определяется по формуле (6)).

Применение критерия произведений (P-критерия) в условиях полной неопределенности обусловлено следующими  обстоятельствами:
- вероятности появления состояний Qj неизвестны;
- с появлением каждого из состояний Qj по отдельности необходимо считаться; - критерий применим и при малом числе реализаций решения; - некоторый риск допускается.
Если условие aij > 0, i= 1, …,  m; j = 1, …, n;  нарушается, а P-критерий приходится применять и в этом случае, то следует выполнить некоторый сдвиг  aij + b каждого элемента матрицы выигрышей aij с некоторой константой
 
 
Ясно, что результат применения P-критерия существенно зависит от этого значения b.
На практике в качестве значения b охотно используют  
величину
 
 
Если же никакая константа не может быть признана имеющей смысл, то к таким проблемам Р-критерий не применим.
Выбор оптимального решения согласно Р-критерию  оказывается значительно менее пессимистическим, чем, например,  выбор в соответствии с максиминным критерием Вальда.

В результате применения Р-критерия  происходит некоторое выравнивание между большими и малыми  значениями выигрышей aij, и, устанавливая оптимальный вариант решения с помощью Р-критерия, мы можем при фиксированных состояниях Qj получить большую выгоду, чем при использовании критерия гарантированного результата, но при этом должна учитываться возможность  появления и худших результатов.

Следует отметить, что при  использовании этого критерия ни число реализаций, ни информация о распределении вероятностей не принимаются во внимание.

В ЧЕМ ЗАКЛЮЧАЕТСЯ СУЩНОСТЬ КРИТЕРИЯ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С ПОКАЗАТЕЛЕМ ОПТИМИЗМА  ?

Представляется логичным, что при выборе оптимального решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы Q. Такой компромиссный вариант и был предложен Гурвицем.  Стараясь занять уравновешенную позицию, Гурвиц предложил критерий, оценочная функция которого находится где-то между точками предельного оптимизма и крайнего пессимизма.  Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.

Определим показатель эффективности Hi стратегии Ai по формуле:
 
 

где число λ удовлетворяет условию:  

В формуле (5)  величина    называется показателем оптимизма,  соответственно     –   это показатель пессимизма игрока A .
 
Цена игры H по критерию пессимизма-оптимизма Гурвица с показателем оптимизма     определяется по формуле

 

Согласно этому критерию оптимальная стратегия Ak выбирается в соответствии с максимальным показателем эффективности Hk = H.
       
Таким образом, согласно критерию пессимизма-оптимизма Гурвица для каждой стратегии Ai  необходимо определить линейную комбинацию Hi минимального и максимального выигрышей при данной стратегии, и выбрать  ту стратегию Ak, для которой величина Hk окажется максимальной.  Чем ближе к единице показатель оптимизма  , тем ближе к нулю показатель пессимизма  , и тем больше оптимизма и меньше пессимизма. И наоборот. Таким образом, число    выбирается в пределах от 0 до 1 в зависимости от склонности игрока A к оптимизму или пессимизму. При показателе оптимизма    = 1 критерий Гурвица превращается в кри¬терий максимакса, а при      – совпадает c максиминным критерием Вальда.  В случае,  когда  , то и   . То есть показатели оптимизма и пессимизма одинаковы. Это означает, что игрок A при выборе стратегии ведет себя нейтрально.  В прикладных задачах бывает трудно правильно выбрать значение показателя  . Поэтому чаще всего весовой множитель   без возражений принимается в качестве некоторой «средней» точки зрения. На выбор значения показателя оптимизма   оказывает влияние мера ответственности. Чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение (ЛПР) застраховаться, то есть показатель пессимизма   ближе к единице.

В КАКИХ УСЛОВИЯХ ПРИМЕНЯЕТСЯ КРИТЕРИЙ ПЕРССИМИЗМА-ОПТИМИЗМА ГУРВИЦА?

Применение критерия Гурвица оправдано, если ситуация, в которой он используется, характеризуется следующими обстоятельствами.

- о вероятностях появления состояний природы Qj ничего не известно;
- с появлением состояний природы Qj необходимо считаться;
- реализуется лишь малое количество решений;
- допускается некоторый риск.

ОБОБЩЕННЫЙ КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С КОЭФФИЦИЕНТАМИ  ,   , …,    (КРИТЕРИЙ ОБОБЩЕННОГО МАКСИМИНА ГУРВИЦА).

Для применения этого критерия переставим в каждой строке Ai матрицы игры A выигрыши игрока 1 (ЛПР) в неубывающем порядке. Обозначим элементы полученной матрицы через bij, а саму матрицу - через B (рисунок 15).

                      «ПРИРОДА»
ЛПР     1    2    …    n
B1    b11    b12    …    b1n
B2    b21    b22    …    b2n
…    …    …    …    …
Bm    bm1    bm2    …    bmn








Рисунок 15. Матрица B.

Для элементов матрицы B (рисунок 15) имеем следующие неравенства:

 

Матрица B получена из матрицы A перестановкой элементов каждой ее строки в неубывающем порядке.

В силу неравенств (9)  в первом столбце матрицы B расположены минимальные выигрыши игрока A при использовании стратегий Ai:

 

в последнем столбце матрицы B – максимальные выигрыши при использовании стратегий Ai:

 

Другими словами, в первом столбце матрицы B стоят показатели эффективности Wi  стратегий Ai по максиминному критерию Вальда, а в n-м столбце – показатели эффективности Mi стратегий Ai по критерию максимакса.

Рассмотрим неотрицательные числа  ,   , …,  , удовлетворяющие условию

 

Показателем оптимизма игрока A  называется число   , определенное по формулам:
 
и

 
где   - целая часть числа   , когда n - нечетное.

Соответственно, показателем пессимизма игрока A  называется число   , определенное по формулам:
 
и

 

Очевидно, что   

Показатель эффективности Gi стратегии Аi по критерию обобщенного максимина Гурвица определяется по формуле:
 


Цену игры по критерию обобщенного максимина Гурвица определим  по формуле:

 

Оптимальной чистой стратегией является та стратегия Аk, для которой показатель эффективности Gk является максимальным, то есть Gk=G.
 
Отметим, что критерий обобщенного максимина Гурвица учитывает все выигрыши при каждой стратегии, что необходимо для более полной картины эффективности стратегий.

Отметим следующие частные случаи критерия обобщенного максимина Гурвица.

Случай 1. Если   , 
то критерий обобщенного максимина Гурвица представляет собой максиминный критерий Вальда.

Случай 2. При  ,
из критерия обобщенного максимина Гурвица получаем критерий максимакса.

Случай 3. Если    где  ,  то критерий обобщенного максимина Гурвица является критерием пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма  .

В ЧЕМ СОСТОИТ СУЩНОСТЬ КРИТЕРИЯ МИНИМАКСНОГО РИСКА СЭВИДЖА?

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем (Savage) и получил название «принципа Сэвиджа». Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.  При выборе возможной стратегии в игре с природой игрок A (игрок-ЛПР) должен исходить из матрицы выигрышей. Однако, матрица выигрышей не всегда адекватно отражает имеющуюся ситуацию.  По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, «правильного» при данном состоянии природы. Естественно считать, что «правильное» решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю. При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.  Для решения задачи строится так называемая «матрица рисков», элементы которой показывают, какой убыток понесет игрок A (ЛПР) в результате выбора «неправильного» варианта решения.В соответствии с критерием «минимального риска» на выбор стратегии должны влиять не только выигрыши, составляющие матрицу решений.  Должны учитываться показатели благоприятности состояний природы для увеличения выигрыша и показатели удачности выбора игроком A своей чистой стратегии Ai при состоянии природы Qj.
 
ЧТО ТАКОЕ ПОКАЗАТЕЛЬ БЛАГОПРИЯТНОСТИ СОСТОЯНИЯ ПРИРОДЫ?

ПОКАЗАТЕЛЕМ БЛАГОПРИЯТНОСТИ СОСТОЯНИЯ Qj ПРИРОДЫ Q называется максимальный выигрыш игрока А при этом состоянии, то есть максимальный элемент j-го столбца матрицы выигрышей: 
 

ЧТО ТАКОЕ РИСК ИГРОКА?

Для характеристики степени удачности выбора игроком А своей стратегии Ai при состоянии природы Qj, вводят понятие РИСКА.

РИСКОМ Rij ИГРОКА А ПРИ ВЫБОРЕ ИМ СТРАТЕГИИ Ai И ПРИ СОСТОЯНИИ ПРИРОДЫ Qj  называют разность между показателем благоприятности βj и выигрышем aij:
  
 

Другими словами, риск – это разность между выигрышем, который игрок А  получил бы, если бы он точно знал, что состоянием природы будет Qj,  и выигрышем, который игрок А получит, не имея этой информации и применяя свою стратегию Ai.  Таким образом, риск Rij игрока А представляет собой упущенную возможность максимального выигрыша  βj (то есть упущенную выгоду) при данном состоянии природы Qj. Эта упущенная возможность определяется невыигранной частью максимального выигрыша. Следовательно, величину риска Rij можно интерпретировать как своеобразную плату  за отсутствие информации  о действительном состоянии природы. Поскольку точная информация о состоянии природы Qj позволила бы игроку А выбрать ту стратегию Ai,  при которой его выигрыш был бы максимальным, то есть βj.

ЧТО ТАКОЕ КОЛЕБАНИЕ ВЫИГРЫШЕЙ ПРИ СОСТОЯНИИ ПРИРОДЫ?

Введем величину γj
 

Величина γj  –  это минимальный выигрыш игрока А  при состоянии природы Qj.

Разность
 

между максимальным выигрышем βj игрока А при состоянии природы Qj и минимальным выигрышем γj игрока А при этом состоянии называют КОЛЕБАНИЕМ ВЫИГРЫШЕЙ ПРИ СОСТОЯНИИ ПРИРОДЫ Qj.

Мы можем установить границу изменения риска Rij:

 .

КАК ФОРМИРУЕТСЯ МАТРИЦА РИСКОВ?

Для данной матрицы выигрышей А размера «m x n» матрица рисков RA имеет тот же размер «m x n» (рисунок 16).

R11    R12    …    R1n
R21    R22    …    R2n
…    …    …    …
Rm1    Rm2    …    Rmn



     





Рисунок 16. Матрица рисков RA.

ЧТО ХАРАКТЕРИЗУЕТ МАТРИЦА РИСКОВ?

В игре с природой возможны следующие ситуации.
1.    Возможны одинаковые выигрыши игрока 1 при одной и той же стратегии, но при разных состояниях природы.
2.    Возможны одинаковые выигрыши игрока 1 при разных стратегиях, но при одном и том же состоянии природы.  

Матрица рисков проясняет, насколько удачна стратегия Ai при разных состояниях природы  Qj и Ql . 

Случай 1. Пусть стратегия Ai дает одинаковые выигрыши aij  = ail при разных состояниях природы Qj и Ql, j ≠ l . При этом риски игрока А равны соответственно Rij и R il .

Если Rij <  Ril , то выбор стратегии  Ai по отношению к состоянию природы Qj более удачлив, чем по отношению к состоянию природы Ql.   

То есть МАТРИЦА РИСКОВ ПОКАЗЫВАЕТ НЕРАВНОЦЕННОСТЬ ОДИНАКОВЫХ ВЫИГРЫШЕЙ С ТОЧКИ ЗРЕНИЯ РИСКОВ ПРИ ОДНОЙ И ТОЙ ЖЕ СТРАТЕГИИ, НО ПРИ РАЗНЫХ СОСТОЯНИЯХ ПРИРОДЫ.

Случай 2. Пусть выигрыши игрока А одинаковы при разных стратегиях Ai, Ak , но при одном и том же состоянии природы, то есть aij = a kj. 
В этом случае риски Rij и R kj игрока 1 будут равны между собой:
Rij = βj – aij = βj – a kj = R kj.

Таким образом, С ТОЧКИ ЗРЕНИЯ РИСКОВ ОДИНАКОВЫЕ ВЫИГРЫШИ ИГРОКА А ПРИ РАЗНЫХ СТРАТЕГИЯХ, НО ПРИ ОДНОМ И ТОМ ЖЕ СОСТОЯНИИ ПРИРОДЫ ВСЕГДА РАВНОЦЕННЫ.

В ЧЕМ СОСТОИТ СУЩНОСТЬ КРИТЕРИЯ МИНИМАКСНОГО РИСКА СЭВИДЖА?

Критерий минимаксного риска Сэвиджа аналогичен максиминному критерию Вальда. Показатель эффективности Si стратегии Ai согласно критерию Сэвиджа определим по формуле
 

Таким образом, показатель эффективности Si стратегии Ai по критерию Сэвиджа равен максимальному риску игрока A при выборе им этой стратегии.

Определим значение S для выбора оптимальной стратегии по формуле
 
 

В соответствии с критерием Сэвиджа оптимальной является та стратегия Ak, которая имеет минимальный показатель эффективности Sk = S.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО РИСКОВ?

Согласно этому критерию для каждой стратегии Ai  необходимо определить показатель эффективности HRi как линейную комбинацию минимального и максимального рисков при данной стратегии:

 

где число p удовлетворяет условию:   
 
Определим значение HR для выбора оптимальной стратегии по формуле:

 

В соответствии с критерием пессимизма-оптимизма Гурвица относительно рисков в качестве оптимальной стратегии выбирают ту стратегию Ak, для которой показатель эффективности HRk является минимальным:  HRk = HR.

В частности, при p = 1 выбор оптимальной стратегии осуществляется по критерию минимаксного риска Сэвиджа.     

В ЧЕМ СОСТОИТ ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РЕШЕНИЯ В УСЛОВИЯХ ДЕЙСТВИЯ ПРИРОДНО-НЕОПРЕДЕЛЕННЫХ ФАКТОРОВ?
 
В случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны.  Применение математических методов в играх «с природой» не дает абсолютно достоверного результата. Выбор оптимальной стратегии  в известной степени является субъективным вследствие произвольности выбора критерия принятия решения. Но в любом случае, применение математических методов создает определенное упорядочение имеющихся в распоряжении ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений. Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной.

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ («СЛУЧАЙ»).

В случае стохастической неопределенности у ЛПР имеется полная информация о степени возможности тех или иных исходов операции для каждой стратегии в виде вероятностного распределения на множестве возможных результатов.

КАКОВЫ КРИТЕРИИ ПРИНЯТИЯ ОПТИМАЛЬНЫХ РЕШЕНИЙ В УСЛОВИЯХ СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ?

Мы изучим  следующие критерии принятия решений в условиях стохастической неопределенности.

1. КРИТЕРИЙ БАЙЕСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ (КРИТЕРИЙ МАКСИМУМА ОЖИДАЕМОГО СРЕДНЕГО ВЫИГРЫША).

2. КРИТЕРИЙ БАЙЕСА ОТНОСИТЕЛЬНО РИСКОВ (КРИТЕРИЙ МИНИМУМА ОЖИДАЕМОГО СРЕДНЕГО РИСКА).

3. КРИТЕРИЙ ЛАПЛАСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ (КРИТЕРИЙ «НЕДОСТАТОЧНОГО  ОСНОВАНИЯ» ЛАПЛАСА).

4. КРИТЕРИЙ ЛАПЛАСА ОТНОСИТЕЛЬНО РИСКОВ.

5. КРИТЕРИЙ ХОДЖА-ЛЕМАНА.

6. КРИТЕРИЙ ГЕРМЕЙЕРА.

7. КРИТЕРИЙ ПРОИЗВЕДЕНИЙ С УЧЕТОМ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ «ПРИРОДЫ».

8. МАКСИМАКСНЫЙ КРИТЕРИЙ С УЧЕТОМ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ «ПРИРОДЫ».

9. КРИТЕРИЙ БАЙЕСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С УЧЕТОМ ОТНОСИТЕЛЬНЫХ ЗНАЧЕНИЙ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ ПРИРОДЫ.

10. КРИТЕРИЙ МИНИМИЗАЦИИ СРЕДНЕГО КВАДРАТИЧНОГО ОТКЛОНЕНИЯ (ВАРИАЦИИ).

В  случае стохастической неопределенности, когда неуправляемым факторам (состояниям природы) поставлены в соответствие вероятности, заданные экспертно, или вычисленные, решение часто принимается на основе критерия максимума ожидаемого среднего выигрыша (критерий Байеса относительно выигрышей) или минимума ожидаемого среднего риска (критерий Байеса относительно рисков).
 
КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ БАЙЕСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ (КРИТЕРИЙ МАКСИМУМА ОЖИДАЕМОГО СРЕДНЕГО ВЫИГРЫША)?

Обозначим показатель эффективности стратегии Аi по критерии Байеса относительно выигрышей через Bi.  Для показателя эффективности Bi имеем формулу:

 

Таким образом, показатель эффективности Bi стратегии Аi по критерию Байеса равен  среднему значению (математическому ожиданию) выигрыша с учетом вероятностей pj всех возможных состояний Qj, j = 1, …, n,  «ПРИРОДЫ» Q.

Цена игры по критерию Байеса  (обозначим ее через B) находится по формуле:

 

Оптимальной среди чистых стратегий по критерию Байеса является стратегия Ak с максимальным показателем эффективности:
 

ПРАВИЛО ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ В СООТВЕТСТВИИ С КРИТЕРИЕМ БАЙЕСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ.

Сформулируем правило выбора оптимальных решений в соответствии с критерием Байеса относительно выигрышей. 

Матрица выигрышей дополняется ещё одним столбцом с элементами Bi , i = 1, …, m,  – показателями эффективности стратегий Ai  . Действительное  число Bi  равно среднему значению (математическому ожиданию) выигрыша игрока A при применении им стратегии Ai  и определяется по формуле (1).   Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Bk  является максимальным (то есть Bk = B, где B определяется по формуле (2)).

Таким образом,  решение, выбранное согласно критерию Байеса, является оптимальным не в каждом отдельном случае, а «в среднем».

КАКОВЫ УСЛОВИЯ ПРИМЕНИМОСТИ КРИТЕРИЯ БАЙЕСА?

Предполагается, что ситуация, в которой  принимается решение, характеризуется следующими  обстоятельствами:

- вероятности появления состояний природы Qj известны и не  зависят от времени;

-  решение реализуется (теоретически) бесконечно много раз;

- для малого числа реализаций решения допускается  некоторый риск.

Исходная позиция применяющего критерий Байеса предполагает  более высокий уровень информированности о вероятностях состояний Qj «ПРИРОДЫ» и достаточно длинные реализации. При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск практически исключен.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  БАЙЕСА ОТНОСИТЕЛЬНО РИСКОВ (КРИТЕРИЙ МИНИМУМА ОЖИДАЕМОГО СРЕДНЕГО РИСКА)?

Для применения критерий Байеса относительно рисков по исходной платежной матрице строится матрица рисков R = {Rij}(mxn).

Показателем эффективности BRi стратегии Ai по критерию Байеса относительно рисков называется математическое ожидание рисков, расположенных в i-й строке матрицы рисков {Rij}:

 

Оптимальной будет стратегия с минимальным значением среднего риска
 

Чистая стратегия Ak  игрока A  будет оптимальной стратегией, если BRk = BR.

ПРАВИЛО ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ В СООТВЕТСТВИИ С КРИТЕРИЕМ БАЙЕСА ОТНОСИТЕЛЬНО РИСКОВ.

Сформулируем правило выбора оптимальных решений в соответствии с критерием Байеса относительно рисков (критерий минимума ожидаемого среднего риска). 

Матрица рисков дополняется ещё одним столбцом с элементами BRi , i = 1, …, m,  – показателями эффективности стратегий Ai  . Действительное  число BRi  равно среднему значению (математическому ожиданию) риска  игрока A при применении им стратегии Ai  и определяется по формуле (3).   Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности BRk  является минимальным (то есть BRk = BR, где BR определяется по формуле (4)).

При этом справедливо утверждение о том, что критерии Байеса относительно выигрышей и относительно рисков эквивалентны, то есть по обоим критериям оптимальной будет одна та же стратегия.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  ЛАПЛАСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ (КРИТЕРИЙ «НЕДОСТАТОЧНОГО ОСНОВАНИЯ»)?

В предыдущих двух критериях Байеса известные вероятности состояний природы могли быть получены, например, на основании статистических исследований. Однако часто складывается такая ситуация, при которой мы лишены возможности определить эти вероятности. Но, желая принять решение в условиях риска, мы вынуждены оценивать эти вероятности состояний природы субъективно.

Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из таких способов заключается в том, что мы считаем состояния природы Qj равновероятными: p1 = p2 = ... = pn = 1/n. То есть мы не можем отдать предпочтение ни одному из состояний Qj «ПРИРОДЫ» Q. Этот принцип называют еще принципом «недостаточного основания» Лапласа.

Таким образом, показатель эффективности Li стратегии Ai будет равен:
Li = 1/n ∑ aij,

Цена игры по критерию Лапласа равна
L = max Li.

Оптимальная стратегия Ak определяется по формуле: Lk = L.
 
КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  ЛАПЛАСА ОТНОСИТЕЛЬНО РИСКОВ?

Для применения критерий Лапласа относительно рисков по исходной платежной матрице строится матрица рисков R = {Rij}(mxn).

Показателем эффективности LRi стратегии Ai по критерию Лапласа относительно рисков называется среднее значение рисков, расположенных в i-й строке матрицы рисков {Rij}:

 

Оптимальной будет стратегия с минимальным значением среднего риска
 

Чистая стратегия Ak  игрока A  будет оптимальной стратегией, если LRk = LR.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  ХОДЖА-ЛЕМАНА?
 
Этот критерий опирается одновременно на критерий Вальда и критерий Байеса.
 
Пусть Wi = min aij - показатель эффективности  стратегии Аi по критерию Вальда.
   
Пусть Bi  - показатель эффективности стратегии Аi по критерию Байеса.
Показатель эффективности стратегии Ai по критерию Ходжа-Лемана определяется по формуле:

HLi = (1-h) Wi + h Bi, где 0≤  h ≤ 1.
То есть показатель эффективности HLi чистой стратегии Аi равен:

 
В правой части формулы (7) коэффициент h есть количественный показатель степени доверия игрока А  данному распределению вероятностей pj= p(Qj), j=1,…,n, состояний природы Qj, j=1,…,n, а коэффициент (1 – h) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот. Если доверие велико, то доминирует критерий Байеса, в противном случае – критерий Вальда.

Цену игры HL по критерию Ходжа-Лемана находим по формуле:

HL = max HLi

Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:

HLk= HL.

Отметим, что критерий Ходжа-Лемана является как бы промежуточным критерием между критериями Байеса и Вальда.

При h =1, из (7) имеем: HLi=Bi,  и потому критерий Ходжа-Лемана  превращается в критерий Байеса.
А при h =0, из (7): HLi=Wi,  и, следовательно, из критерия Ходжа-Лемана получаем  критерий Вальда.

Выбор параметра h субъективен,  так как  определить степень достоверности какой-либо функции распределения довольно сложно.

КАКОВЫ УСЛОВИЯ ПРИМЕНИМОСТИ КРИТЕРИЯ ХОДЖА – ЛЕМАНА?

Для применения критерия Ходжа - Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

- вероятности появления состояния Qj неизвестны, но некоторые предположения о распределении вероятностей возможны;

- принятое решение теоретически допускает бесконечно много реализаций;

- при малых числах реализации допускается некоторый риск.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  ГЕРМЕЙЕРА?

Показатель эффективности GWi стратегии Аi по критерию Гермейера определяем по формуле

GWi =  min pj aij (8)

Если игрок А придерживается стратегии Аi, то вероятность выигрыша aij при этой стратегии и при состоянии природы Qj равна, очевидно, вероятности pj этого состояния природы. Поэтому формула (8) показывает, что показатель эффективности GWi стратегии Аi по критерию Гермейера есть минимальный выигрыш при этой стратегии с учетом его вероятности.
Цена игры по критерию Гермейера определяется по формуле:

GW = max GWi

Оптимальной стратегией по критерию Гермейера считается стратегия Аk с наибольшим показателем эффективности:

GWk= GW.

КАК СФОРМИРОВАТЬ МАТРИЦУ ГЕРМЕЙЕРА?

МАТРИЦА  ГЕРМЕЙЕРА.

Умножая каждый выигрыш aij, i = 1, …, m, на вероятность pj состояния природы Qj получим элементы матрицы Гермейера: элемент gij = pj • aij, i = 1, …, m, j = 1, …, n.
Из элементов gij формируем матрицу Гермейера G.

                   Состояния «природы»
Стратегии игрока A    Q1    Q2    …    Qn
    p1    p2    …    pn
A1    G11 = p1 a11    G12 = p2 a12    …    G1n = pn a1n
A2    G 21 = p1 a21     G22 = p2 a22    …    G2n = pn a2n
…    …    …    …    …
Am    Gm1 = p1 am1    Gm2 = p2 am2    …    Gmn = pn amn

Рисунок 17. Матрица Гермейера G.

С учетом введенных обозначений  числа Gi = min gij, (j = 1,..., n) являются показателями эффективности стратегии Aj по критерию Гермейера.  Таким образом, критерий Гермейера можно интерпретировать как критерий Вальда, применимый к игре с «ПРИРОДОЙ» с матрицей Гермейера Gij (mxn).

Критерий Гермейера так же,как и критерий Вальда является критерием крайнего пессимизма игрока А, но, в отличие от критерия Вальда, игрок А, принимая решение с максимальной осмотрительностью, учитывает вероятности состояний природы.

КАКОВЫ УСЛОВИЯ ПРИМЕНИМОСТИ КРИТЕРИЯ ГЕЙМЕЙЕРА?

Условия  применимости критерия Геймейера таковы:

- вероятности появления состояний Qj известны;
- с появлением тех или иных состояний Qj, отдельно или в комплексе, необходимо считаться;
- допускается некоторый риск;
- решение может реализоваться один или много раз.

Если функция распределения известна не очень надежно, а числа реализаций малы, то, следуя критерию Геймейера, получают, вообще говоря, неоправданно большой риск. Таким образом, здесь остается некоторая свобода для субъективных действий.

В случае равномерного распределения вероятностей состояний природы: pj=1/n,  j=1,…,n, показатель эффективности стратегии Аi, в силу формулы (*), будет равен

GWi= 1/n min aij.

Следовательно, критерий Гермейера в этом случае эквивалентен критерию Вальда. То есть стратегия, оптимальная по критерию Гермейера, в случае, когда мы считаем  все состояния природы Qj равновероятными, оптимальна и по критерию Вальда, и наоборот.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С КРИТЕРИЕМ  ПРОИЗВЕДЕНИЙ (С УЧЕТОМ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ «ПРИРОДЫ»)?

Пусть матрицей выигрышей игрока А является матрица А, все элементы которой положительны: aij>0, i=1,…, m; j=1,…, n.

Известны вероятности pj=p(Qj), j=1,…,n, состояний природы Qj, j=1,…, n, и удовлетворяют условию (1).

Показатель эффективности стратегии Аi по критерию произведений (с учетом вероятностей состояний «природы») определим по формуле:

PGi = ∏ pj aij = ∏ gij , где gij — элемент матрицы Гермейера.

Цена игры по критерию произведений вычисляется по формуле:

PG = max PGi

Оптимальной стратегией по критерию произведений является стратегия Аk с наибольшим показателем эффективности:

PGk=PG.

Отметим, что для критерия произведений является существенным положительность всех состояний вероятностей состояний природы и всех выигрышей игрока А.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С МАКСИМАКСНЫМ КРИТЕРИЕМ С УЧЕТОМ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ «ПРИРОДЫ»?

Теперь опишем максимаксный критерий, применяемый к матрице Гермейра, который для краткости будем называть MG-критерием. Максимаксный критерий, применяемый к матрице Гермейера можно назвать максимаксным критерием с учетом вероятностей состояний «ПРИРОДЫ».

Наибольший элемент в i-й строке матрицы Гермейра G
MGi = max gij (j=1, …, n)
назовем показателем эффективности стратегии Ai по MG-критерию (или MG-показателем эффективности стратегии Ai).

Наибольший из MG-показателей эффективности стратегий MG = max MGi (i = 1, …, m)
назовем ценой игры по MG-критерию (или MG-ценой игры).

Получим
MG  = max  max gij.       (9)
В соответствии с этим равенством M-цену игры можно назвать также максимаксом матрицы Гермейера G.  Из равенства (9) очевидно, что MG-цена игры является максимальным элементом среди всех элементов матрицы Гермейера G.

Оптимальной по MG-критерию назовем стратегию Ak , MG-показатель эффективности которой совпадает с MG-ценой игры: MGk =  MG.

Каждая стратегия, в соответствующей строке матрицы Гермейера G которой стоит максимальный элемент, будет MG-оптимальной.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С  КРИТЕРИЕМ БАЙЕСА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С УЧЕТОМ ОТНОСИТЕЛЬНЫХ ЗНАЧЕНИЙ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ ПРИРОДЫ?

Предположим, что вероятности состояний природы нам неизвестны, но мы имеем представление о том, какие состояния природы более правдоподобны, какие — менее правдоподобны. Это позволит представить (проранжировать) неизвестные вероятности состояний природы в виде убывающей или возрастающей числовой последовательности. Например, можно считать, что последовательность неизвестных вероятностей pj состояний природы Qj пропорциональна членам некоторой монотонной последовательности положительных чисел t1 ,  t2 , ..., tn :

p1 : p2 : ... : pn = t1 : t2 : ... : tn .

Учитывая, что
 

можем получить следующие оценки вероятностей:
 

Аналогичный критерий можно рассмотреть и для матрицы рисков.

КАК ВЫБРАТЬ ОПТИМАЛЬНОЕ РЕШЕНИЕ В СООТВЕТСТВИИ С  КРИТЕРИЕМ  МИНИМИЗАЦИИ СРЕДНЕГО КВАДРАТИЧНОГО ОТКЛОНЕНИЯ В УСЛОВИЯХ РИСКА? 

При принятии решений в условиях риска можно применить и критерий, основанный на применении среднего квадратичного отклонения — критерий минимизации среднего квадратичного отклонения (вариации).  РАССМОТРИМ СЛЕДУЮЩИЙ ПРИМЕР.

Вычислим математические ожидания выигрышей игрока A при применении им чистой стратегии Ai.

B1 = p1• a11+ p2• a12 + p3 •a13 = 0,15 • 35 + 0,35 • 45 + 0,50 • 50  = 46;
B2 = p1• a21+ p2• a22 + p3 •a23 = 0,15 • 80 + 0,35 • 30 + 0,50 • 40 = 42,5;
B3 = p1• a31+ p2• a32 + p3 •a33 = 0,15 • 45 + 0,35 • 95 + 0,50 • 30 = 55;
B4 = p1• a41+ p2• a42 + p3 • a43 = 0,15 • 90 + 0,35 • 20 + 0,50 • 45 = 43;

Следовательно, по критерию Байеса предпочтения игрока A можно проранжировать так:
A 3 » A 1 » A 4 » A 2 .

Вычислим средние квадратичные отклонения выигрышей:

S1 2 = 35 2 × 0,15 + 45 2 × 0,35 + 50 2 × 0,5 – (46) 2 = 2142,5 – 2116  = 26,5 ;  S1 ≈ 5,15;

S2 2 = 80 2 × 0,15 + 30 2 × 0,35 + 40 2 × 0,5 –  (42,5) 2 = 2075 – 1806,25  = 268,75 ,  S2 ≈ 16,4;

S3 2 = 45 2 × 0,15 + 95 2 × 0,35 + 30 2 × 0,5   – (55) 2 = 3912,5 –3025 = 887,5,  S3 ≈ 29,8;

S4 2 = 90 2 × 0,15 + 20 2 × 0,35 + 45 2 × 0,5  –  (43) 2 = 2367,5  – 1849 = 518,5 ,   S4 ≈ 22,77.

Таким образом, по критерию минимизации среднего квадратичного отклонения, получаем:
A1   »  A 2  »  A 4  »  A 3 .

То есть наиболее предпочтительной является стратегия A 1 с наименьшим значением (5,15) среднего квадратичного отклонения. Данная ситуация наиболее характерна для задач принятия решений, когда стратегия, наиболее предпочтительная по критерию максимизации среднего выигрыша, наименее выгодна по критерию минимизации среднего квадратичного отклонения. Таким образом, в данных условиях  игроку A предстоит сделать выбор между двумя стратегиями A1 и A3 , один из которых (A3) характеризуется и большим средним выигрышем и большим риском одновременно. В этом случае можно порекомендовать  использование особой меры риска — коэффициента вариации.

ЧТО ТАКОЕ КОЭФФИЦИЕНТ ВАРИАЦИИ?

Коэффициент вариации – это особая мера риска:

CV (Ai ) = CVi = (Si/Bi) x 100 % .

Этот коэффициент отражает риск, который приходится на единицу выигрыша (доходности), и дает базу для сравнения стратегий игрока, когда и их средний выигрыш и их средний риск неодинаковы.

В данных условиях можно получить:

CV1 = (5,15/46) x 100 % = 11,2 % ;

CV2 = (16,4/42,5) × 100 % =  38,6 % ;

CV3 = (29,8/55) x 100 % = 54,2 % ;

CV4  = (22,77/43) x 100 %  = 53 % .

Следовательно, по критерию минимизации коэффициента вариации, предпочтения игрока можно проранжировать так: A 1 »  A 2 »  A 4 »  A 3. То есть наиболее предпочтительной является стратегия A1 . Заметим также, что когда речь идет о среднем выигрыше, то речь идет о возможности многократного повторения игры (акта принятия решений). И условность рассмотренных выше критериев состоит в том, что требуемого количества повторений чаще всего может и не быть.

В заключение отметим, что при принятии решений в условиях неопределенности существенную помощь может оказать эксперимент, цель которого: уточнить условия в определенной ситуации. Проблема заключается в том, что проведение эксперимента предполагает наличие  определенных затрат. Целесообразность эксперимента определяется корреляцией между суммой  необходимых затрат на его проведение и величиной ожидаемого выигрыша.

СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ.

[1] Балдин К.В., Воробьев С.Н., Уткин В.Б. Управленческие решения: Учебник. – 2-е изд. –   М.: Издательско-торговая корпорация «Дашков и К0», 2006, 496 с. 

[2] Дульзон А.А.  Разработка управленческих решений: Учебник. – Томск: Изд-во Томского политехнического университета, 2009. – 295 с.

[3] Зайцев М.Г., Варюхин С.Е. Методы оптимизации управления и принятия решений: примеры, задачи, кейсы: учебное пособие. 2-е изд., испр. М.: Издательство «Дело» АНХ, 2008 — 664 с.

[4] Трофимова Л.А., Трофимов В.В. Методы принятия управленческих решений: Учебное пособие. – СПб. : Изд-во СПбГУЭФ, 2012. – 101 с.

[5] Черноруцкий И.Г. Методы принятия решений. Учебное пособие. –  СПб.:  БХВ-Петербург, 2005. – 416 с.,  ил.