По курсу математические методы и модели исследования операций для студентов специальности 080801


НазваниеПо курсу математические методы и модели исследования операций для студентов специальности 080801
страница5/7
Дата публикации19.06.2013
Размер0.92 Mb.
ТипМетодические указания
userdocs.ru > Математика > Методические указания
1   2   3   4   5   6   7

^ 3. ИГРОВЫЕ МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ
В данном разделе рассматриваются задачи принятия решений в ситуациях с несколькими участниками, когда интересы участников различны. Такие ситуации называются конфликтными. Общая теории конфликтных ситуаций получила название «теория игр».
^ 3.1. ИГРЫ В МАТРИЧНОЙ ФОРМЕ. РЕШЕНИЕ МАТРИЧНЫХ АНТАГОНИСТИЧЕСКИХ ИГР В ЧИСТЫХ СТРАТЕГИЯХ
На практических занятиях рассматриваются простейшие игровые модели, когда участников игры – двое. Игра двух лиц в матричной форме считается определенной, если заданы:

1. Множество стратегий 1-го игрока ;

2. Множество стратегий 2-го игрока ;

3. Матрица полезности 1-го игрока

4. Матрица полезности 2-го игрока

Степень антагонизма игроков определяется расхождением между матрицами A и B. Игры, для которых выполняется условие
(3.1)
называются играми со строгим соперничеством (антагонистическими играми, играми с нулевой суммой). В данном случае интересы игроков диаметрально противоположны: один игрок выигрывает ровно столько, сколько проигрывает другой. Поэтому задавая игру с нулевой суммой нет необходимости определять обе матрицы A и B, достаточно лишь матрицы A, называемой платежной матрицей.

Игры, для которых условие (3.1) не выполняется, называют играми с нестрогим соперничеством (неантагонистическими играми). В данном случае интересы игроков не являются диаметрально противоположными.

Выбор наилучшей стратегии основывается на двух принципах: осторожности и уравновешенности.

Согласно принципу осторожности, каждый игрок, помня о том, что перед ним разумный противник, должен выбирать свою стратегию, исходя из самого неблагоприятного для него ответа противника. Таким образом, принцип осторожности приводит к максиминному критерию оптимальности для 1-го игрока и минимаксному критерию оптимальности для 2-го игрока (ведь элементы платежной матрицы A означают проигрыш 2-го игрока).

Стратегия α0, максимизирующая минимальный (гарантированный) выигрыш 1-го игрока, т.е. выбранная в соответствии с максиминным критерием



называется защитной стратегией 1-го игрока.

Стратегия β0, минимизирующая максимальный (гарантированный) проигрыш 2-го игрока, т.е. выбранная в соответствии с минимаксным критерием



называется защитной стратегией 2-го игрока.

Стратегии α0 и β0 образуют защитную пару стратегий. Из способа отыскания защитных стратегий следует, что они существуют всегда, во всех играх.

Применяя защитную стратегию α0, 1-й игрок, независимо от действий 2-го игрока, обеспечивает себе выигрыш не менее u



Величина u называется нижней ценой игры.

Соответственно, применяя защитную стратегию β0, 2-й игрок, независимо от действий 1-го игрока, обеспечивает себе проигрыш не более v



Величина v называется верхней ценой игры.

Для более компактного определения защитных стратегий к платежной матрице добавляют столбец (для записи ) и строку (для записи )

.
Определяя максимум для приведенного столбца, находят u и α0, определяя минимум для приведенной строки – v и β0.

Пара стратегий называется уравновешенной, если для любых i и j выполняется

(3.2)

С учетом неравенств (3.2), принцип уравновешенности означает, что если один из игроков использует стратегию уравновешенной пары, то другому невыгодно отклоняться от второй стратегии этой пары (отклонение либо оставит положение неизменным, либо ухудшит его). Таким образом, принцип уравновешенности обязывает искать не просто защитные стратегии, а уравновешенные пары защитных стратегий, что приводит к формулировке решения антагонистической игры (поскольку уравновешенная пара стратегий является защитной).

^ Решением антагонистической игры в чистых стратегиях называется уравновешенная пара стратегий.

Проблема заключается в том, что в отличие от защитных стратегий для уравновешенных стратегий отсутствует конструктивный способ их определения. Вместе с тем, если уравновешенная пара является защитной, то защитная пара является уравновешенной лишь для игр с седловой точкой. Поэтому для игр с седловой точкой достаточно найти защитную пару стратегий, которая и является решением антагонистической игры.

^ Седловой точкой платежной матрицы называется элемент , являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Условием существования седловой точки в платежной матрице, а следовательно, решения антагонистической игры в чистых стратегиях является равенство нижней цены игры верхней. Полученное число называется ценой игры, оно равно величине седлового элемента платежной матрицы, т.е.



Алгоритм решения антагонистической игры заключается в следующем:

1. Находят нижнюю цену игры u и защитную стратегию α0 1-го игрока.

2. Находят верхнюю цену игры v и защитную стратегию β0 2-го игрока.

3. Проверяют условие существования решения игры в чистых стратегиях

u=v.

Если условие выполняется, то игра имеет решение в чистых стратегиях: решением является уравновешенная пара (α0, β0) защитных стратегий.

Если условие не выполняется, то игра не имеет решения в чистых стратегиях; при этом следует искать решение в смешанных стратегиях.

В ответе к задаче следует указать уравновешенную пару (α*=α0, β*= β0) защитных стратегий и цену игры u=v.
Задачи
3.1. В одной камере находятся два равных по силе заключенных, которые могут быть миролюбивы друг по отношению к другу или агрессивны (агрессивный заключенный избивает соседа по камере). Описать исходы игры и составить матрицу исходов. Закодировать исходы числами, составить матрицы полезности игроков и определить тип игры.

3.2. В боях за Новую Гвинею (1943 г.) разведка американцев сообщила, что японцы планируют переход конвоя из порта Ребаул на о. Новая Британия в порт Лаэ на о. Новая Гвинея. Маршрут конвоя мог проходить к северу от Новой Британии (северный путь), где ожидался дождь, либо к югу (южный путь), где ожидалась ясная погода.

Для обнаружения конвоя американцы могли сосредоточить основные силы разведывательной авиации либо на северном, либо на южном пути. В зависимости от действий противников возникали следующие возможности бомбардировать конвой:


Японцы
Американцы

Северный путь

Южный путь

Северный путь

2 дня

бомбардировки

2 дня

бомбардировки

Южный путь

1 день

бомбардировки

3 дня

бомбардировки


Составить игру в матричной форме и найти ее решение.

3.3. Игра со строгим соперничеством задается платежной матрицей



Найти решение игры.

^ 3.2. Решение матричных антагонистических игр

в смешанных стратегиях
В случае антагонистических игр без седловой точки используют смешанные стратегии.

Смешанная стратегия 1-го игрока


где xi – вероятность использования стратегии αi,

Смешанная стратегия 2-го игрока


где yj – вероятность использования стратегии βj,

Для данной смешанной стратегии активными называют те чистые стратегии, которые входят в эту смешанную стратегию с ненулевыми вероятностями.

Если в игре с платежной матрицей ^ A 1-й игрок использует смешанную стратегию X, а 2-й – чистую стратегию βj, то математическое ожидание выигрыша 1-го игрока будет равно



Если 1-й игрок использует чистую стратегию αi, а 2-й – смешанную стратегию Y, то математическое ожидание проигрыша 2-го игрока будет равно



Если оба игрока используют смешанные стратегии X и Y, то математическое ожидание выигрыша 1-го игрока, равное математическому ожиданию проигрыша 2-го игрока, будет равно



Как и для игр с седловой точкой при выборе наилучшей смешанной стратегии используются принципы осторожности и уравновешенности.

Принцип осторожности приводит к понятию защитной смешанной стратегии. Для выбора защитной смешанной стратегии 1-й игрок использует критерий максимина, а 2-й игрок – критерий минимакса.

Смешанная стратегия X0=, максимизирующая средний гарантированный выигрыш 1-го игрока, т.е. выбранная в соответствии с максиминным критерием


называется защитной смешанной стратегией 1-го игрока.

Смешанная стратегия Y0=, минимизирующая средний гарантированный проигрыш 2-го игрока, т.е. выбранная в соответствии с минимаксным критерием


называется защитной смешанной стратегией 2-го игрока.

Достигаемый при использовании защитной стратегии X0 максимум гарантированного выигрыша 1-го игрока


называется нижней ценой игры (в классе смешанных стратегий).

Достигаемый при использовании защитной стратегии Y0 минимум гарантированного проигрыша 2-го игрока


называется верхней ценой игры (в классе смешанных стратегий).

Защитные смешанные стратегии существуют всегда. Их можно искать различными способами. Для игр размером 2×n или 2 пригоден графический метод.

Пусть задана игра с платежной матрицей размера 2×n

Алгоритм определения защитных смешанных стратегий графическим методом заключается в следующем:

1. На концах единичного отрезка восстанавливают два перпендикуляра (левый перпендикуляр соответствует стратегии α2, правый перпендикуляр – стратегии α1).

2. Для стратегии на левом перпендикуляре откладывают величину a2j, на правом перпендикуляре – величину a1j, полученные точки соединяют отрезком прямой. В результате получают n прямых, представляющих собой графики зависимостей

3. Находят нижнюю границу множества n прямых (обычно ее выделяют на графике штриховкой), т.е. .

4. Находят точку единичного отрезка, при которой нижняя граница достигает максимума, т.е. . Эта точка соответствует искомой смешанной стратегии X0, высота максимума дает при этом значение нижней цены игры u.

5. Определяют две чистых стратегии 2-го игрока βl и βk, являющиеся его активными стратегиями (это стратегии, для которых пересечение графиков зависимостей и определяет точку максимума нижней границы). Таким образом, игра 2×n сводится к игре 2×2.

6. От матрицы A размера 2×n переходят к матрице A размера 2×2 следующего вида:



где .

7. На концах единичного отрезка восстанавливают два перпендикуляра (левый перпендикуляр соответствует стратегии , правый перпендикуляр – стратегии ).

8. Строят графики зависимостей и .

9. Находят верхнюю границу этих прямых (ее также выделяют на графике штриховкой), т.е. .

10. Находят точку единичного отрезка, при которой верхняя граница достигает минимума, т.е. . Эта точка соответствует искомой смешанной стратегии ^ Y0, высота минимума дает при этом значение верхней цены игры v.

По аналогичной методике может быть решена игра m×2: определяется защитная смешанная стратегия 2-го игрока, находятся активные стратегии 1-го игрока, игра m×2 сводится к игре 2×2, определяется защитная смешанная стратегия 1-го игрока.

Графический метод в общем случае позволяет найти лишь приближенное значение , i = 1,2; , j = 1,2, которые затем надо уточнить аналитически.
1   2   3   4   5   6   7

Похожие:

По курсу математические методы и модели исследования операций для студентов специальности 080801 iconМетодические указания по проведению практических занятий и выполнению...
Методические указания предназначены для проведения практических занятий и выполнения домашних заданий по дисциплине «Экономико-математические...
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconКлючевые понятия 54 Контрольные вопросы 55
К65 Математические методы исследования операций в экономикеЎєспб: Питер, 2000. ЎЄ 208 с.: ил. ЎЄ (Серия «Краткий курс»)
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconПрограммные вопросы по курсу «Психология» для студентов специальности...
История предмет, структура педагогической психологии ее задачи и методы исследования
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconПлан семинарских занятий
Для студентов 4 курса очного отделения, обучающихся по специальности «математические методы в экономике»
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconМетодические указания к лабораторным работам по курсу рспсит для...
Методические указания к лабораторным работам по курсу рспсит для специальности 080801. 65-Прикладная информатика в экономике
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconДисциплина «Методология и методы психологического исследования» для...
Классификация методов психологического исследования (Классификация Пирьова; Б. Г. Ананьева; М. С. Роговина и Г. В. Залевского; В....
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconСеминар №2 по дисциплине «Методология и методы психологического исследования»...
Проблемная ситуация и проблема исследования. Требования к формулированию проблемы научного исследования
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconРабочая программа дисциплины математические методы в исторических исследованиях
Целью освоения дисциплины Математические методы в исторических исследованиях является формирование целостного, системного представления...
По курсу математические методы и модели исследования операций для студентов специальности 080801 icon1. Понятие о науке а/х и методы исследования, которыми она располагает
Математические методы используют для проверки точности опытов и установлении достоверности полученных результатов. Выявления кариляционных...
По курсу математические методы и модели исследования операций для студентов специальности 080801 iconПрограмма междисциплинарного экзамена по специальности 080801. 65...
Охватывает вопросы ряда специальных дисциплин, предусмотренных учебным планом вэпи по данной специальности и позволяет оценить качество...
Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2020
контакты
userdocs.ru
Главная страница