Теория игр
p align="left">Аналогично определяется наилучшая стратегия второго игрока. Игрок В при выборе стратегии Вj, в худшем случае получит проигрыш . Он выбирает стратегию Bjопт, при которой его проигрыш будет минимальным и составит

.

Определение 3. Величина - гарантированный проигрыш игрока В называется верхней ценой игры. Стратегия Bjопт, обеспечивающая получение проигрыша , называется минимаксной.

Если второй игрок будет придерживаться своей минимаксной стратегии, то у него есть гарантия, что он в любом случае проиграет не больше .

Фактический выигрыш игрока А (проигрыш игрока В) при разумных действиях партнеров ограничен верхней и нижней ценой игры. Для матричной игры справедливо неравенство .

Определение 4. Если = =v, т.е.

=,

то выигрыш игрока А (проигрыш игрока В) определяется числом v. Оно называется ценой игры.

Определение 5. Если = =v, то такая игра называется игрой с седловой точкой, элемент матрицы аiопт jопт = v, соответствующий паре оптимальных стратегий (Aiопт, Bjопт), называется седловой точкой матрицы. Этот элемент является ценой игры.

Седловой точке соответствуют оптимальные стратегии игроков. Их совокупность - решение игры, которое обладает свойством: если один из игроков придерживается оптимальной стратегии, то второму отклонение от своей оптимальной стратегии не может быть выгодным.

Определение 6. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Найдем решение игры рассмотренного выше примера:

,

= 3 - нижняя цена игры.

,

= 3 - верхняя цена игры.

Так как = = 0, матрица игры имеет седловую точку.

Оптимальная стратегия первого игрока - А3, второго - B3. Из таблицы видно, что отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш, а отклонение второго игрока от В3 увеличивает его проигрыш.

Наличие седловой точки в игре - это далеко не правило, скорее, исключение. Существует разновидность игр, которые всегда имеют седловую точку и, значит, решаются в чистых стратегиях. Это так называемые игры с полной информацией.

Определение 7. Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает всю предысторию ее развития, т.е. результаты всех предыдущих ходов.

Примерами игр с полной информацией могут служить шашки, шахматы, "крестики-нолики" и т.д.

Теорема 1. Каждая игра с полной информацией имеет седловую точку и, значит, имеет решение в чистых стратегиях.

В каждой игре с полной информацией существует пара оптимальных стратегий, дающая устойчивый выигрыш, равный цене игры v. Если решение игры известно, сама игра теряет смысл. Например, шахматная игра либо кончается выигрышем белых, либо выигрышем черных, либо ничьей, только чем именно - мы пока не знаем (к счастью для любителей шахмат). Прибавим еще: вряд ли будем знать в обозримом будущем, так как число стратегий так велико, что крайне трудно привести шахматную игру к матричной форме и найти в ней седловую точку. Указать откуда это взялось, т.е. указать ссылки

1.3 Решение матричной игры в смешанных стратегиях

Если платежная матрица не имеет седловой точки, т.е. < и , то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами.

Определение 1. Сложная стратегия, состоящая в случайном применении всех стратегий с определенными частотами, называется смешанной.

В игре, матрица которой имеет размерность m n, стратегии первого игрока задаются наборами вероятностей (x1, x2,..., xm), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассмотреть как m-мерные векторы, для координат которых выполняются условия

, xi 0, .

Аналогично для второго игрока наборы вероятностей определяют n-мерные векторы (y1, y2,..., yn), для координат которых выполняются условия

= 1, yj 0, .

Выигрыш первого игрока при использовании смешанных стратегий определяют как математическое ожидание выигрыша, т.е. он равен

.

Теорема 1. (Неймана. Основная теорема теории игр) Каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры: v . Применение первым игроком оптимальной стратегии опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры. Поэтому выполняется соотношение

, .

Аналогично для второго игрока оптимальная стратегия опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры, т.е. справедливо соотношение

, .

Если платежная матрица не содержит седловой точки, то задача определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности целесообразно упростить, уменьшив их размерность путем вычеркивания дублирующих (одинаковых) и не доминирующих стратегий.

Определение 2. Дублирующими называются стратегии, у которых соответствующие элементы платежной матрицы одинаковы.

Определение 3. Если все элементы i-й строки платежной матрицы больше соответствующих элементов k-й строки, то i-я стратегия игрока А называется доминирующей над k-й стратегией. Если все элементы j-го столбца платежной матрицы меньше соответствующих элементов k-го столбца, то j-я стратегия игрока В называется доминирующей над k-й стратегией.

Пример. Рассмотрим игру, представленную платежной матрицей

.

= max (2, 2, 3,2) = 3, = min (7, 6, 6, 4,5) = 4, , .

Все элементы стратегии А2 меньше элементов стратегии А3, т.е. А2 заведомо невыгодна для первого игрока и ее можно исключить. Все элементы А4 меньше А3, исключаем А4.

.

Для второго игрока: сравнивая В1 и В4, исключаем В1; сравнивая В2 и В4, исключаем В2; сравнивая В3 и В4, исключаем В3. В результате преобразований получим матрицу

.

= max (2,3) = 3, = min (4,5) = 4, , .

1.4 Решение игр графическим методом

Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии.

Первый случай. Рассмотрим игру (2 2) с матрицей

без седловой точки. Решением игры являются смешанные стратегии игроков (x1, x2) и (y1, y2), где x1 - вероятность применения первым игроком первой стратегии, x2 - вероятность применения первым игроком второй стратегии, y1 - вероятность применения вторым игроком первой стратегии, y2 - вероятность применения вторым игроком второй стратегии. Очевидно, что

x1 + x2 = 1, y1 + y2 = 1.

Найдем решение игры графическим методом. На оси ОX отложим отрезок, длина которого равна единице. Левый конец (x = 0) соответствует стратегии первого игрока А1, правый (x = 1) - стратегии А2. Внутренние точки отрезка будут соответствовать смешанным стратегиям (x1, x2) первого игрока, где x1 =1 - x2. Через концы отрезка проведем прямые, перпендикулярные оси ОX, на которых будем откладывать выигрыш при соответствующих чистых стратегиях. Если игрок В применяет стратегию В1, то выигрыш при использовании первым игроком стратегий А1 и А2 составит соответственно а11 и а21. Отложим эти точки на прямых и соединим их отрезком В1В1. Если игрок А применяет смешанную стратегию, то выигрышу соответствует некоторая точка М, лежащая на этом отрезке. (см. рис.1)

В1 а21

М

В1

а11

х2 х11 Х

Рис.1. Подписать рисунок

Аналогично строится отрезок В2В2, соответствующий стратегии В2 игрока В.

Определение 1. Ломаная линия, составленная из частей отрезков, интерпретирующих стратегии игрока В, расположенная ниже всех отрезков, называется нижней границей выигрыша, получаемого игроком А.

Определение 2. Стратегии, части которых образуют нижнюю границу выигрыша, называются активными стратегиями.

В игре (2 2) обе стратегии являются активными.

В1 а21

В2

а12 К

В2 а22

В1

а11 v

О х2 N х1 1 Х

Рис.2.

Ломаная В1КВ2 является нижней границей выигрыша, получаемого игроком А. (см. рис.2) Точка К, в которой он максимален, определяет цену игры и ее решение. Найдем оптимальную стратегию первого игрока. Запишем систему уравнений

Приравнивая выражения для v из уравнений системы и учитывая, что

x1 + x2 = 1, получим , , (1)

. (2)

Составляя аналогичную систему

и учитывая условие

y1 + y2 = 1,

можно найти оптимальную стратегию игрока В:

. (3)

Пример 1. Найти решение игры, заданной матрицей

.

= max (1,1) = 1, = min (3,2) = 2, , . Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям второго игрока. (см. рис.3)

Рис.3.

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 1/3, x2 = 2/3; y1 = 2/3, y2 = 1/3; v =5/3.

Ответ. Оптимальные смешанные стратегии игроков (1/3, 2/3) и (2/3, 1/3), цена игры составляет v =5/3.

Данный ответ означает следующее:

если первый игрок с вероятностью 1/3 будет применять первую стратегию и с вероятностью 2/3 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 5/3;

если второй игрок с вероятностью 2/3 будет применять первую стратегию и с вероятностью 1/3 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 5/3.

Второй случай. Рассмотрим игру (2 n) с матрицей

.

Для каждой из n стратегий игрока В строится соответствующий ей отрезок на плоскости. Находится нижняя граница выигрыша, получаемого игроком А, и определяется точка на нижней границе, соответствующая наибольшему выигрышу. Выделяются две активные стратегии игрока В, отрезки которых проходят через данную точку. Далее рассматриваются только эти две стратегии игрока В. Игра сводится к игре с матрицей (2 2). Оптимальные стратегии и цену игры находят по формулам (1) - (3).

Пример 2. Найти решение игры, заданной матрицей

.

= max (1,1) = 1, = min (4, 3, 3,4) = 3, , .

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям второго игрока. (см. рис.4)

Рис.4.

Нижней границей выигрыша для игрока А является ломаная В3КВ4. Стратегии В3 и В4 являются активными стратегиями игрока В. Точка их пересечения К определяет оптимальные стратегии игроков и цену игры. Второму игроку невыгодно применять стратегии В1 и В2, поэтому вероятность их применения равна нулю, т.е. у1 = у2= 0. Решение игры сводится к решению игры с матрицей (2 2)

.

= max (1,1) = 1, = min (3,4) = 3, , .

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 2/5, x2 = 3/5; y3 = 3/5, y2 = 2/5; v =11/5.

Ответ. Оптимальные смешанные стратегии игроков (2/5, 3/5) и (0, 0, 3/5, 2/5), цена игры составляет v =11/5.

Данный ответ означает следующее:

если первый игрок с вероятностью 2/5 будет применять первую стратегию и с вероятностью 3/5 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 11/5;

если второй игрок с вероятностью 3/5 будет применять третью стратегию, с вероятностью 2/5 четвертую и не будет использовать первую и вторую стратегии, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 11/5.

Третий случай. Рассмотрим игру (m 2) с матрицей

.

Решение игры может быть получено аналогично случаю два. Для каждой из m стратегий игрока А строится соответствующий ей отрезок на плоскости.

Находится верхняя граница проигрыша, получаемого игроком В, и определяется точка на нижней границе, соответствующая наименьшему проигрышу. Выделяются две активные стратегии игрока А, отрезки которых проходят через данную точку.

Далее рассматриваются только эти две стратегии игрока А. Игра сводится к игре с матрицей (2 2). Оптимальные стратегии и цену игры находят по формулам (1) - (3).

Пример 3. Найти решение игры, заданной матрицей

.

= max (3, 2, 0, - 1) = 3, = min (4,6) = 4, , . Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям первого игрока. (см. рис.5).

Рис.5.

Верхней границей проигрыша для игрока В является ломаная А1КА4. Стратегии А1 и А4 являются активными стратегиями игрока А. Точка их пересечения К определяет оптимальные стратегии игроков и цену игры. Первому игроку невыгодно применять стратегии А2 и А3, поэтому вероятность их применения равна нулю, т.е. x2 = x3= 0. Решение игры сводится к решению игры с матрицей (2 2)

.

= max (3, - 1) = 3, = min (4,6) = 4, , .

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 7/8, x4 = 1/8; y1 = 3/8, y2 = 5/8; v =27/8.

Ответ. Оптимальные смешанные стратегии игроков (7/8, 0, 0, 1/8) и (3/8, 5/8), цена игры составляет v =27/8.

Данный ответ означает следующее:

если первый игрок с вероятностью 7/8 будет применять первую стратегию, с вероятностью 1/8 четвертую и не будет использовать вторую и третью стратегии, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 27/8;

если второй игрок с вероятностью 3/8 будет применять первую стратегию и с вероятностью 5/8 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 27/8.

1.5 Сведение матричной игры к задаче линейного программирования

Теория игр находится в тесной связи с линейным программированием, так как каждая конечная игра двух лиц с нулевой суммой может быть представлена как задача линейного программирования и решена симплексным методом и, наоборот, каждая задача линейного программирования может быть представлена как конечная игра двух лиц с нулевой суммой. Рассмотрим игру двух лиц с нулевой суммой, заданную платежной матрицей

.

Если платежная матрица не имеет седловой точки, т.е. < и , то решение игры представлено в смешанных стратегиях (x1, x2,..., xm) и (y1, y2,..., yn). Применение первым игроком оптимальной стратегии опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока А, для которой имеют место ограничения

Величина v неизвестна, однако можно считать, что цена игры v > 0. Последнее условие выполняется всегда, если все элементы платежной матрицы неотрицательны, а этого можно достигнуть, прибавив ко всем элементам матрицы некоторое положительное число.

Преобразуем систему ограничений, разделив все члены неравенств на v.

(1)

где

, . (2)

По условию x1 + x2 + … +xm = 1.

Разделим обе части этого равенства на v.

.

Оптимальная стратегия (x1, x2,..., xm) игрока А должна максимизировать величину v, следовательно, функция

(3)

должна принимать минимальное значение.

Таким образом, получена задача линейного программирования: найти минимум целевой функции (3) при ограничениях (1), причем на переменные наложено условие неотрицательности (2). Решая ее, находим значения , и величину 1/v, затем отыскиваются значения xi = vti.

Аналогично для второго игрока оптимальная стратегия опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока B, для которой имеют место ограничения

Преобразуем систему ограничений, разделив все члены неравенств на v.

(4) где , . (5)

По условию y1 + y2 + … +yn = 1. Разделим обе части этого равенства на v.

.

Оптимальная стратегия (y1, y2,..., yn) игрока В должна минимизировать величину v, следовательно, функция

(6)

должна принимать максимальное значение.

Получена задача линейного программирования: найти максимум целевой функции (6) при ограничениях (4), причем на переменные наложено условие неотрицательности (5).

Таким образом, для нахождения решения игры имеем симметричную пару двойственных задач линейного программирования. Можно найти решение одной из них, а решение второй находится с использованием теории двойственности.

Пример. Найти решение игры, заданной матрицей

.

= max (2, 3,1) = 3, = min (4, 5, 6,5) = 4, , .

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.

Для определения оптимальной стратегии игрока А имеем следующую задачу линейного программирования:

,

, .

Для нахождения оптимальной стратегии игрока В имеем следующую задачу линейного программирования:

,

, .

Оптимальные решения пары двойственных задач имеют вид

, , .

Учитывая соотношения между xi и ti, yj и sj, а также равенство

,

можно найти оптимальные стратегии игроков и цену игры:

(1/2, 1/2, 0), (3/4, 0, 0, 1/4), v=7/2.

1.6 Игры с природой

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако в некоторых задачах, приводящихся к игровым, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т.д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Условия игры задаются матрицей

.

Пусть игрок А имеет стратегии А1, А2, …, Аm, а природа - состояния В1, В2, …, Вn. Наиболее простой является ситуация, когда известна вероятность pj каждого состояния природы Вj. При этом, если учтены все возможные состояния, p1 + p2 + … + pj + … + pn = 1.

Если игрок А выбирает чистую стратегию Аi, то математическое ожидание выигрыша составит p1 ai1 + p2 ai2 + … + pn ain. Наиболее выгодной будет та стратегия, при которой достигается

(p

1 ai1 + p2 ai2 + … + pn ain).

Если информация о состояниях с приро

дой мала, то можно применить принцип недостаточного основания Лапласа, согласно которому можно считать, что все состояния природы равновероятностны:

,

т.е. стратегию, для которой среднее арифметическое элементов соответствующей строки максимальное.

Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она выбирается из условия

и совпадает с нижней ценой игры. Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека способом.

2. Критерий максимума. Он выбирается из условия

.

Критерий является оптимистическим, считается, что природа будет наиболее благоприятна для человека.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

,

где - степень оптимизма и изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При = 1 критерий превращается в критерий Вальда, при = 0 - в критерий максимума. На оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

.

Элементы матрицы рисков находятся по формуле

,

где - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением

.

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение; если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом его сильных и слабых сторон.

Пример. Возможно строительство четырех типов электростанций: А1 (тепловых), А2 (приплотинных), А3 (бесшлюзовых), А4 (шлюзовых). Состояния природы обозначим через Р1, Р2, Р3, Р4. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояния природы и задана матрицей

.

1) Согласно критерию Вальда

,

следует строить бесшлюзовую электростанцию

.

2) Воспользуемся критерием Сэвиджа. Построим матрицу рисков:

.

Согласно критерию Сэвиджа определяем

.

В соответствии с этим критерием также предлагается строить бесшлюзовую электростанцию.

3) Воспользуемся критерием Гурвица. Положим =1/2.

,

т.е. следует принять решение о строительстве приплотинной электростанции.

4) Если принять известным распределение вероятностей для различных состояний природы, например считать эти состояния равновероятностными (р1=р2=р3=р4=1/4), то для принятия решения следует найти математические ожидания выигрыша:

,

,

,

.

Так как максимальное значение имеет М3, то следует строить бесшлюзовую электростанцию. [16, 18, 21, 25, 27, 49]

Выводы по I главе

Таким образом, в первой главе были рассмотрены основные теоретические положения и определения теории игр. Было сформулировано и дано определение теории игр, а также были затронуты такие понятия как: игра, правила игры, стратегия, оптимальная стратегия, партия, ход.

В результате изучения основных характеристик игры, можно сказать, что очень важна эффективность принимаемых решений в ходе конфликта (игры) каждой из сторон, что также существенно зависит и от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение, так как им обеим приходится принимать решения в условиях неопределенности.

Важной проблемой является и то, что не всегда при выборе оптимальной стратегии вам удастся достичь желаемого результата.

Исходя из того, что игра зависит от многих параметров, были представлены различные виды игр и способы их решения:

Решение матричной игры в чистых стратегиях.

Решение матричной игры в смешанных стратегиях.

Решение игр графическим методом.

Сведение матричной игры к задаче линейного программирования.

Игры с природой.

Анализ литературы показал, что в настоящее время применение основных положений теории игр очень велико в различных областях науки и техники. Ей интересуются не только математики, но и военные, использующие ее в качестве аппарата стратегических решений. Социологи и экономисты нашли в ней плодотворный источник теоретических моделей.

Как результат изложения теоретического материала в первой главе, был рассмотрен необходимый объем знаний, для формирования элективного курса, направленного на развитие логического мышления и интеллектуальных способностей учащихся начальной школе.

Глава II Разработка элективного курса “Элементы теории игр в начальной школе”

2.1 Место компьютера в начальной школе

Почему маленьким детям на уроке не всегда интересно? То устанут, то скука одолеет. Почему жизнь школы порой непохожа на цветной, яркий мир, который сопровождает ребенка в его общении с друзьями и книгами? Школа и школьная жизнь должна увлекать ребенка, вводя его в удивительный мир познания.

Вот тут-то на помощь и приходит компьютер со своим занимательным и познавательным миром. Диапазон использования компьютера в учебно-воспитательном процессе возрастает все больше: от тестирования учащихся, учета их личностных особенностей до игры. Компьютер может быть как объектом изучения, так и средством обучения, т.е. возможны два вида направления компьютеризации обучения: изучение информатики и также его использование при изучении различных предметов. При этом компьютер является мощным средством повышения эффективности обучения. [23]

Многие приходят к убеждению, что в результате полученных знаний о компьютерах и приобретенных навыков работы с ними дети будут лучше подготовлены к жизни и материальному благополучию в меняющемся мире.

Компьютер позволяет усилить мотивацию ученика. Не только новизна работы с компьютером, которая сама по себе способствует повышению интереса к учебе, но и возможность регулировать предъявление учебных задач по степени трудности, поощрение правильных решений позитивно сказывается на мотивации.

Кроме того, компьютер позволяет полностью устранить одну из важнейших причин отрицательного отношения к учебе - неуспех, обусловленный непониманием, значительными пробелами в знаниях. Работая на компьютере, ученик получает возможность довести решение задачи до конца, опираясь на необходимую помощь.

Страницы: 1, 2



Реклама
В соцсетях
рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать