ИГРЫ С КЛЕТОЧНЫМИ МАТРИЦАМИ

Научная статья
DOI:
https://doi.org/10.18454/IRJ.2016.47.020
Выпуск: № 5 (47), 2016
Опубликована:
2016/05/20
PDF

Яксубаев К.Д.

Кандидат физико-математических наук, Астраханский государственный архитектурно-строительный университет

ИГРЫ С КЛЕТОЧНЫМИ МАТРИЦАМИ

Аннотация

В статье рассматриваются игры с клеточными матрицами. Показано, что в соответствии с идеологией академика Л.С. Понтрягина примененной им в теории дифференциальных игр матричные игры с разным порядком ходов  нужно считать различными играми.

В работе игра в чистых стратегиях с клеточной матрицей сведена к игре на графе. Причем играм с различным порядком ходов, но с одной и той же матрицей, будут соответствовать разные графы и разный порядок развертывания клеточной матрицы в граф.

Показано, что теорема Неймана  о существовании седловой точки для

смешанной игры  с клеточной матрицей с произвольной глубиной вложения матриц-клеток тоже верна.

Ключевые слова: клеточные матрицы, теория игр, цена игры.

Yaksubaev K.D.

PhD in Physics and Mathematics, Russian State Astrakhan University of Architecture and Building

GAME WITH CELLULAR MATRICES

Abstract

The article discusses the game with the cell matrices shows that in accordance with the ideology of academician L.S. Pontryagin applied in the theory of differential games matrix games with different order of moves should be considered different games.

In the game in pure strategies with the cell matrix is reduced to a game on a graph. Moreover, the games with different order of moves, but with the same matrix, will correspond to different columns and different order of deployment of the cellular matrix into a graph.

 It is shown that the Neumann theorem on the existence of saddle points for game mixed with cellular matrix with an arbitrary nesting depth of matrix cells is also true.

Keywords: cell matrix, game theory, price of the game.

Матричные игры обобщались в разных направлениях [1]. Одно из возможных обобщений матричных игр это игры с клеточными матрицами.

Клеточными  матрицами называются матрицы вида:

29-04-2016 15-53-11

Матрица 29-04-2016 15-54-39, называется фактор-матрицей. Она

состоит из имен матриц-клеток.

Описание игры в чистых стратегиях.

Игроки. Играют два игрока: P и Q. Игрок  P это первый игрок, а Q это второй игрок.

Платежная матрица. Платежная матрица является матрицей выигрыша первого игрока, и одновременно матрицей проигрыша второго игрока.

Цель игры. Первый игрок стремится максимизировать выигрыш, а второй игрок стремится минимизировать проигрыш.

Стратегии. Игрок P выбирает строки, а игрок Q выбирает столбцы.

Ход игры. Игра длится два хода.

Первый ход: игра сначала ведется на фактор-матрице. В результате игры будет выбрана конкретная матрица-клетка.

Второй ход. Игра продолжается на выбранной матрице-клетке. Выбор столбца или строки называется полуходом.

Порядок ходов и тип игры.

Тип игры  обозначается TG=1212, или TG1212. В игре этого типа игрок P ходит дважды первым, а игрок Q дважды вторым. Всего возможны  четыре варианта игры.

Тип игры Игрок  P Игрок  Q Цена игры
TG1212 Первый, первый Второй, второй V1212
TG1221 Первый, второй Второй, первый V1221
TG2112 Второй, первый Первый, второй V2112
TG2121 Второй, второй Первый, первый V2121

Решение игры типа TG1212  в чистых стратегиях.

Сначала игра ведется на каждой клетке-матрице отдельно. В результате шести отдельных игр получаем новую платежную матрицу:

image005

На втором ходе получаем искомую цену игры: V1212= 3. Можно видеть, что выполняются  неравенства: V1212≤ V1221, V2112 ≤ V2121.  Для клеточной матрицы с глубиной вложения матриц-клеток равной n, мы будем иметь 2n различных игр.

Решение игры с клеточной матрицей в чистых стратегиях с помощью  графов

Приведем решение игры с клеточной матрицей:

image006

Тип игры: TG1212.  Игра ведется в два хода. Оба раза первый игрок ходит первым, а второй игрок ходит вторым.

Принципы изображения графов.

При построении графа нужно соблюдать три правила: правило цветов, правило толщины ребер, правило кружочков.

Правило цветов. Ребра первого игрока изображаются всегда черным цветов. А ребра второго игрока розовым цветом.

Правило толщины ребер. Ребра первого игрока толще, чем ребра второго игрока.

Правило кружочков. Все кружочки, располагающиеся на одной горизонтали, должны быть идентичными.

Принципы развертывания клеточной матрицы в граф.

Развертывание клеточной матрицы происходит в два хода. На первом ходе  развертывается фактор-матрица  по строкам. На втором ходе развертываются все матрицы-клетки и тоже построчно.

Решение игры в чистых стратегиях.  Для решения игры нужно следовать следующему принципу заполнения  пустых кружочков графа.

Пустые кружочки графа заполняются при движении снизу вверх. При заполнении пустых кружочков применяется два оператора MAX, MIN. На ребрах нужно указывать операции MAX, MIN. Тогда число в вершине графа и будет искомой ценой игры.

Принципы изображения оптимальных полуходов игроков.

Оптимальные полуходы игроков изображаются двойными ребрами.

Логический граф игры с типом TG=1212 таков:

image007

Решение клеточной игры в смешанных стратегиях

Игра с клеточной матрицей в смешанных стратегиях при глубине вложения матриц-клеток равной двум это игра с двойным розыгрышем.  Сначала разыгрываются сами строки и столбцы фактор - матрицы. В результате этого розыгрыша выпадает, какая то матрица-клетка клеточной матрицы.  Затем на выпавшей  матрице-клетке разыгрываются строки и столбцы. Таким образом, мы видим, что игра с клеточными матрицами в смешанных стратегиях рассчитывается по формуле полной вероятности.

 В этой игре определяются два типа вероятностей. Первый тип вероятностей это вероятности выбора и строк и столбцов для фактор - матрицы.  Второй тип вероятностей это  условные вероятности выбора строк и столбцов для каждой матрицы-клетки клеточной матрицы.

Порядок решения матричной игры в смешанных стратегиях для клеточных матриц таков. Сначала смешанная игра ведется на каждой матрице-клетке отдельно. Этим мы определяем цену смешанной игры на каждой такой матрице-клетке. А так же определяем вероятности выбора строк и столбцов на каждой матрице-клетке.

Затем подставляя цены смешанных игр в фактор - матрицу, мы получаем фактор - матрицу в численной форме. На этой фактор - матрице снова разыгрывается смешанная игра. Решая ее, мы получаем окончательное значение цены игры для исходной клеточной игры. И одновременно получаем вероятности выбора строк и столбцов фактор - матрицы. В итоге получаем теорему.

Теорема. Смешанная игра с клеточной матрицей всегда имеет седловую точку.

Таким образом, теорема Неймана о совпадении нижней и верхней цены игр, то есть о совпадении минимакса и максимина для смешанной игры с клеточными матрицами тоже верна.

Безусловно, теорема верна и для клеточных матриц с произвольной глубиной вложения матриц-клеток. Мы приводим теорему на клеточных матрицах с глубиной вложения равной двум, ради простоты изложения материала.

Если мы у матриц-клеток уберем матричные скобки, то получим одну  большую матрицу:

image008

В общем случае цены игр со смешанными стратегиями у этих двух матриц не совпадут, то есть игры в смешанных стратегиях для клеточных матриц есть имеют содержательный смысл.

Решение  матричной игры в смешанных стратегиях методом Монте-Карло

При статистическом моделировании матричных игр со смешанными стратегиями нужно бросать случайные равномерно распределенные точки в область, задаваемую следующей системой неравенств и уравнений:

image009

Это симплекс размерности  n-1, расположенный в n-мерном пространстве. Сгенерировать случайные равномерно распределенные точки на множестве D можно следующим способом. Сначала генерируются n-1 случайных равномерно распределенных на отрезке  векторов: 29-04-2016 15-57-06 длиной N. Потом проверяется условие:

image012

Те индексы,  которые не удовлетворяют этому условию, отбрасываются. После этого вектора снова перенумеровываются. Таким  образом, мы получим, какое то количество случайных точек равномерно распределенных  на симплексе  размерности n-2. Затем по формуле

29-04-2016 15-58-05

 мы точки с симплекса размерности n-2 поднимаем на симплекс размерности n-1. Полученная последовательность точек будет случайной равномерно распределенной на симплексе D.

Вычислив значение целевой функции на сгенерированных случайных точках, мы получим  новую платежную матрицу большого размера. Тем самым мы свели игру в смешанных стратегиях с маленькой исходной матрицей к матричной игре с седловой точкой в чистых стратегиях, но с матрицей большой размерности. Определив цену игры, и оптимальные строки и столбцы этой матрицы, мы тем самым найдем  цену исходной игры в смешанных стратегиях, а также найдем и искомые вероятности.

Литература

  1. Н.Н. Воробьев. Основы теории игр. – М., 1984. S. - 495 s.

References

  1. N. Vorob'ev. Osnovy teorii igr. – M., 1984. S. - 495 s.