Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'game value':
Найдено статей: 21
  1. Для дифференциальной игры многих лиц найдены условия того, что заданное многозначное отображение в каждой точке есть множество выигрышей в ситуациях равновесия по Нэшу. Данное условие выписано в инфинитезимальной форме. Также найдены достаточные условия, при которых набор непрерывных функций обеспечивает равновесие по Нэшу. Данное условие обобщает метод, основанный на системе уравнений типа Гамильтона–Якоби.

    We study Nash equilibrium for a differential game with many players. The condition on a multivalued map under which any value of this map is a set of Nash equilibrium payoffs is obtained. This condition is written in infinitesimal form. The sufficient condition for the given complex of continuous functions to provide a Nash equilibrium is obtained. This condition is a generalization of the method based on system of Hamilton–Jacobi equations.

  2. Работа посвящена исследованию равновесия по Нэшу в неантагонистической детерминированной дифференциальной игре двух лиц в классе рандомизированных стратегий. Предполагается, что игроки информированы об управлении своего партнера, реализовавшегося к текущему времени. Поэтому игра формализуется в классе рандомизированных квазистратегий. В работе получена характеризация множества выигрышей (пар ожидаемых выигрышей игроков) в ситуациях равновесия по Нэшу с использованием вспомогательных антагонистических игр. Показано, что множество выигрышей в ситуациях рандомизированного равновесия по Нэшу является выпуклой оболочкой множества выигрышей в классе детерминированных стратегий. Приведен пример, показывающий дополнительные возможности, которые возникают при переходе к рандомизированным стратегиям.

    The paper is concerned with the randomized Nash equilibrium for a nonzero-sum deterministic differential game of two players. We assume that each player is informed about the control of the partner realized up to the current moment. Therefore, the game is formalized in the class of randomized non-anticipative strategies. The main result of the paper is the characterization of a set of Nash values considered as pairs of expected players' outcomes. The characterization involves the value functions of the auxiliary zero-sum games. As a corollary we get that the set of Nash values in the case when the players use randomized strategies is a convex hull of the set of Nash values in the class of deterministic strategies. Additionally, we present an example showing that the randomized strategies can enhance the outcome of the players.

  3. В статье рассматриваются приближенные решения неантагонистических дифференциальных игр. Приближенное равновесие по Нэшу может быть построено по заданному решению вспомогательной стохастической игры с непрерывным временем. Мы рассматриваем случай, когда динамика вспомогательной игры задается марковской цепью с непрерывным временем. Для этой игры функция цены определяется решением системы обыкновенных дифференциальных включений. Таким образом, мы получаем конструкцию приближенного равновесия по Нэшу с выигрышами игроков, близкими к решениям системы обыкновенных дифференциальных включений. Также предложен способ построения марковской игры с непрерывным временем, аппроксимирующей исходную игру.

    The paper is concerned with approximate solutions of nonzero-sum differential games. An approximate Nash equilibrium can be designed by a given solution of an auxiliary continuous-time dynamic game. We consider the case when dynamics is determined by a Markov chain. For this game the value function is determined by an ordinary differential inclusion. Thus, we obtain a construction of approximate equilibria with the players' outcome close to the solution of the differential inclusion. Additionally, we propose a way of designing a continuous-time Markov game approximating the original dynamics.

  4. В работе рассматривается игра патрулирования с двумя игроками — патрулирующим и атакующим. Цель первого игрока — охранять объект от злоумышленников, поймать атакующего. Цель второго — причинить урон охраняемому объекту и не стать пойманным. В данной статье охраняемым объектом выступают базовые станции сотовых компаний. Теоретико-игровая модель построена для решения задачи о нахождении начального распределения местоположения игроков по базовым станциям. При известной матрице перехода игроков по станциям в работе находятся оптимальные стратегии игроков и значение игры. Рассмотрена обратная задача — поиск оптимальных матриц перехода при известных начальных распределениях местоположения игроков. В такой постановке найдено равновесие по Нэшу, когда атакующий совершает две атаки.

    A patrolling game with two players, a patroller and an attacker, is considered in the paper. The aim of the former is to protect an object from intruders and catch the attacker. The aim of the latter is to cause damage to the protected object without being caught. Cellular base stations are viewed as protected objects. A game-theoretic model is constructed to find an initial distribution of players on base stations. When the transition matrix of players among the stations is known, an optimal strategy of players and the value of the game are calculated. An inverse problem of searching for optimal transition matrices with known initial distribution of players is studied. The Nash equilibrium with the attacker making two attacks is found for the considered problem.

  5. В статье рассматривается аппроксимация функции цены антагонистической дифференциальной игры с критерием, задаваемым условием минимизации некоторой величины вдоль реализовавшейся траектории, решениями стохастических игр с непрерывным временем и моментом остановки, управляемым одним из игроков. Отметим, что если в качестве вспомогательной игры выбрана стохастическая дифференциальная игра, то ее функция цены задается параболическим уравнением второй степени в частных производных с дополнительными ограничениями в форме неравенств, в то время как для случая вспомогательной игры с динамикой, задаваемой марковской цепью, функция цены определяется системой обыкновенных дифференциальных уравнений с дополнительными ограничениями. Развиваемый в статье метод аппроксимации основан на концепции стохастического поводыря, впервые предложенном в работах Н.Н. Красовского и А.Н. Котельниковой.

    The paper is concerned with the approximation of the value function of the zero-sum differential game with the minimal cost, i.e., the differential game with the payoff functional determined by the minimization of some quantity along the trajectory by the solutions of continuous-time stochastic games with the stopping governed by one player. Notice that the value function of the auxiliary continuous-time stochastic game is described by the Isaacs–Bellman equation with additional inequality constraints. The Isaacs–Bellman equation is a parabolic PDE for the case of stochastic differential game and it takes a form of system of ODEs for the case of continuous-time Markov game. The approximation developed in the paper is based on the concept of the stochastic guide first proposed by Krasovskii and Kotelnikova.

  6. Для динамической системы, подверженной воздействиям управления и помехи и содержащей последействие в управляющих силах, рассматривается задача об управлении с оптимальным гарантированным результатом для показателя качества, представляющего собой евклидову норму совокупности отклонений движения системы в заданные моменты времени от заданных целей. На основе функциональной трактовки, опирающейся на своеобразный прогноз движений, исходная задача сводится к вспомогательной дифференциальной игре для системы без запаздывания и с терминальной платой. Функция цены этой игры вычисляется на базе конструкции выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза, оптимальные стратегии строятся методом экстремального сдвига на сопутствующие точки. Рассматриваются иллюстрирующие примеры, приводятся результаты численных экспериментов.

    For a dynamical system under control and disturbances, and with delay in control, the problem of control with the optimal guaranteed result is considered for a quality index which is the Euclidean norm of the set of deviations of a system motion at the given instants from the given targets. On the basis of a functional treatment basing on a proper prediction of the motion the problem is reduced to an auxiliary differential game for a system without delay and with a terminal quality index. The value of this game is calculated from the construction of upper convex hulls of auxiliary functions from the method of stochastic program synthesis, optimal strategies are formed by the method of an extremal shift to the corresponding points. Illustrating examples and results of numerical experiments are presented.

  7. Бельских Ю.А., Жуковский В.И., Самсонов С.П.
    Альтруистическое равновесие (по Бержу) в модели дуополии Бертрана, с. 27-45

    В 1883 г. французский математик Жозеф Луи Франсуа Бертран (1822-1900) построил модель ценовой конкуренции на олигопольном рынке, на котором фирмы конкурируют между собой, меняя цену продукции. Заметим, что такая модель не «блистала новизной», ибо ровно на 45 лет раньше тоже французский экономист, философ и математик Антуан Огюст Курно (1801-1877) в «Исследовании математических принципов теории богатства» в разделе 7 «О конкуренции производителей» рассмотрел частный случай олигополии – дуополию (при которой участвуют только два производителя). В ней уже математическая модель основывалась на том, что оба производителя выбирают объем поставляемой продукции, цена же варьируется в результате равновесия между спросом и предложением. Рыночная цена устанавливается на том же уровне, на котором покупателями будет предъявлен спрос на весь «выкинутый на рынок» товар. Однако Бертран основывался на более естественном поведении продавца, именно на выборе им цены, а не количества «выброшенного» на рынок товара, как у Курно.
    Заметим, что покупатели обычно рассматривают продукцию одинакового назначения разных фирм как разные товары. Поэтому будем считать, что на рынок каждая фирма выходит со своим товаром, причем все эти товары взаимозаменяемы.
    Математическая модель дуополии Бертрана представлена бескоалиционной игрой двух лиц в нормальной форме. Для нее формализуется два вида равновесия: по Бержу (РБ) и по Нэшу (РН).
    Предполагается, что:
    $a)$ максимальная цена и себестоимость у обоих игроков совпадают (что естественно для рынка одного товара);
    $b)$ запрещена коалиция из двух игроков (в этом – бескоалиционный характер игры);
    $c)$ цена больше себестоимости, ибо в противном случае продавцам (игрокам) вряд ли стоит появляться на рынке.
    В предлагаемой читателю статье для почти всех значений параметров модели установлен конструктивный способ выбора конкретного равновесия (РБ или РН) в зависимости от установившейся на рынке максимальной цены продукта.

    Belskikh Y.A., Zhukovskii V.I., Samsonov S.P.
    Altruistic (Berge) equilibrium in the model of Bertrand duopoly, pp. 27-45

    In 1883 the French mathematician J. Bertrand (1822-1900) constructed the model of price competition on oligopoly market in which firms compete between themselves changing the price of goods.
    The mathematical model of Bertrand duopoly is represented by a non-cooperative game of two persons in normal form. Two equilibriums are formalized for it: Berge equilibrium (BE) and Nash equilibrium (NE).
    It is assumed that
    $a)$ maximal price and cost price of both players coincide (it's naturally for the market of one product);
    $b)$ the coalition of two players is prohibited (this is non-cooperative character of the game);
    $c)$ the price is higher than the cost price for otherwise the sellers (players) would hardly appear on the market.
    In the present article for almost all values of parameters of the model (except the measure-null) the constructive method of the choice of concrete equilibrium (BE or NE) depending on the maximal price of the product established in the market is suggested.

  8. Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.

    A zero-sum linear-convex differential game with a quality index that estimates a set of deviations of a motion trajectory at given instants of time from given target points is considered. A case when the saddle point condition in a small game, also known as Isaac's condition, does not hold, is studied. The game is formalized in classes of mixed control strategies of players. A numerical method for approximate computation of the game value and optimal strategies is elaborated. The method is based on the recurrent construction of upper convex hulls of auxiliary program functions. The results of numerical experiments in model examples are given.

  9. Рассматривается линейная стационарная задача преследования с участием группы преследователей и группы убегающих при условиях, что матрица системы является скалярной, среди преследователей имеются как участники, у которых множество допустимых управлений совпадает с множеством допустимых управлений убегающих, так и участники с меньшими возможностями. Множеством значений допустимых управлений убегающих является шар с центром в нуле. Цель группы преследователей состоит в том, чтобы «переловить» всех убегающих. Цель группы убегающих - помешать этому, то есть предоставить возможность по крайней мере одному из убегающих уклониться от встречи. Преследователи и убегающие используют кусочно-программные стратегии. Показано, что если в игре, в которой все участники обладают равными возможностями, происходит уклонение от встречи хотя бы одного убегающего на бесконечном промежутке времени, то добавление любого числа преследователей с меньшими возможностями приводит к тому, что хотя бы один из убегающих уклонится от встречи на любом конечном промежутке времени.

    A linear stationary pursuit problem with a group of pursuers and a group of evaders is considered under the following conditions: the matrix of the system is a scalar matrix, among the pursuers there are participants whose set of admissible controls coincides with the set of admissible controls of evaders, and there are participants with fewer opportunities. The set of values of admissible controls of evaders is a ball with center at the origin. The pursuers' goal is to capture all evaders. The evaders' goal is to prevent this, i.e. to provide an opportunity for at least one of them to escape meeting. Pursuers and evaders use piecewise-program strategies. It is shown that if all participants of the game have equal opportunities and at least one of the evaders avoids meeting on the infinite time interval, then the addition of any number of pursuers with fewer opportunities leads to evasion of at least one evader on any finite time interval.

  10. Для игровой задачи удержания траекторий абстрактной динамической системы в заданном множестве исследуются соотношения метода программных итераций и конструкций, связанных с построением операторно выпуклой оболочки множества посредством предоболочки. В рамках данных соотношений процедура построения упомянутой оболочки реализуется в форме, двойственной по отношению к процедуре на основе метода программных итераций. Решение задачи удержания определяется в классе многозначных квазистратегий (неупреждающих откликов на реализации неопределенных факторов процесса). Показано, что множество успешной разрешимости задачи удержания определяется в виде предела итерационной процедуры на пространстве множеств, элементами которых являются позиции игры, а также установлена структура разрешающих квазистратегий.

    For an abstract dynamic system the game problem of trajectories retention in a given set is considered. The relations of the method of programmed iterations and the constructions associated with the generation of the operator convex hull with the help of prehull are investigated. Within these relations the procedure of constructing the hull is realized in the form dual to the procedure based on the method of programmed iterations. The retention problem solution is determined in the class of multi-valued quasistrategies (nonanticipating responses to the realization of uncertain factors of the process). It is shown that the set of successful solvability of the retention problem is defined as the limit of the iterative procedure in the space of sets, elements of which are positions of the game; the structure of resolving quasistrategies is also provided.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref