Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
В статье рассматриваются приближенные решения неантагонистических дифференциальных игр. Приближенное равновесие по Нэшу может быть построено по заданному решению вспомогательной стохастической игры с непрерывным временем. Мы рассматриваем случай, когда динамика вспомогательной игры задается марковской цепью с непрерывным временем. Для этой игры функция цены определяется решением системы обыкновенных дифференциальных включений. Таким образом, мы получаем конструкцию приближенного равновесия по Нэшу с выигрышами игроков, близкими к решениям системы обыкновенных дифференциальных включений. Также предложен способ построения марковской игры с непрерывным временем, аппроксимирующей исходную игру.
-
Аппроксимация функции цены дифференциальной игры с критерием, задаваемым условием минимизации, с. 536-561В статье рассматривается аппроксимация функции цены антагонистической дифференциальной игры с критерием, задаваемым условием минимизации некоторой величины вдоль реализовавшейся траектории, решениями стохастических игр с непрерывным временем и моментом остановки, управляемым одним из игроков. Отметим, что если в качестве вспомогательной игры выбрана стохастическая дифференциальная игра, то ее функция цены задается параболическим уравнением второй степени в частных производных с дополнительными ограничениями в форме неравенств, в то время как для случая вспомогательной игры с динамикой, задаваемой марковской цепью, функция цены определяется системой обыкновенных дифференциальных уравнений с дополнительными ограничениями. Развиваемый в статье метод аппроксимации основан на концепции стохастического поводыря, впервые предложенном в работах Н.Н. Красовского и А.Н. Котельниковой.
-
Для динамической системы, подверженной воздействиям управления и помехи и содержащей последействие в управляющих силах, рассматривается задача об управлении с оптимальным гарантированным результатом для показателя качества, представляющего собой евклидову норму совокупности отклонений движения системы в заданные моменты времени от заданных целей. На основе функциональной трактовки, опирающейся на своеобразный прогноз движений, исходная задача сводится к вспомогательной дифференциальной игре для системы без запаздывания и с терминальной платой. Функция цены этой игры вычисляется на базе конструкции выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза, оптимальные стратегии строятся методом экстремального сдвига на сопутствующие точки. Рассматриваются иллюстрирующие примеры, приводятся результаты численных экспериментов.
-
В 1883 г. французский математик Жозеф Луи Франсуа Бертран (1822-1900) построил модель ценовой конкуренции на олигопольном рынке, на котором фирмы конкурируют между собой, меняя цену продукции. Заметим, что такая модель не «блистала новизной», ибо ровно на 45 лет раньше тоже французский экономист, философ и математик Антуан Огюст Курно (1801-1877) в «Исследовании математических принципов теории богатства» в разделе 7 «О конкуренции производителей» рассмотрел частный случай олигополии – дуополию (при которой участвуют только два производителя). В ней уже математическая модель основывалась на том, что оба производителя выбирают объем поставляемой продукции, цена же варьируется в результате равновесия между спросом и предложением. Рыночная цена устанавливается на том же уровне, на котором покупателями будет предъявлен спрос на весь «выкинутый на рынок» товар. Однако Бертран основывался на более естественном поведении продавца, именно на выборе им цены, а не количества «выброшенного» на рынок товара, как у Курно.
Заметим, что покупатели обычно рассматривают продукцию одинакового назначения разных фирм как разные товары. Поэтому будем считать, что на рынок каждая фирма выходит со своим товаром, причем все эти товары взаимозаменяемы.
Математическая модель дуополии Бертрана представлена бескоалиционной игрой двух лиц в нормальной форме. Для нее формализуется два вида равновесия: по Бержу (РБ) и по Нэшу (РН).
Предполагается, что:
$a)$ максимальная цена и себестоимость у обоих игроков совпадают (что естественно для рынка одного товара);
$b)$ запрещена коалиция из двух игроков (в этом – бескоалиционный характер игры);
$c)$ цена больше себестоимости, ибо в противном случае продавцам (игрокам) вряд ли стоит появляться на рынке.
В предлагаемой читателю статье для почти всех значений параметров модели установлен конструктивный способ выбора конкретного равновесия (РБ или РН) в зависимости от установившейся на рынке максимальной цены продукта. -
О численном решении дифференциальных игр с нетерминальной платой в классах смешанных стратегий, с. 34-48Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.
-
Рассматривается линейная стационарная задача преследования с участием группы преследователей и группы убегающих при условиях, что матрица системы является скалярной, среди преследователей имеются как участники, у которых множество допустимых управлений совпадает с множеством допустимых управлений убегающих, так и участники с меньшими возможностями. Множеством значений допустимых управлений убегающих является шар с центром в нуле. Цель группы преследователей состоит в том, чтобы «переловить» всех убегающих. Цель группы убегающих - помешать этому, то есть предоставить возможность по крайней мере одному из убегающих уклониться от встречи. Преследователи и убегающие используют кусочно-программные стратегии. Показано, что если в игре, в которой все участники обладают равными возможностями, происходит уклонение от встречи хотя бы одного убегающего на бесконечном промежутке времени, то добавление любого числа преследователей с меньшими возможностями приводит к тому, что хотя бы один из убегающих уклонится от встречи на любом конечном промежутке времени.
-
Для конфликтно-управляемой динамической системы, описываемой функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла, рассматривается дифференциальная игра с показателем качества, который оценивает историю движения, реализующуюся к терминальному моменту времени, а также включает интегральную оценку реализаций управлений игроков. Игра формализуется в классе чистых позиционных стратегий. На основе понятия коинвариантных производных для функционала цены этой игры выписывается функциональное уравнение Гамильтона-Якоби. Доказывается, во-первых, что решение этого уравнения, удовлетворяющее определенным условиям гладкости, является ценой исходной дифференциальной игры, а во-вторых, что цена в точках дифференцируемости удовлетворяет выписанному уравнению Гамильтона-Якоби. Таким образом, это уравнение можно трактовать как уравнение Гамильтона-Якоби-Айзекса-Беллмана для систем нейтрального типа.
-
Рассматривается нелинейная однотипная дифференциальная игра с фиксированным моментом окончания. Платой является норма фазового вектора. Вычислена функция цены игры и найдены оптимальные стратегии игроков.
-
О свойствах одного функционала, используемого в программных конструкциях решения дифференциальных игр, с. 668-696Исследуются нелинейная дифференциальная игра (ДИ) сближения-уклонения, а также релаксации игровой задачи сближения (имеется в виду ослабление условий окончания игры сближения). Рассматривается вариант метода программных итераций, реализуемый в пространстве функций и доставляющий в пределе функцию цены ДИ на минимакс-максимин для специальных функционалов траектории. Данная предельная функция реализует для каждой позиции игры наименьший размер окрестности целевого множества, для которого при пропорциональном ослаблении фазовых ограничений игрок, заинтересованный в сближении, еще гарантирует его осуществление. Исследуются свойства вышеупомянутых функционалов и предельной функции. В частности, получены достаточные условия реализации значений данной функции при выполнении конечного числа итераций.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.