Текущий выпуск Выпуск 2, 2025 Том 35

Все выпуски

Результыты поиска по 'Bellman equation':

Найдено статей: 6

Авербух Ю.В.
Аппроксимация функции цены дифференциальной игры с критерием, задаваемым условием минимизации, с. 536-561

В статье рассматривается аппроксимация функции цены антагонистической дифференциальной игры с критерием, задаваемым условием минимизации некоторой величины вдоль реализовавшейся траектории, решениями стохастических игр с непрерывным временем и моментом остановки, управляемым одним из игроков. Отметим, что если в качестве вспомогательной игры выбрана стохастическая дифференциальная игра, то ее функция цены задается параболическим уравнением второй степени в частных производных с дополнительными ограничениями в форме неравенств, в то время как для случая вспомогательной игры с динамикой, задаваемой марковской цепью, функция цены определяется системой обыкновенных дифференциальных уравнений с дополнительными ограничениями. Развиваемый в статье метод аппроксимации основан на концепции стохастического поводыря, впервые предложенном в работах Н.Н. Красовского и А.Н. Котельниковой.

дифференциальные игры, стохастический поводырь, аппрокимация функции цены, уравнение Айзекса–Беллмана

Averboukh Y.V.
Approximation of value function of differential game with minimal cost, pp. 536-561

The paper is concerned with the approximation of the value function of the zero-sum differential game with the minimal cost, i.e., the differential game with the payoff functional determined by the minimization of some quantity along the trajectory by the solutions of continuous-time stochastic games with the stopping governed by one player. Notice that the value function of the auxiliary continuous-time stochastic game is described by the Isaacs–Bellman equation with additional inequality constraints. The Isaacs–Bellman equation is a parabolic PDE for the case of stochastic differential game and it takes a form of system of ODEs for the case of continuous-time Markov game. The approximation developed in the paper is based on the concept of the stochastic guide first proposed by Krasovskii and Kotelnikova.

differential games with minimal cost, stochastic guide, approximation of the value function, Isaacs–Bellman equation
Гусев М.И., Осипов И.О.
О задаче локального синтеза для нелинейных систем с интегральными ограничениями, с. 171-186

В статье рассматривается задача о приведении движения нелинейной управляемой системы в начало координат при заданном интегральном ресурсе управления на конечном промежутке времени. Исследуется вопрос о построении локального синтеза управления, решающего задачу, в предположении, что промежуток времени, в течение которого осуществляется перевод системы, достаточно мал. Указаны достаточные условия, при выполнении которых задачу можно решить путем приближенной замены нелинейной системы ее линеаризацией в окрестности начала координат.

нелинейные системы, множества управляемости, интегральные ограничения, линеаризация, уравнение Беллмана, локальный синтез, малый промежуток времени, асимптотика

Gusev M.I., Osipov I.O.
On a local synthesis problem for nonlinear systems with integral constraints, pp. 171-186

The paper considers the problem of leading a nonlinear control system to the origin of coordinates at a given integral control resource on a finite time interval. We investigate the question of the construction of local control synthesis that solves the problem, assuming that the time interval during which the system is moved is sufficiently small. We indicate sufficient conditions under which the problem can be solved by the approximate replacement of the nonlinear system by its linearization in the neighborhood of the origin.

nonlinear system, controllability set, integral constraints, linearization, Bellman equation, local synthesis, small-time, asymptotics
Колпакова Е.А.
Обобщенное решение системы квазилинейных уравнений, с. 43-55

В работе рассматривается задача Коши для системы квазилинейных уравнений первого порядка специального вида. Система представлена в симметричном виде, фазовая переменная n-мерная. Рассматриваемая задача Коши получается из задачи Коши для одного уравнения Гамильтона-Якоби-Беллмана с помощью операции дифференцирования этого уравнения и краевого условия по переменной x_i. Предполагается, что гамильтониан и начальное условие принадлежат классу непрерывно дифференцируемых функций. Гамильтониан является выпуклым по сопряженной переменной.

В работе предложен новый подход к определению обобщенного решения системы квазилинейных уравнений первого порядка. Обобщенное решение рассматривается в классе многозначных функций с выпуклыми компактными значениями. Доказаны теоремы существования, единственности и устойчивости решения по начальным данным. Получено полугрупповое свойство для введенного обобщенного решения. Показано, что потенциал для обобщенного решения системы квазилинейных уравнений совпадает с единственным минимаксным/вязкостным решением соответствующей задачи Коши для уравнения Гамильтона-Якоби-Беллмана, а в точках дифференцируемости минимаксного решения его градиент совпадает с обобщенным решением исходной задачи Коши. На основе этой связи получены свойства обобщенного решения задачи Коши для системы квазилинейных уравнений. В частности, показано, что введенное обобщенное решение совпадает с супердифференциалом минимаксного решения соответствующей задачи Коши и однозначно почти всюду.

С помощью характеристик уравнения Гамильтона-Якоби-Беллмана описана структура множества точек, в которых минимаксное решение недифференцируемо.

Показано, что свойство обобщенного решения для одного квазилинейного уравнения со скалярной фазовой переменной, введенное О.А. Олейник, может быть распространено на случай рассматриваемой системы квазилинейных уравнений.

система квазилинейных уравнений, уравнение Гамильтона-Якоби-Беллмана, минимаксное/вязкостное решение, метод характеристик

Kolpakova E.A.
Generalized solution for system of quasi-linear equations, pp. 43-55

We consider the Cauchy problem for the system of quasi-linear first order equations of a special form. The system is symmetric, the state variable is n-dimensional. The considered Cauchy problem is deduced from the Cauchy problem for the Hamilton-Jacobi-Bellman equation by means of the operation of differentiation of this equation and the boundary condition with respect to the variable x_i. It is assumed that the Hamiltonian and the initial condition are continuously differentiable functions. The Hamiltonian is convex with respect to the adjoint variable.

The paper presents a new approach to the definition of the generalized solution of the system of quasi-linear first order equations. The generalized solution belongs to the class of multivalued functions with convex compact values. We prove the existence, uniqueness and stability theorems. The semigroup property for the proposed generalized solution is obtained. It is shown that the potential for generalized solutions of quasi-linear equations coincides with the unique minimax/viscosity solution of the corresponding Cauchy problem for the Hamilton-Jacobi-Bellman equation, and at the points of differentiability of the minimax solution its gradient coincides with the generalized solution of the Cauchy problem. Properties of the generalized solutions of the Cauchy problem for a system of quasi-linear equations are obtained on the basis of this connection. In particular, it is shown that the introduced generalized solution coincides with the superdifferential of the minimax solution of the Cauchy problem and is singlevalued almost everywhere.

The structure of the set of points at which the minimax solution is not differentiable is described by using the characteristics of the Hamilton-Jacobi-Bellman equation.

It is shown that the property of the generalized solution of the quasilinear equation with a scalar state variable proposed by O.A. Oleinik, can be extended to the case of the system of quasi-linear equations under consideration.

systems of quasilinear equations, Hamilton-Jacobi-Bellman equation, minimax/viscosity solution, method of characteristics
Плаксин А.Р.
Об уравнении Гамильтона-Якоби-Айзекса-Беллмана для систем нейтрального типа, с. 222-237

Для конфликтно-управляемой динамической системы, описываемой функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла, рассматривается дифференциальная игра с показателем качества, который оценивает историю движения, реализующуюся к терминальному моменту времени, а также включает интегральную оценку реализаций управлений игроков. Игра формализуется в классе чистых позиционных стратегий. На основе понятия коинвариантных производных для функционала цены этой игры выписывается функциональное уравнение Гамильтона-Якоби. Доказывается, во-первых, что решение этого уравнения, удовлетворяющее определенным условиям гладкости, является ценой исходной дифференциальной игры, а во-вторых, что цена в точках дифференцируемости удовлетворяет выписанному уравнению Гамильтона-Якоби. Таким образом, это уравнение можно трактовать как уравнение Гамильтона-Якоби-Айзекса-Беллмана для систем нейтрального типа.

системы нейтрального типа, дифференциальные игры, уравнение Гамильтона-Якоби

Plaksin A.R.
On Hamilton-Jacobi-Isaacs-Bellman equation for neutral type systems, pp. 222-237

For a conflict-controlled dynamical system described by functional differential equations of neutral type in Hale’s form, we consider a differential game with a quality index that estimates the motion history realized up to the terminal time and includes an integral estimation of realizations of players’ controls. The game is formalized in the class of pure positional strategies. Based on a coinvariant derivatives conception we derive a Hamilton–Jacobi functional equation. It is proved, firstly, that the solution of this equation, satisfying certain conditions of smoothness, is the value of the initial differential game, and secondly, that value at points of differentiability satisfies the considered Hamilton–Jacobi equation. Thus this equation can be interpreted as the Hamilton-Jacobi-Isaacs-Bellman equation for neutral type systems.

neutral type systems, differential games, Hamilton-Jacobi equation
Чеблоков И.Б., Ченцов А.Г.
Об одной задаче маршрутизации с внутренними работами, с. 96-119

Рассматривается маршрутная задача о посещении сечений мультифункций с ограничениями в виде условий предшествования. Кроме того, по постановке предусматривается выполнение некоторых "работ" на упомянутых сечениях. Каждое решение определяется в виде упорядоченной пары, компоненты которой имеют смысл маршрута (перестановки индексов) и трассы (траектории) перемещений по сечениям мультифункций. Согласование трассы и маршрута реализуется на основе процедур последовательного выбора упорядоченных пар (пунктов прибытия и отправления) из декартовых "квадратов" сечений мультифункций, занумерованных в соответствии с маршрутом. Агрегирование стоимостей предполагается аддитивным; совокупный критерий включает стоимости (внешних) перемещений между сечениями мультифункций, внутренних "работ" и финального состояния. При построении расширения основной задачи, порождающего используемую далее функцию Беллмана, применяется эквивалентное преобразование ограничений: допустимость маршрутов по предшествованию заменяется допустимостью по вычеркиванию (заданий из списка), что соответствует варианту ограничений на текущие перемещения с одного множества на другое. Получен аналог уравнения Беллмана в виде процедуры преобразования слоёв функции Беллмана. Операция, определяющая данное преобразование, используется далее для построения эвристических алгоритмов, реализованных на ПЭВМ.

маршрут, перестановка, трасса, функция Беллмана.

Cheblokov I.B., Chentsov A.G.
About one route problem with interior works, pp. 96-119

The route problem about visiting of multifunction sections with constraints of type of preceding conditions is considered. By setting of this problem the fulfilment of works on the above-mentioned sections is provided. Any solution is defined in the form of the ordered pair for which components have the sense of the route (the index permutation) and the trace (trajectory) of the movements with respect to sections of multifunctions. The agreement of the trace and route is realized by procedures of the sequential choice of ordered pairs (the point of arrival and the starting point) of Descartes "squares" of the multifunction sections numbered in correspondence with a route. The cost aggregation is presupposed additive; the total criterion includes the costs of (exterior) movements between sections of multifunctions, interior works, and the final state. Under constructing of extension of the basic problem that realizes the used Bellman function, the equivalent transformation of constraints is applied: admissibility of routes by preceding is replaced onto admissibility by deletion of tasks (of the list) that corresponds to the constraints variant with respect to the current movements from one set onto another. An analog of the Bellman equation realized by procedure of the transformation of layers of Bellman function is obtained. The operation defining this transformation is further used for constructing of heuristic algorithms realized on PC.

route, permutation, trace, Bellman function.
Колпакова Е.А.
Об определении класса оптимального управления с помощью метода характеристик, с. 59-60

Рассматривается нелинейная задача оптимального управления с функционалом типа Майера. Для определения класса функций, содержащих оптимальные управления, применен метод характеристик уравнения Беллмана.

оптимальное управление, метод характеристик

Kolpakova E.A.
On description of optimal open-loop controls via the method of characteristics, pp. 59-60

We consider nonlinear optimal control problems with the Mayer cost functionals. The method of characteristics for the Bellman equation is applied to describe classes of functions which contain optimal open-loop controls.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал входит в систему Российского индекса научного цитирования.

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в