Текущий выпуск Выпуск 2, 2025 Том 35

Все выпуски

Результыты поиска по 'optimal control':

Найдено статей: 54

Багно А.Л., Тарасьев А.М.
Свойства функции цены в задачах оптимального управления с бесконечным горизонтом, с. 3-14

В статье исследуются свойства функции цены задачи оптимального управления на бесконечном горизонте с неограниченным подынтегральным индексом, входящим в функционал качества с дисконтирующим множителем. Выводится оценка аппроксимации функции цены в задаче с бесконечным горизонтом значениями функции цены в задачах с удлиняющимся конечным горизонтом. Выявляется структура функции цены через значения стационарной функции цены, зависящей только от фазовой переменной. Дается описание асимптотики роста значений функции цены для функционалов качества различного вида, принятых в экономическом и финансовом моделировании: логарифмических, степенных, экспоненциальных, линейных. Устанавливается свойство непрерывности функции цены и выводятся оценки гёльдеровских параметров непрерывности. Полученные оценки необходимы для разработки сеточных алгоритмов построения функций цены в задачах оптимального управления с бесконечным горизонтом.

оптимальное управление, бесконечный горизонт, функция цены, оценка модуля непрерывности, асимптотические свойства

Bagno A.L., Tarasyev A.M.
Properties of the value function in optimal control problems with infinite horizon, pp. 3-14

The article investigates properties of the value function of the optimal control problem on infinite horizon with an unlimited integrand index appearing in the quality functional with a discount factor. The estimate is derived for approximating the value function in a problem with the infinite horizon by levels of value functions in problems with lengthening finite horizons. The structure of the value function is identified basing on stationary value functions which depend only on phase variables. The description is given for the asymptotic growth of the value function generated by various types of the quality functional applied in economic and financial modeling: logarithmic, power, exponential, linear functions. The property of continuity is specified for the value function and estimates are deduced for the Hölder parameters of continuity. These estimates are needed for the development of grid algorithms designed for construction of the value function in optimal control problems with infinite horizon.

optimal control, infinite horizon, value function, estimation of continuity modulus, asymptotic properties
Кандоба И.Н., Козьмин И.В., Новиков Д.А.
Численное исследование одной нелинейной задачи быстродействия, с. 429-444

Обсуждаются вопросы построения допустимых управлений в одной задаче оптимального управления нелинейной динамической системой при наличии ограничений на ее текущее фазовое состояние. Рассматриваемая динамическая система описывает управляемое движение ракеты-носителя от точки старта до момента ее выхода на заданную околоземную эллиптическую орбиту. Задача заключается в построении программного управления, которое обеспечивает выведение ракетой-носителем на орбиту полезной нагрузки максимальной массы и выполнение дополнительных ограничений на текущее фазовое состояние системы. Дополнительные ограничения обусловлены необходимостью учитывать величины скоростного напора, углов атаки и скольжения при движении ракеты в плотных слоях атмосферы и осуществлять падение ее отделяемых частей в заданные районы на земной поверхности. Для ракет-носителей ряда классов такая задача равносильна нелинейной задаче быстродействия с фазовыми ограничениями. Предлагаются и численно исследуются два алгоритма построения в этой задаче допустимых управлений, обеспечивающих выполнение указанных дополнительных фазовых ограничений. Методологическую основу одного алгоритма составляет применение некоторого прогнозирующего управления, которое априори строится в задаче быстродействия без учета в ней дополнительных ограничений, а другого - использование специальных режимов управления. Приводятся результаты численного моделирования.

динамическая система, итерационный метод, нелинейная управляемая система, оптимальное управление, прогнозирующее управление, задача быстродействия, фазовые ограничения, допустимое управление

Kandoba I.N., Koz'min I.V., Novikov D.A.
Numerical investigation of a nonlinear time-optimal problem, pp. 429-444

The questions of constructing admissible controls in a problem of optimal control of a nonlinear dynamic system under constraints on its current phase state are discussed. The dynamic system under consideration describes the controlled motion of a carrier rocket from the launching point to the time when the carrier rocket enters a given elliptic earth orbit. The problem consists in designing a program control for the carrier rocket that provides the maximal value of the payload mass led to the given orbit and the fulfillment of a number of additional restrictions on the current phase state of the dynamic system. The additional restrictions are due to the need to take into account the values of the dynamic velocity pressure, the attack and slip angles when the carrier rocket moves in dense layers of the atmosphere. In addition it is required to provide the fall of detachable parts of the rocket into specified regions on the earth surface. For carrier rockets of some classes, such a problem is equivalent to a nonlinear time-optimal problem with phase constraints. Two algorithms for constructing admissible controls ensuring the fulfillment of additional phase constraints are suggested. The numerical analysis of these algorithms is performed. The methodological basis of one algorithm is the application of some predictive control, which is constructed without taking into account the constraints above. Another algorithm is based on special control modes. The results of numerical modeling are presented.

dynamic system, iterative method, nonlinear control system, optimal control, predictive control, time-optimal control, phase constraints, admissible control
Афанасова М.С., Обуховский В.В., Петросян Г.Г.
Об обобщенной краевой задаче для управляемой системы с обратной связью и бесконечным запаздыванием, с. 167-185

Рассматривается нелокальная граничная задача для управляемой системы с обратной связью, описываемой полулинейным функционально-дифференциальным включением дробного порядка с бесконечным запаздыванием в сепарабельном банаховом пространстве. Приводится общий принцип существования решений задачи в терминах отличия от нуля топологической степени соответствующего векторного поля. Доказывается конкретный пример (теорема 6) реализации этого общего принципа. Доказывается существование оптимального решения поставленной задачи, минимизирующего заданный полунепрерывный снизу функционал качества.

система управления с обратной связью, оптимальное решение, дробное дифференциальное включение, бесконечное запаздывание, мера некомпактности, уплотняющий оператор, неподвижная точка, топологическая степень

Afanasova M.S., Obukhovskii V.V., Petrosyan G.G.
On a generalized boundary value problem for a feedback control system with infinite delay, pp. 167-185

We consider a non-local boundary value problem for a feedback control system described by a semilinear functional-differential inclusion of fractional order with infinite delay in a separable Banach space. The general principle of existence of solutions to the problem in terms of the difference from zero of the topological degree of the corresponding vector field is given. We prove a concrete example (Theorem 6) of the implementation of this general principle. The existence of an optimal solution to the posed problem is proved, which minimizes the given lower semicontinuous quality functional.

feedback control system, optimal solution, fractional differential inclusion, infinite delay, measure of noncompactness, condensing operator, fixed point, topological degree
Авербух Ю.В.
Дифференциальные включения типа среднего поля с полунепрерывной правой частью, с. 489-501

Дифференциальные включения типа среднего поля возникают в рамках теории управления средним полем при овыпуклении правой части. Мы исследуем случай, когда правая часть дифференциального включения зависит от положения агента и от распределения всех агентов полунепрерывно. Основной результат статьи состоит в доказательстве существования и стабильности решений дифференциальных включений типа среднего поля. Также мы показываем полунепрерывную снизу зависимость функции цены задачи оптимального управления средним полем от начального состояния и параметра.

дифференциальные включения типа среднего поля, оптимальное управление средним полем, стабильность

Averboukh Y.V.
A mean field type differential inclusion with upper semicontinuous right-hand side, pp. 489-501

Mean field type differential inclusions appear within the theory of mean field type control through the convexification of a right-hand side. We study the case when the right-hand side of a differential inclusion depends on the state of an agent and the distribution of agents in an upper semicontinuous way. The main result of the paper is the existence and the stability of the solution of a mean field type differential inclusion. Furthermore, we show that the value function of the mean field type optimal control problem depends on an initial state and a parameter semicontinuously.

mean field type differential inclusions, mean field type optimal control, stability analysis
Бризицкий Р.В., Максимова Н.Н.
О единственности решения задачи мультипликативного управления для модели дрейфа–диффузии электронов, с. 3-18

Исследуется задача мультипликативного управления для стационарной диффузионно-дрейфовой модели зарядки полярного диэлектрика. Роль управления играет старший коэффициент в уравнении модели, имеющий смысл коэффициента диффузии электронов. Глобальная разрешимость краевой задачи и локальная единственность ее решения, а также разрешимость экстремальной задачи доказана в предыдущих работах авторов. В настоящей работе для задачи управления выводится система оптимальности и устанавливаются условия локальной регулярности множителя Лагранжа. На основе анализа данной системы доказывается локальная единственность решения задачи мультипликативного управления для конкретных функционалов качества.

модель дрейфа–диффузии электронов, модель зарядки полярного диэлектрика, задача мультипликативного управления, система оптимальности, локальная единственность

Brizitskii R.V., Maksimova N.N.
On the uniqueness of a solution to the multiplicative control problem for the electron drift–diffusion model, pp. 3-18

The multiplicative control problem for a stationary diffusion-drift model of charging a polar dielectric is studied. The role of control is played by a leading coefficient in the model equation, which has the meaning of the electron diffusion coefficient. The global solvability of the boundary value problem and the local uniqueness of its solution, as well as the solvability of the extremum problem under consideration, have been proved in the previous papers of the authors. In this paper, an optimality system is derived for the control problem and local regularity conditions for the Lagrange multiplier are established. Based on the analysis of this system, the local uniqueness of the multiplicative control problem's solution for specific cost functionals is proved.

electron drift–diffusion model, polar dielectric charging model, multiplicative control problem, optimality system, local uniqueness
Исмагилов Н.С.
Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией, с. 29-42

В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению $$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t),\qquad x(0) = x_0.$$ Здесь $x(t)$ - фазовая координата, $u(t)$ - управляющая функция, $W(t)$ - винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t)=Φ(t,u(t)W(t)+y(t))$, в котором $Φ(t,v)$ - известная функция, полностью определяющаяся коэффициентом $σ(t,x)$, и не зависит от управления, а $y(t)$ - решение потраекторно-детерминированного дифференциального уравнения с мерой вида

$$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$

Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.

стохастическое оптимальное управление, стохастические дифференциальные уравнения, детерминированный подход, потраекторная оптимизация, оптимальное импульсное управление

Ismagilov N.S.
On deterministic approach to solution of stochastic optimal control problem with controlled diffusion, pp. 29-42

We consider an optimal control problem for a one-dimensional process driven by stochastic differential equation, which has both drift and diffusion coefficients controlled, diffusion being linear in control

$$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t), \qquad x(0) = x_0,$$

where $x(t)$ is the state variable, $u(t)$ is the control variable and $W(t)$ is the Wiener process. We prove a theorem which gives a structure of solution for the considered differential equation as a superposition of functions $x(t)=Φ(t,u(t)W(t)+y(t))$, where $Φ(t,v)$ is the known function, which is completely determined by the diffusion coefficient σ(t,x) and is independent of control, and $y(t)$ is the solution to the pathwise-deterministic measure-driven differential equation

$$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$

The revealed structure of the solution enables us to consider a new pathwise-deterministic impulsive optimal control problem with the state variable $y(t)$ which is equivalent to the original stochastic optimal control problem. Pathwise problems may have anticipative solutions, so we propose a method that makes it possible to build nonanticipative optimal solutions. The basic idea of the method is to modify cost functional in new pathwise problem with special integral term, which guarantees nonanticipativity of solutions.

stochastic optimal control, stochastic differential equations, deterministic approach, pathwise optimization, optimal impulsive control
Горшков А.А., Сумин М.И.
Регуляризация принципа максимума Понтрягина в задаче оптимального граничного управления для параболического уравнения с фазовыми ограничениями в лебеговых пространствах, с. 162-177

Рассматривается выпуклая задача оптимального управления для параболического уравнения со строго равномерно выпуклым целевым функционалом, с граничным управлением и с распределенными поточечными фазовыми ограничениями типа равенства и неравенства. Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с $s$-й степенью функций при $s\in(1,2)$. В свою очередь, граничное управление принадлежит лебегову пространству с показателем суммируемости $r\in (2,+\infty)$. Основными результатами работы в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями являются регуляризованные, или, другими словами, устойчивые к ошибкам исходных данных, секвенциальные принцип Лагранжа в недифференциальной форме и поточечный принцип максимума Понтрягина.

оптимальное граничное управление, параболическое уравнение, секвенциальная оптимизация, двойственная регуляризация, устойчивость, поточечное фазовое ограничение в лебеговом пространстве, принцип Лагранжа, принцип максимума Понтрягина

Gorshkov A.A., Sumin M.I.
Regularization of the Pontryagin maximum principle in the problem of optimal boundary control for a parabolic equation with state constraints in Lebesgue spaces, pp. 162-177

A convex optimal control problem is considered for a parabolic equation with a strictly uniformly convex cost functional, with boundary control and distributed pointwise state constraints of equality and inequality type. The images of the operators that define pointwise state constraints are embedded into the Lebesgue space of integrable with $s$-th degree functions for $s\in(1,2)$. In turn, the boundary control belongs to Lebesgue space with summability index $r\in (2,+\infty)$. The main results of this work in the considered optimal control problem with pointwise state constraints are the two stable, with respect to perturbation of input data, sequential or, in other words, regularized principles: Lagrange principle in nondifferential form and Pontryagin maximum principle.

optimal boundary control, parabolic equation, sequential optimization, dual regularization, stability, pointwise state constraint in the Lebesgue space, Lagrange principle, Pontryagin's maximum principle
Березин А.А.
Позиционные стратегии в задачах управления средним полем на пространстве конечного числа состояний, с. 15-21

Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.

марковская цепь, задача управления, среднее поле

Berezin A.A.
Positional strategies in mean-field control problems on a finite state space, pp. 15-21

We consider an optimal control problem for an infinite amount of agents of the same type. We assume that agents have a finite state space. The given formulation of the problem involves an objective functional that is common for all agents and a common control center that chooses a strategy for agents. A chosen strategy is supposed to be positional. In this paper we consider a case when the dynamics of agents is given by a Markov chain with continuous time. It is assumed that the Kolmogorov matrix of this chain in each state depends on the current state, the chosen control and the distribution of all agents. For the original problem, it is shown that concerning positional strategies the solution can be obtained through the solution of the deterministic control problem in a finite-dimensional phase space.

markov chain, control problem, mean field
Изместьев И.В.
Дискретная игровая задача с терминальным множеством в форме кольца, с. 18-30

В конечномерном нормированном пространстве рассматривается дискретная игровая задача фиксированной продолжительности. Терминальное множество определяется условием принадлежности нормы фазового вектора отрезку с положительными концами. Множество, определяемое данным условием, названо в работе кольцом. Цель первого игрока заключается в том, чтобы в заданный момент времени привести фазовый вектор на терминальное множество. Цель второго игрока противоположна. В данной работе построены оптимальные управления игроков. Проведено компьютерное моделирование игрового процесса. Рассмотрена модификация исходной задачи, в которой у первого игрока в неизвестный момент времени происходит изменение в динамике.

игра, управление, терминальное множество, поломка

Izmest'ev I.V.
Discrete game problem with ring-shaped terminal set, pp. 18-30

In a normed space of finite dimension a discrete game problem with fixed duration is considered. The terminal set is determined by the condition that the norm of the phase vector belongs to a segment with positive ends. In this paper, a set defined by this condition is called a ring. The aim of the first player is to lead a phase vector to the terminal set at fixed time. The aim of the second player is the opposite. In this paper, optimal controls of the players are constructed. Computer simulation of the game process is performed. A modification of the original problem, in which at an unknown time there is a change in the dynamics of the first player, is considered.

game, control, terminal set, breakdown
Гомоюнов М.И., Серков Д.А.
Неупреждающие стратегии в задачах оптимизации гарантии при функциональных ограничениях на помехи, с. 553-571

Для динамической системы, управляемой в условиях помех, рассматривается задача оптимизации гарантированного результата. Особенностью задачи является наличие функциональных ограничений на помехи, при которых свойство замкнутости множества допустимых помех относительно операции «склейки» двух его элементов, вообще говоря, отсутствует. Это обстоятельство препятствует непосредственному применению методов теории дифференциальных игр для исследования задачи и тем самым приводит к необходимости их походящей модификации. В работе предложено новое понятие неупреждающей стратегии управления (квазистратегии). Доказано, что соответствующий функционал оптимального гарантированного результата удовлетворяет принципу динамического программирования. Как следствие, установлены так называемые свойства $u$- и $v$-стабильности этого функционала, которые в дальнейшем позволят построить конструктивное решение задачи в позиционных стратегиях.

оптимизация гарантии, функциональные ограничения, неупреждающие стратегии, принцип динамического программирования

Gomoyunov M.I., Serkov D.A.
Non-anticipative strategies in guarantee optimization problems under functional constraints on disturbances, pp. 553-571

For a dynamical system controlled under conditions of disturbances, a problem of optimizing the guaranteed result is considered. A feature of the problem is the presence of functional constraints on disturbances, under which, in general, the set of admissible disturbances is not closed with respect to the operation of “gluing up” of two of its elements. This circumstance does not allow to apply directly the methods developed within the differential games theory for studying the problem and, thus, leads to the necessity of modifying them appropriately. The paper provides a new notion of a non-anticipative control strategy. It is proved that the corresponding functional of the optimal guaranteed result satisfies the dynamic programming principle. As a consequence, so-called properties of $u$- and $v$-stability of this functional are established, which may allow, in the future, to obtain a constructive solution of the problem in the form of feedback (positional) controls.

guarantee optimization, functional constraints, non-anticipative strategies, dynamic programming principle

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал входит в систему Российского индекса научного цитирования.

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в