Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'optimal solution':
Найдено статей: 45
  1. Рассматривается нелокальная граничная задача для управляемой системы с обратной связью, описываемой полулинейным функционально-дифференциальным включением дробного порядка с бесконечным запаздыванием в сепарабельном банаховом пространстве. Приводится общий принцип существования решений задачи в терминах отличия от нуля топологической степени соответствующего векторного поля. Доказывается конкретный пример (теорема 6) реализации этого общего принципа. Доказывается существование оптимального решения поставленной задачи, минимизирующего заданный полунепрерывный снизу функционал качества.

    Afanasova M.S., Obukhovskii V.V., Petrosyan G.G.
    On a generalized boundary value problem for a feedback control system with infinite delay, pp. 167-185

    We consider a non-local boundary value problem for a feedback control system described by a semilinear functional-differential inclusion of fractional order with infinite delay in a separable Banach space. The general principle of existence of solutions to the problem in terms of the difference from zero of the topological degree of the corresponding vector field is given. We prove a concrete example (Theorem 6) of the implementation of this general principle. The existence of an optimal solution to the posed problem is proved, which minimizes the given lower semicontinuous quality functional.

  2. Дифференциальные включения типа среднего поля возникают в рамках теории управления средним полем при овыпуклении правой части. Мы исследуем случай, когда правая часть дифференциального включения зависит от положения агента и от распределения всех агентов полунепрерывно. Основной результат статьи состоит в доказательстве существования и стабильности решений дифференциальных включений типа среднего поля. Также мы показываем полунепрерывную снизу зависимость функции цены задачи оптимального управления средним полем от начального состояния и параметра.

    Mean field type differential inclusions appear within the theory of mean field type control through the convexification of a right-hand side. We study the case when the right-hand side of a differential inclusion depends on the state of an agent and the distribution of agents in an upper semicontinuous way. The main result of the paper is the existence and the stability of the solution of a mean field type differential inclusion. Furthermore, we show that the value function of the mean field type optimal control problem depends on an initial state and a parameter semicontinuously.

  3. Исследуется задача мультипликативного управления для стационарной диффузионно-дрейфовой модели зарядки полярного диэлектрика. Роль управления играет старший коэффициент в уравнении модели, имеющий смысл коэффициента диффузии электронов. Глобальная разрешимость краевой задачи и локальная единственность ее решения, а также разрешимость экстремальной задачи доказана в предыдущих работах авторов. В настоящей работе для задачи управления выводится система оптимальности и устанавливаются условия локальной регулярности множителя Лагранжа. На основе анализа данной системы доказывается локальная единственность решения задачи мультипликативного управления для конкретных функционалов качества.

    The multiplicative control problem for a stationary diffusion-drift model of charging a polar dielectric is studied. The role of control is played by a leading coefficient in the model equation, which has the meaning of the electron diffusion coefficient. The global solvability of the boundary value problem and the local uniqueness of its solution, as well as the solvability of the extremum problem under consideration, have been proved in the previous papers of the authors. In this paper, an optimality system is derived for the control problem and local regularity conditions for the Lagrange multiplier are established. Based on the analysis of this system, the local uniqueness of the multiplicative control problem's solution for specific cost functionals is proved.

  4. В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению $$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t),\qquad x(0) = x_0.$$ Здесь $x(t)$ - фазовая координата, $u(t)$ - управляющая функция, $W(t)$ - винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t)=Φ(t,u(t)W(t)+y(t))$, в котором $Φ(t,v)$ - известная функция, полностью определяющаяся коэффициентом $σ(t,x)$, и не зависит от управления, а $y(t)$ - решение потраекторно-детерминированного дифференциального уравнения с мерой вида

    $$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$

    Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.

    We consider an optimal control problem for a one-dimensional process driven by stochastic differential equation, which has both drift and diffusion coefficients controlled, diffusion being linear in control

    $$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t), \qquad x(0) = x_0,$$

    where $x(t)$ is the state variable, $u(t)$ is the control variable and $W(t)$ is the Wiener process. We prove a theorem which gives a structure of solution for the considered differential equation as a superposition of functions $x(t)=Φ(t,u(t)W(t)+y(t))$, where $Φ(t,v)$ is the known function, which is completely determined by the diffusion coefficient σ(t,x) and is independent of control, and $y(t)$ is the solution to the pathwise-deterministic measure-driven differential equation

    $$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$

    The revealed structure of the solution enables us to consider a new pathwise-deterministic impulsive optimal control problem with the state variable $y(t)$ which is equivalent to the original stochastic optimal control problem. Pathwise problems may have anticipative solutions, so we propose a method that makes it possible to build nonanticipative optimal solutions. The basic idea of the method is to modify cost functional in new pathwise problem with special integral term, which guarantees nonanticipativity of solutions.

  5. Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.

    We consider an optimal control problem for an infinite amount of agents of the same type. We assume that agents have a finite state space. The given formulation of the problem involves an objective functional that is common for all agents and a common control center that chooses a strategy for agents. A chosen strategy is supposed to be positional. In this paper we consider a case when the dynamics of agents is given by a Markov chain with continuous time. It is assumed that the Kolmogorov matrix of this chain in each state depends on the current state, the chosen control and the distribution of all agents. For the original problem, it is shown that concerning positional strategies the solution can be obtained through the solution of the deterministic control problem in a finite-dimensional phase space.

  6. Для динамической системы, управляемой в условиях помех, рассматривается задача оптимизации гарантированного результата. Особенностью задачи является наличие функциональных ограничений на помехи, при которых свойство замкнутости множества допустимых помех относительно операции «склейки» двух его элементов, вообще говоря, отсутствует. Это обстоятельство препятствует непосредственному применению методов теории дифференциальных игр для исследования задачи и тем самым приводит к необходимости их походящей модификации. В работе предложено новое понятие неупреждающей стратегии управления (квазистратегии). Доказано, что соответствующий функционал оптимального гарантированного результата удовлетворяет принципу динамического программирования. Как следствие, установлены так называемые свойства $u$- и $v$-стабильности этого функционала, которые в дальнейшем позволят построить конструктивное решение задачи в позиционных стратегиях.

    For a dynamical system controlled under conditions of disturbances, a problem of optimizing the guaranteed result is considered. A feature of the problem is the presence of functional constraints on disturbances, under which, in general, the set of admissible disturbances is not closed with respect to the operation of “gluing up” of two of its elements. This circumstance does not allow to apply directly the methods developed within the differential games theory for studying the problem and, thus, leads to the necessity of modifying them appropriately. The paper provides a new notion of a non-anticipative control strategy. It is proved that the corresponding functional of the optimal guaranteed result satisfies the dynamic programming principle. As a consequence, so-called properties of $u$- and $v$-stability of this functional are established, which may allow, in the future, to obtain a constructive solution of the problem in the form of feedback (positional) controls.

  7. Исследуются вопросы единственности и устойчивости решений задач управления для модели электронно-индуцированной зарядки неоднородного полярного диэлектрика. Устанавливаются достаточные условия единственности и устойчивости оптимальных решений рассматриваемых экстремальных задач, а также выводятся локальные оценки их устойчивости относительно малых возмущений функционалов качества.

    The issues of uniqueness and stability of solutions to the control problems for the model of electron-induced charging of an inhomogeneous polar dielectric are studied. Sufficient conditions for the uniqueness and stability of optimal solutions to the considered extremum problems are established, and the local estimates of their stability with respect to small perturbations of the cost functionals are derived.

  8. Изучаются свойства дискретной вариационной задачи динамической аппроксимации в комплексном евклидовом (L + 1)-мерном пространстве E. Она обобщает известные задачи среднеквадратической полиномиальной аппроксимации функций, заданных своими отсчетами в конечном интервале. В рассматриваемой задаче аппроксимация последовательности y = {yi}L0 отсчетов функции y(t) ∈ L2[0, T], T = Lh на сетке Ih осуществляется решениями однородных линейных дифференциальных или разностных уравнений заданного порядка n с постоянными, но, возможно, неизвестными коэффициентами. Тем самым показано, что в последнем случае задача аппроксимации включает в себя и задачу идентификации. Анализ ее особенностей - основная тема статьи. Ставится задача нахождения вектора коэффициентов разностного уравнения Σn0 ŷi+k αi = 0, где k = 0,Ln. Оптимизируются коэффициенты и начальные условия переходного процесса y этого уравнения. Цель оптимизации - наилучшая аппроксимация исследуемого динамического процесса yE. Критерий аппроксимации  минимум величины ||yŷ||2E. Показано, что изучаемая вариационная задача сводится к задачам проектирования в E вектора y на ядра разностных операторов с неизвестными коэффициентами αωSEn+1. Здесь α - направление, S - сфера или гиперплоскость. Показана связь изучаемой задачи с задачами дискретизации и идентифицируемости. Тогда координаты вектора yE есть точное решение дифференциального уравнения на сетке Ih и y = ŷ. Дано сравнение изучаемой задачи вариационной идентификации с алгебраическими методами идентификации. Показано, что ортогональные дополнения к ядрам разностных операторов всегда имеют теплицев базис. Это приводит к быстрым проекционным алгоритмам вычислений. Показано, что задача нахождения оптимального вектора α сводится к задаче безусловной минимизации функционала идентификации, зависящего от направления в En+1. Предложена итерационная процедура его минимизации на сфере с широкой областью и высокой скоростью сходимости. Изучаемую вариационную задачу можно применять при математическом моделировании в управлении и научных исследованиях. При этом на конечных интервалах может использоваться, в частности, возможность кусочно-линейной динамической аппроксимации сложных динамических процессов разностными и дифференциальными уравнениями указанного типа.

     

    Some properties of the discrete variational problem of the dynamic approximation in the complex Euclidean (L + 1)-dimensional space are studied here. It generalizes familiar problems of the mean square polynomial approximation of the functions given on the finite interval in accordance with their references. In the problem under consideration sequence approximation y = {yi}L0 of the references of the function y(t) ∈ L2[0, T], T = Lh on the lattice Ih is achieved by solving homogeneous linear differential equations or difference equations of the given order n with constant but possibly unknown coefficients. Thus, it is shown that in the latter case the approximation problem also includes the identification problem. The analysis of its properties is the main subject of the article. The problem is set to find vector of coefficients of difference equation Σn0 ŷi+k αi = 0, where k = 0,L − n. Coefficients and initial conditions of the transient process by of this equation are optimized. The optimization purpose is to achieve the best approximation of the dynamic process y ∈ E being considered here. The approximation criterion is a minimum of the quantity ||y − ŷ||2E. The variational problem under study is shown to be reduced to the problem of projecting vector y in E on the kernels of the difference operators with unknown coefficients  αωSEn+1, where is a direction, S is a sphere or a hyperplane. The problem under study is shown to be related to the problems of the discretization and identifiability. In this case vector coordinates y ∈ E is an exact solution of differential equation on the lattice Ih and y = ŷ. The problem of the variational identification is compared with algebraic methods of identification. The orthogonal complement to the kernels of the difference operators are shown to always have Toeplitz basis. This results in fast projecting algorithms of computation. The problem of finding optimal vector α is shown to be reduced to the problem of the absolute minimization of the identification functional depending on the direction in En+1. The iterative procedure of its minimization on a sphere with wide domain and high speed of convergence is presented here. The variational problem considered here can be applied in mathematical modeling for control problem and research purposes. On the finite intervals, for example, it is possible to use piecewise-linear dynamic approximations of the complex dynamic processes with difference and differential equations of the specified type.

     

  9. В качестве математической модели конфликта рассматривается бескоалиционная игра Γ двух участников при неопределенности. О неопределенности известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют. Для оценки риска в Γ привлекается функция риска по Сэвиджу (из принципа минимаксного сожаления). Качество функционирования участников конфликта оценивается по двум критериям - исходам и рискам, при этом каждый из них стремится увеличить исход и одновременно уменьшить риск. На основе синтеза принципов минимаксного сожаления и гарантированного результата, равновесности по Нэшу и оптимальности по Слейтеру, а также решения иерархической двухуровневой игры по Штакельбергу формализуется понятие гарантированного по исходам (выигрышам) и рискам равновесия в Γ. Приведен пример. Затем устанавливается существование такого решения в смешанных стратегиях при обычных ограничениях в математической теории игр.

    Zhukovskii V.I., Soldatova N.G.
    Method of settlement of conflicts under uncertainty, pp. 28-33

    As a mathematical model of conflict the non-cooperation game Γ of two players under uncertainty is considered. About uncertainty only the limits of change are known. Any characteristics of probability are absent. To estimate risk in Γ we use Savage functions of risk (from principle of minimax regret). The quality of functioning of conflict's participants is estimated according to two criteria: outcomes and risks, at that each of the participants tries to increase the outcome and simultaneously to decrease the risk. On the basis of synthesis of principles of minimax regret and guaranteed result, Nash equilibrium and Slater optimality as well as solution of the two-level hierarchical Stackelberg game, the notion of guaranteed equilibrium in Γ (outcomes (prize) and risks) is formalized. We give the example. Then the existence of such a solution in mixed strategies at usual limits in mathematical game theory is established.

  10. Для задачи оптимального управления системой обыкновенных дифференциальных уравнений с поточечным фазовым ограничением типа равенства и конечным числом функциональных ограничений типа равенства и неравенства формулируется устойчивый секвенциальный, или, другими словами, регуляризованный, принцип максимума Понтрягина в итерационной форме. Его главное отличие от классического принципа максимума Понтрягина заключается в том, что он, во-первых, формулируется в терминах минимизирующих последовательностей, во-вторых, имеет форму итерационного процесса в пространстве двойственных переменных и, наконец, в-третьих, устойчиво к ошибкам исходных данных оптимизационной задачи порождает в ней минимизирующее приближенное решение в смысле Дж. Варги, т.е. представляет собою регуляризирующий алгоритм. Доказательство регуляризованного принципа максимума Понтрягина в итерационной форме опирается на методы двойственной регуляризации и итеративной двойственной регуляризации.

    The stable sequential Pontryagin maximum principle or, in other words, the regularized Pontryagin maximum principle in iterative form is formulated for the optimal control problem of a system of ordinary differential equations with pointwise phase equality constraint and a finite number of functional equality and inequality constraints. The main difference between it and the classical Pontryagin maximum principle is that, firstly, it is formulated in terms of minimizing sequences, secondly, the iterative process occurs in dual space and, thirdly, it is resistant to errors of raw data and gives a minimizing approximate solution in the sense of J. Warga. So it is a regularizing algorithm. The proof of the regularized Pontryagin maximum principle in iterative form is based on the methods of dual regularization and iterative dual regularization.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref