Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
Дифференциальные включения типа среднего поля возникают в рамках теории управления средним полем при овыпуклении правой части. Мы исследуем случай, когда правая часть дифференциального включения зависит от положения агента и от распределения всех агентов полунепрерывно. Основной результат статьи состоит в доказательстве существования и стабильности решений дифференциальных включений типа среднего поля. Также мы показываем полунепрерывную снизу зависимость функции цены задачи оптимального управления средним полем от начального состояния и параметра.
Mean field type differential inclusions appear within the theory of mean field type control through the convexification of a right-hand side. We study the case when the right-hand side of a differential inclusion depends on the state of an agent and the distribution of agents in an upper semicontinuous way. The main result of the paper is the existence and the stability of the solution of a mean field type differential inclusion. Furthermore, we show that the value function of the mean field type optimal control problem depends on an initial state and a parameter semicontinuously.
-
Рассматривается выпуклая задача оптимального управления для параболического уравнения со строго равномерно выпуклым целевым функционалом, с граничным управлением и с распределенными поточечными фазовыми ограничениями типа равенства и неравенства. Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с $s$-й степенью функций при $s\in(1,2)$. В свою очередь, граничное управление принадлежит лебегову пространству с показателем суммируемости $r\in (2,+\infty)$. Основными результатами работы в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями являются регуляризованные, или, другими словами, устойчивые к ошибкам исходных данных, секвенциальные принцип Лагранжа в недифференциальной форме и поточечный принцип максимума Понтрягина.
оптимальное граничное управление, параболическое уравнение, секвенциальная оптимизация, двойственная регуляризация, устойчивость, поточечное фазовое ограничение в лебеговом пространстве, принцип Лагранжа, принцип максимума ПонтрягинаA convex optimal control problem is considered for a parabolic equation with a strictly uniformly convex cost functional, with boundary control and distributed pointwise state constraints of equality and inequality type. The images of the operators that define pointwise state constraints are embedded into the Lebesgue space of integrable with $s$-th degree functions for $s\in(1,2)$. In turn, the boundary control belongs to Lebesgue space with summability index $r\in (2,+\infty)$. The main results of this work in the considered optimal control problem with pointwise state constraints are the two stable, with respect to perturbation of input data, sequential or, in other words, regularized principles: Lagrange principle in nondifferential form and Pontryagin maximum principle.
-
Применение крайних под- и надаргументов, выпуклых и вогнутых оболочек для поиска глобальных экстремумов, с. 483-500Для вещественнозначных функций $f$, заданных на подмножествах вещественных линейных пространств, введены понятия крайних подаргументов и крайних надаргументов, а также понятия естественных выпуклой $\check{f}$ и вогнутой $\hat{f}$ оболочек. Показано, что для любой строго выпуклой функции $g$ любая точка глобального максимума функции $f+g$ является крайним подаргументом для функции $f$. Аналогичный результат получен для функций вида $f/v + g$. На основе этих результатов предложен метод, облегчающий поиск глобальных экстремумов функций в некоторых случаях. Доказано, что при определенных условиях функции $f/v+g$ и $\hat{f}/v+g$ имеют одинаковые глобальные максимумы и одинаковые точки глобального максимума. Приведены необходимые и достаточные условия естественности выпуклой оболочки функции. Указано достаточное условие того, что при сужении области определения $f$, значения вогнутой оболочки $\hat{f}$ на суженной области не меняются. Найдены крайние под- и надаргументы для непрерывной нигде не дифференцируемой функции Кобаяши-Грея-Такаги $K(x)$ на отрезке $[0;1]$. Кроме того, на отрезке $[0;1]$ вычислены глобальные экстремумы функции $K(x)/\cos{x}$ и глобальный максимум функции $K(x)-\sqrt{x(1-x)}$. Работа снабжена примерами и проиллюстрирована графиками.
недифференцируемая оптимизация, крайние подаргументы (подабсциссы) и крайние надаргументы (надабсциссы) функции, естественные вогнутая и выпуклая оболочки функции, функция Кобаяши-Грея-Такаги
Application of extreme sub- and epiarguments, convex and concave envelopes to search for global extrema, pp. 483-500For real-valued functions $f$, defined on subsets of real linear spaces, the notions of extreme subarguments, extreme epiarguments, natural convex $\check{f}$ and natural concave $\hat{f}$ envelopes are introduced. It is shown that for any strictly convex function $g$, any point of the global maximum of the function $f+g$ is an extreme subargument for the function $f$. A similar result is obtained for functions of the form $f/v + g$. Based on these results, a method is proposed, that facilitates the search for global extrema of functions in some cases. It is proved that under certain conditions the functions $f/v+g$ and $\hat{f}/v+g$ have the same global maximum and the same points of the global maximum. Necessary and sufficient conditions for the naturalness of the convex envelope of function are given. A sufficient condition for the invariance of values of the concave envelope $\hat{f}$ during narrowing the domain of $f$ is established. Extreme sub- and epiarguments for continuous nowhere differentiable Gray-Takagi function $K(x)$ of Kobayashi on the segment $[0;1]$ are found. Moreover, the global extrema of the function $K(x)/\cos{x}$ and the global maximum of the function $K(x)-\sqrt{x(1-x)}$ on $[0;1]$ are calculated. The article is provided with examples and graphic illustrations.
-
Неупреждающие стратегии в задачах оптимизации гарантии при функциональных ограничениях на помехи, с. 553-571Для динамической системы, управляемой в условиях помех, рассматривается задача оптимизации гарантированного результата. Особенностью задачи является наличие функциональных ограничений на помехи, при которых свойство замкнутости множества допустимых помех относительно операции «склейки» двух его элементов, вообще говоря, отсутствует. Это обстоятельство препятствует непосредственному применению методов теории дифференциальных игр для исследования задачи и тем самым приводит к необходимости их походящей модификации. В работе предложено новое понятие неупреждающей стратегии управления (квазистратегии). Доказано, что соответствующий функционал оптимального гарантированного результата удовлетворяет принципу динамического программирования. Как следствие, установлены так называемые свойства $u$- и $v$-стабильности этого функционала, которые в дальнейшем позволят построить конструктивное решение задачи в позиционных стратегиях.
оптимизация гарантии, функциональные ограничения, неупреждающие стратегии, принцип динамического программирования
Non-anticipative strategies in guarantee optimization problems under functional constraints on disturbances, pp. 553-571For a dynamical system controlled under conditions of disturbances, a problem of optimizing the guaranteed result is considered. A feature of the problem is the presence of functional constraints on disturbances, under which, in general, the set of admissible disturbances is not closed with respect to the operation of “gluing up” of two of its elements. This circumstance does not allow to apply directly the methods developed within the differential games theory for studying the problem and, thus, leads to the necessity of modifying them appropriately. The paper provides a new notion of a non-anticipative control strategy. It is proved that the corresponding functional of the optimal guaranteed result satisfies the dynamic programming principle. As a consequence, so-called properties of $u$- and $v$-stability of this functional are established, which may allow, in the future, to obtain a constructive solution of the problem in the form of feedback (positional) controls.
-
Для динамической системы, подверженной воздействиям управления и помехи и содержащей последействие в управляющих силах, рассматривается задача об управлении с оптимальным гарантированным результатом для показателя качества, представляющего собой евклидову норму совокупности отклонений движения системы в заданные моменты времени от заданных целей. На основе функциональной трактовки, опирающейся на своеобразный прогноз движений, исходная задача сводится к вспомогательной дифференциальной игре для системы без запаздывания и с терминальной платой. Функция цены этой игры вычисляется на базе конструкции выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза, оптимальные стратегии строятся методом экстремального сдвига на сопутствующие точки. Рассматриваются иллюстрирующие примеры, приводятся результаты численных экспериментов.
For a dynamical system under control and disturbances, and with delay in control, the problem of control with the optimal guaranteed result is considered for a quality index which is the Euclidean norm of the set of deviations of a system motion at the given instants from the given targets. On the basis of a functional treatment basing on a proper prediction of the motion the problem is reduced to an auxiliary differential game for a system without delay and with a terminal quality index. The value of this game is calculated from the construction of upper convex hulls of auxiliary functions from the method of stochastic program synthesis, optimal strategies are formed by the method of an extremal shift to the corresponding points. Illustrating examples and results of numerical experiments are presented.
-
Изучаются свойства дискретной вариационной задачи динамической аппроксимации в комплексном евклидовом (L + 1)-мерном пространстве E. Она обобщает известные задачи среднеквадратической полиномиальной аппроксимации функций, заданных своими отсчетами в конечном интервале. В рассматриваемой задаче аппроксимация последовательности y = {yi}L0 отсчетов функции y(t) ∈ L2[0, T], T = Lh на сетке Ih осуществляется решениями однородных линейных дифференциальных или разностных уравнений заданного порядка n с постоянными, но, возможно, неизвестными коэффициентами. Тем самым показано, что в последнем случае задача аппроксимации включает в себя и задачу идентификации. Анализ ее особенностей - основная тема статьи. Ставится задача нахождения вектора коэффициентов разностного уравнения Σn0 ŷi+k αi = 0, где k = 0,L − n. Оптимизируются коэффициенты и начальные условия переходного процесса y этого уравнения. Цель оптимизации - наилучшая аппроксимация исследуемого динамического процесса y ∈ E. Критерий аппроксимации минимум величины ||y − ŷ||2E. Показано, что изучаемая вариационная задача сводится к задачам проектирования в E вектора y на ядра разностных операторов с неизвестными коэффициентами α ∈ ω ⊂ S ⊂ En+1. Здесь α - направление, S - сфера или гиперплоскость. Показана связь изучаемой задачи с задачами дискретизации и идентифицируемости. Тогда координаты вектора y ∈ E есть точное решение дифференциального уравнения на сетке Ih и y = ŷ. Дано сравнение изучаемой задачи вариационной идентификации с алгебраическими методами идентификации. Показано, что ортогональные дополнения к ядрам разностных операторов всегда имеют теплицев базис. Это приводит к быстрым проекционным алгоритмам вычислений. Показано, что задача нахождения оптимального вектора α сводится к задаче безусловной минимизации функционала идентификации, зависящего от направления в En+1. Предложена итерационная процедура его минимизации на сфере с широкой областью и высокой скоростью сходимости. Изучаемую вариационную задачу можно применять при математическом моделировании в управлении и научных исследованиях. При этом на конечных интервалах может использоваться, в частности, возможность кусочно-линейной динамической аппроксимации сложных динамических процессов разностными и дифференциальными уравнениями указанного типа.
вариационная идентификация, алгебраическая идентификация, кусочно–линейная динамическая аппроксимация, ортогональная регрессия, неградиентная оптимизацияSome properties of the discrete variational problem of the dynamic approximation in the complex Euclidean (L + 1)-dimensional space are studied here. It generalizes familiar problems of the mean square polynomial approximation of the functions given on the finite interval in accordance with their references. In the problem under consideration sequence approximation y = {yi}L0 of the references of the function y(t) ∈ L2[0, T], T = Lh on the lattice Ih is achieved by solving homogeneous linear differential equations or difference equations of the given order n with constant but possibly unknown coefficients. Thus, it is shown that in the latter case the approximation problem also includes the identification problem. The analysis of its properties is the main subject of the article. The problem is set to find vector of coefficients of difference equation Σn0 ŷi+k αi = 0, where k = 0,L − n. Coefficients and initial conditions of the transient process by of this equation are optimized. The optimization purpose is to achieve the best approximation of the dynamic process y ∈ E being considered here. The approximation criterion is a minimum of the quantity ||y − ŷ||2E. The variational problem under study is shown to be reduced to the problem of projecting vector y in E on the kernels of the difference operators with unknown coefficients α ∈ ω ⊂ S ⊂ En+1, where is a direction, S is a sphere or a hyperplane. The problem under study is shown to be related to the problems of the discretization and identifiability. In this case vector coordinates y ∈ E is an exact solution of differential equation on the lattice Ih and y = ŷ. The problem of the variational identification is compared with algebraic methods of identification. The orthogonal complement to the kernels of the difference operators are shown to always have Toeplitz basis. This results in fast projecting algorithms of computation. The problem of finding optimal vector α is shown to be reduced to the problem of the absolute minimization of the identification functional depending on the direction in En+1. The iterative procedure of its minimization on a sphere with wide domain and high speed of convergence is presented here. The variational problem considered here can be applied in mathematical modeling for control problem and research purposes. On the finite intervals, for example, it is possible to use piecewise-linear dynamic approximations of the complex dynamic processes with difference and differential equations of the specified type.
-
В качестве математической модели конфликта рассматривается бескоалиционная игра Γ двух участников при неопределенности. О неопределенности известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют. Для оценки риска в Γ привлекается функция риска по Сэвиджу (из принципа минимаксного сожаления). Качество функционирования участников конфликта оценивается по двум критериям - исходам и рискам, при этом каждый из них стремится увеличить исход и одновременно уменьшить риск. На основе синтеза принципов минимаксного сожаления и гарантированного результата, равновесности по Нэшу и оптимальности по Слейтеру, а также решения иерархической двухуровневой игры по Штакельбергу формализуется понятие гарантированного по исходам (выигрышам) и рискам равновесия в Γ. Приведен пример. Затем устанавливается существование такого решения в смешанных стратегиях при обычных ограничениях в математической теории игр.
стратегии, ситуации, неопределенности, бескоалиционная игра, равновесность по Нэшу, максимум и минимум по СлейтеруAs a mathematical model of conflict the non-cooperation game Γ of two players under uncertainty is considered. About uncertainty only the limits of change are known. Any characteristics of probability are absent. To estimate risk in Γ we use Savage functions of risk (from principle of minimax regret). The quality of functioning of conflict's participants is estimated according to two criteria: outcomes and risks, at that each of the participants tries to increase the outcome and simultaneously to decrease the risk. On the basis of synthesis of principles of minimax regret and guaranteed result, Nash equilibrium and Slater optimality as well as solution of the two-level hierarchical Stackelberg game, the notion of guaranteed equilibrium in Γ (outcomes (prize) and risks) is formalized. We give the example. Then the existence of such a solution in mixed strategies at usual limits in mathematical game theory is established.
-
В статье рассматривается экстремальная задача маршрутизации с ограничениями. В общей формулировке предполагается, что объектами посещения являются любые непустые конечные множества — мегаполисы. Основной прикладной задачей, рассматриваемой в данном исследовании, является задача оптимизации траектории движения инструмента для станков листовой резки с ЧПУ, известная как проблема пути резания. Эта проблема возникает на этапе разработки управляющих программ для станков с ЧПУ. Возможны и другие приложения. В частности, результаты исследования могут быть использованы в задаче минимизация дозы облучения при демонтаже системы радиационно-опасных элементов после аварий на АЭС и в транспортных проблемах. В качестве ограничений исследуются ограничения предшествования. Они могут быть использованы для уменьшения вычислительной сложности. В качестве основного метода исследования использовалось широко понимаемое динамическое программирование. Предлагаемая реализация метода учитывает ограничения предшествования и зависимость целевых функций от списка задач. Последняя относится к классу очень сложных состояний, которые определяют допустимость маршрута на каждом шаге маршрутизации, в зависимости от уже выполненных или, наоборот, еще не завершенных задач. Применительно к задаче резки зависимость целевой функции от списка задач позволяет уменьшать термические деформации материала при резке. В работе математическая формализация экстремальной задачи маршрутизации с дополнительными ограничениями, описание метода и полученный с его помощью точный алгоритм. Оптимизации подлежат порядок выполнения задач, конкретная траектория процесса, и его начальная точка.
динамическое программирование, дополнительные ограничения, мегаполисы, маршрутизация, станки листовой резки с ЧПУ, проблема оптимизации пути инструментаThe paper deals with an extremal routing problem with constraints. In the general formulation, it is assumed that the objects of visiting are any non-empty finite sets — megalopolises. The main applied problem considered in this study is the tool path optimization problem for CNC sheet-cutting machines, known as the Cutting Path Problem. This problem arises at the stage of developing control programs for CNC machines. Other applications are also possible. In particular, the results obtained in the chapter can be used in the problem of minimizing the radiation dose when dismantling a system of radiation-hazardous elements after accidents at nuclear power plants and in transport problems. Among tasks constraints, the precedence constraints are investigated. These constraints can be used to reduce computational complexity. As the main method, the study used broadly understood dynamic programming. The offered realization of the method takes into account the precedence constraints and the dependence of the objective functions on the task list. This dependence belongs to the class of very complex conditions that determine the route admissibility at each routing step, depending on the tasks already completed or, on the contrary, not yet completed. As applied to the Cutting Path Problem, the dependence of the objective function on the task list makes it possible to reduce thermal deformations of the material during cutting. The chapter provides a mathematical formalization of an extremal routing problem with additional constraints, a description of the method, and the exact algorithm obtained with its help. The order of task execution, the specific trajectory of the process, and the starting point are optimized.
-
О численном решении дифференциальных игр с нетерминальной платой в классах смешанных стратегий, с. 34-48Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.
On numerical solution of differential games with nonterminal payoff in classes of mixed strategies, pp. 34-48A zero-sum linear-convex differential game with a quality index that estimates a set of deviations of a motion trajectory at given instants of time from given target points is considered. A case when the saddle point condition in a small game, also known as Isaac's condition, does not hold, is studied. The game is formalized in classes of mixed control strategies of players. A numerical method for approximate computation of the game value and optimal strategies is elaborated. The method is based on the recurrent construction of upper convex hulls of auxiliary program functions. The results of numerical experiments in model examples are given.
-
Асимптотическое поведение решений в динамических биматричных играх с дисконтированными индексами, с. 193-209В работе рассматриваются динамические биматричные игры с интегральными показателями, дисконтированными на бесконечном интервале времени. Динамика системы задается дифференциальными уравнениями, описывающими изменение поведения игроков в зависимости от поступающих сигналов управления. Рассматривается задача построения равновесных траекторий в рамках минимаксного подхода, предложенного Н.Н. Красовским и А.И. Субботиным в теории дифференциальных игр. Используется конструкция динамического равновесия по Нэшу, которая развита в работах А.Ф. Клейменова. Для синтеза оптимальных стратегий управления применяется принцип максимума Л.С. Понтрягина в сочетании с методом характеристик для уравнений Гамильтона-Якоби. Получены аналитические формулы для кривых переключения оптимальных стратегий управления. Проведен анализ чувствительности равновесных решений в зависимости от параметра дисконтирования в интегральных функционалах выигрыша. Установлена асимптотическая сходимость равновесных траекторий по параметру дисконтирования к решению динамической биматричной игры со среднеинтегральными функционалами выигрыша, которые исследовались в работах В.И. Арнольда. Рассмотрено приложение полученных результатов к динамической модели инвестирования на финансовых рынках.
The paper is devoted to the analysis of dynamical bimatrix games with integral indices discounted on an infinite time interval. The system dynamics is described by differential equations in which players' behavior changes according to incoming control signals. For this game, a problem of construction of equilibrium trajectories is considered in the framework of minimax approach proposed by N.N. Krasovskii and A.I. Subbotin in the differential games theory. The game solution is based on the structure of dynamical Nash equilibrium developed in papers by A.F. Kleimenov. The maximum principle of L.S. Pontryagin in combination with the method of characteristics for Hamilton-Jacobi equations are applied for the synthesis of optimal control strategies. These methods provide analytical formulas for switching curves of optimal control strategies. The sensitivity analysis for equilibrium solutions is implemented with respect to the discount parameter in the integral payoff functional. It is shown that equilibrium trajectories in the problem with the discounted payoff functional asymptotically converge to the solution of a dynamical bimatrix game with average integral payoff functionals examined in papers by V.I. Arnold. Obtained results are applied to a dynamical model of investments on financial markets.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.