Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
Дифференциальные включения типа среднего поля возникают в рамках теории управления средним полем при овыпуклении правой части. Мы исследуем случай, когда правая часть дифференциального включения зависит от положения агента и от распределения всех агентов полунепрерывно. Основной результат статьи состоит в доказательстве существования и стабильности решений дифференциальных включений типа среднего поля. Также мы показываем полунепрерывную снизу зависимость функции цены задачи оптимального управления средним полем от начального состояния и параметра.
Mean field type differential inclusions appear within the theory of mean field type control through the convexification of a right-hand side. We study the case when the right-hand side of a differential inclusion depends on the state of an agent and the distribution of agents in an upper semicontinuous way. The main result of the paper is the existence and the stability of the solution of a mean field type differential inclusion. Furthermore, we show that the value function of the mean field type optimal control problem depends on an initial state and a parameter semicontinuously.
-
Поиск оптимального начального распределения местоположения игроков в игре патрулирования, с. 453-458В работе рассматривается игра патрулирования с двумя игроками — патрулирующим и атакующим. Цель первого игрока — охранять объект от злоумышленников, поймать атакующего. Цель второго — причинить урон охраняемому объекту и не стать пойманным. В данной статье охраняемым объектом выступают базовые станции сотовых компаний. Теоретико-игровая модель построена для решения задачи о нахождении начального распределения местоположения игроков по базовым станциям. При известной матрице перехода игроков по станциям в работе находятся оптимальные стратегии игроков и значение игры. Рассмотрена обратная задача — поиск оптимальных матриц перехода при известных начальных распределениях местоположения игроков. В такой постановке найдено равновесие по Нэшу, когда атакующий совершает две атаки.
A patrolling game with two players, a patroller and an attacker, is considered in the paper. The aim of the former is to protect an object from intruders and catch the attacker. The aim of the latter is to cause damage to the protected object without being caught. Cellular base stations are viewed as protected objects. A game-theoretic model is constructed to find an initial distribution of players on base stations. When the transition matrix of players among the stations is known, an optimal strategy of players and the value of the game are calculated. An inverse problem of searching for optimal transition matrices with known initial distribution of players is studied. The Nash equilibrium with the attacker making two attacks is found for the considered problem.
-
Рассматривается выпуклая задача оптимального управления для параболического уравнения со строго равномерно выпуклым целевым функционалом, с граничным управлением и с распределенными поточечными фазовыми ограничениями типа равенства и неравенства. Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с $s$-й степенью функций при $s\in(1,2)$. В свою очередь, граничное управление принадлежит лебегову пространству с показателем суммируемости $r\in (2,+\infty)$. Основными результатами работы в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями являются регуляризованные, или, другими словами, устойчивые к ошибкам исходных данных, секвенциальные принцип Лагранжа в недифференциальной форме и поточечный принцип максимума Понтрягина.
оптимальное граничное управление, параболическое уравнение, секвенциальная оптимизация, двойственная регуляризация, устойчивость, поточечное фазовое ограничение в лебеговом пространстве, принцип Лагранжа, принцип максимума ПонтрягинаA convex optimal control problem is considered for a parabolic equation with a strictly uniformly convex cost functional, with boundary control and distributed pointwise state constraints of equality and inequality type. The images of the operators that define pointwise state constraints are embedded into the Lebesgue space of integrable with $s$-th degree functions for $s\in(1,2)$. In turn, the boundary control belongs to Lebesgue space with summability index $r\in (2,+\infty)$. The main results of this work in the considered optimal control problem with pointwise state constraints are the two stable, with respect to perturbation of input data, sequential or, in other words, regularized principles: Lagrange principle in nondifferential form and Pontryagin maximum principle.
-
Позиционные стратегии в задачах управления средним полем на пространстве конечного числа состояний, с. 15-21Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.
We consider an optimal control problem for an infinite amount of agents of the same type. We assume that agents have a finite state space. The given formulation of the problem involves an objective functional that is common for all agents and a common control center that chooses a strategy for agents. A chosen strategy is supposed to be positional. In this paper we consider a case when the dynamics of agents is given by a Markov chain with continuous time. It is assumed that the Kolmogorov matrix of this chain in each state depends on the current state, the chosen control and the distribution of all agents. For the original problem, it is shown that concerning positional strategies the solution can be obtained through the solution of the deterministic control problem in a finite-dimensional phase space.
-
Для задачи оптимального управления линейным параболическим уравнением с распределенным, начальным и граничным управлениями и с операторным полуфазовым ограничением типа равенства формулируется устойчивый секвенциальный, или, другими словами, регуляризованный, принцип максимума Понтрягина в итерационной форме. Его главное отличие от классического принципа максимума Понтрягина заключается в том, что он, во-первых, формулируется в терминах минимизирующих последовательностей, во-вторых, имеет форму итерационного процесса в пространстве двойственных переменных и, наконец, в-третьих, устойчиво к ошибкам исходных данных оптимизационной задачи порождает в ней минимизирующее приближенное решение в смысле Дж. Варги, т.е. представляет собой регуляризирующий алгоритм. Доказательство регуляризованного принципа максимума Понтрягина в итерационной форме опирается на методы двойственной регуляризации и итеративной двойственной регуляризации. Приводятся результаты модельных расчетов при решении конкретной задачи оптимального управления, иллюстрирующих работу алгоритма, основанного на регляризованном итерационном принципе максимума Понтрягина. В качестве конкретной оптимизационной задачи рассмотрена задача поиска минимальной по норме тройки управлений при операторном ограничении-равенстве в финальный момент времени, или, другими словами, обратная задача финального наблюдения по поиску ее нормального решения.
оптимальное управление, неустойчивость, итеративная двойственная регуляризация, регуляризованный итерационный принцип Лагранжа, регуляризованный итерационный принцип максимума ПонтрягинаThe stable sequential Pontryagin maximum principle or, in other words, the regularized Pontryagin maximum principle in iterative form is formulated for the optimal control problem of a linear parabolic equation with distributed, initial and boundary controls and operator semiphase equality constraint. The main difference between it and the classical Pontryagin maximum principle is that, firstly, it is formulated in terms of minimizing sequences, secondly, the iterative process occurs in dual space, and thirdly, it is resistant to error of raw data and gives a minimizing approximate solution in the sense of J. Warga. So it is a regularizing algorithm. The proof of the regularized Pontryagin maximum principle in iterative form is based on the dual regularization methods and iterative dual regularization. The results of model calculations of the concrete optimal control problem illustrating the work of the algorithm based on the regularized iterative Pontryagin maximum principle are presented. The problem of finding a control triple with minimal norm under a given equality constraint at the final instant of time or, in other words, the inverse final observation problem of finding a normal solution is used as a concrete model optimal control problem.
-
Рассматривается задача последовательного обхода мегаполисов (непустых конечных множеств) с условиями предшествования и функциями стоимости, зависящими от списка заданий. Постановка ориентирована на инженерные задачи, возникающие в атомной энергетике и связанные со снижением облучаемости работников, а также в машиностроении (маршрутизация движения инструмента при листовой резке на машинах с ЧПУ). Предполагается, что исследуемая задача дискретной оптимизации имеет ощутимую размерность, что вынуждает к использованию эвристик. Обсуждается процедура локального улучшения качества последних посредством применения оптимизирующих мультивставок, определяемых всякий раз в виде конечного дизъюнктного набора вставок. Предполагается, что в каждой вставке используется процедура оптимизации на основе широко понимаемого динамического программирования. Показано, что в «аддитивной» маршрутной задаче вышеупомянутого типа (с ограничениями и усложненными функциями стоимости) улучшения достигаемого результата также агрегируются аддитивно. Предлагаемая конструкция допускает реализацию в виде параллельной процедуры с использованием МВС; при этом отдельные вставки выделяются вычислительным узлам и формируются независимо.
We consider a problem of sequential traversal of megalopolises (nonempty finite sets) with travel cost functions depending on the set of pending tasks and precedence constraints. Its formulation is aimed at engineering problems in fission power generation connected with minimizing the exposure of staff to radiation and in machine engineering (routing of a CNC sheet cutting machine's tool). This discrete optimization problem is assumed to be sufficiently large-scale to necessitate the use of heuristics. We consider a procedure of local improvement for heuristics through a successive application of optimizing multi-inserts-finite disjoint sets of inserts. Each insert is assumed to be optimized by means of a broadly understood dynamic programming procedure. We show that in an “additive” routing problem of this kind (with precedence constraints and complex travel cost functions) the result's improvements are also aggregated additively. The proposed construction admits a parallel implementation for multiprocessor systems; in this case, the inserts are distributed to computational nodes and formed in an independent way.
-
Рассматривается регуляризация классических условий оптимальности (КУО) — принципа Лагранжа и принципа максимума Понтрягина — в выпуклой задаче оптимального управлении с функциональными ограничениями типа равенства и неравенства. Управляемая система задается линейным функционально-операторным уравнением второго рода общего вида в пространстве $L^m_2$, основной оператор правой части уравнения предполагается квазинильпотентным. Целевой функционал задачи является сильно выпуклым. Получение регуляризованных КУО в итерационной форме основано на использовании метода итеративной двойственной регуляризации. Основное предназначение получаемых в работе регуляризованных принципа Лагранжа и принципа максимума Понтрягина в итерационной форме — устойчивое генерирование минимизирующих приближенных решений в смысле Дж. Варги. Регуляризованные КУО в итерационной форме формулируются как теоремы существования в исходной задаче минимизирующих приближенных решений. Они «преодолевают» свойства некорректности КУО и являются регуляризирующими алгоритмами для решения оптимизационных задач. В качестве иллюстративного примера рассматривается задача оптимального управления, связанная с гиперболической системой дифференциальных уравнений первого порядка.
выпуклое оптимальное управление, распределенная система, функционально-операторное уравнение вольтеррова типа, некорректность, итеративная регуляризация, двойственность, минимизирующее приближенное решение, регуляризирующий оператор, принцип Лагранжа, принцип максимума ПонтрягинаWe consider the regularization of the classical optimality conditions (COCs) — the Lagrange principle and the Pontryagin maximum principle — in a convex optimal control problem with functional constraints of equality and inequality type. The system to be controlled is given by a general linear functional-operator equation of the second kind in the space $L^m_2$, the main operator of the right-hand side of the equation is assumed to be quasinilpotent. The objective functional of the problem is strongly convex. Obtaining regularized COCs in iterative form is based on the use of the iterative dual regularization method. The main purpose of the regularized Lagrange principle and the Pontryagin maximum principle obtained in the work in iterative form is stable generation of minimizing approximate solutions in the sense of J. Warga. Regularized COCs in iterative form are formulated as existence theorems in the original problem of minimizing approximate solutions. They “overcome” the ill-posedness properties of the COCs and are regularizing algorithms for solving optimization problems. As an illustrative example, we consider an optimal control problem associated with a hyperbolic system of first-order differential equations.
-
Показано, что для широкого класса распределенных оптимизационных задач характерно сильное вырождение особых управлений поточечного принципа максимума, когда вместе с принципом максимума, который можно рассматривать как необходимое условие оптимальности первого порядка при игольчатом варьировании управлений, вырождаются и необходимые условия второго порядка. Описан способ получения содержательных необходимых условий оптимальности сильно вырожденных особых управлений.
распределенные задачи оптимизации, управляемые вольтерровы функциональные уравнения, поточечный принцип максимума, особые управленияIt is proved that for distributed optimization problems a sufficiently typical situation is strong degeneration of the singular controls in the sense of the pointwise maximum principle, when together with the maximum principle (which is a first order necessary optimality condition in the case of spike-shaped variation) a second order necessary optimality conditions also degenerates. A derivation of constructive necessary optimality conditions for singular controls is suggested.
-
О применимости техники параметризации управления к решению распределенных задач оптимизации, с. 102-117Изучаются аппроксимирующие конечномерные задачи математического программирования, возникающие в результате кусочно-постоянной дискретизации управления (в рамках техники параметризации управления) при оптимизации распределенных систем достаточно широкого класса. Устанавливается непрерывность по Липшицу градиентов функций аппроксимирующих задач; приводятся соответствующие формулы градиентов, использующие аналитическое решение исходной управляемой системы и сопряженной к ней системы и тем самым обеспечивающие возможность алгоритмического разделения проблемы оптимизации и проблемы решения управляемой начально-краевой задачи. Применение к численному решению задач оптимизации иллюстрируется на примере задачи Коши-Дарбу, управляемой по интегральному критерию. Приводятся результаты численного решения соответствующей аппроксимирующей задачи в системе MatLab с помощью программы fmincon, а также авторской программы, реализующей метод условного градиента. Кроме того, рассматривается задача безусловной минимизации, получаемая из аппроксимирующей задачи с ограничениями методом синус-параметризации. Приводятся результаты численного решения указанной задачи в системе MatLab с помощью программы fminunc, а также авторских программ, реализующих методы наискорейшего спуска и BFGS. Результаты численных экспериментов подробно анализируются.
оптимизация систем с распределенными параметрами, дифференцирование функционала, кусочно-постоянная аппроксимация управления, техника параметризации управления
On applicability of control parametrization technique to solving distributed optimization problems, pp. 102-117We study approximating finite-dimensional mathematical programming problems arising from piecewise constant discretization of the control (in the framework of control parametrization technique) in the course of optimization of distributed parameter systems of a rather wide class. We establish the Lipschitz continuity for gradients of approximating problems. We present their formulas involving analytical solutions of an original controlled system and their adjoint one, thereby giving the opportunity for algorithmic separation of the optimization problem itself and the problem of solving a controlled system. Application of the approach under study to numerical optimization of distributed systems is illustrated by example of the Cauchy-Darboux system controlled by an integral criterion. We present the results of numerical solving the corresponding approximation problem in MatLab with the help of the program fmincon and also an author-developed program based on the conditional gradient method. Moreover, the unconstrained minimization problem is investigated that arises from the constrained approximation problem with applying the sine parametrization method. We present the results of numerical solving this problem in MatLab with the help of the program fminunc and also two author-developed programs based on the steepest descent and BFGS methods, respectively. The results of all numerical experiments are analyzed in detail.
-
Исследование посвящено построению параллельного алгоритма решения задачи «на узкие места», связанного с поиском разбиения конечного множества заданий на конечное число исполнителей (работников). Описывается алгоритм нахождения оптимального разбиения заданий с использованием метода динамического программирования с элементами параллельных вычислений при построении массива значений функции Беллмана. Выполнена оценка вычислительной сложности двух алгоритмов (с использованием и без использования параллельной структуры). Создана программа, с помощью которой проведен вычислительный эксперимент по решению поставленной задачи на суперкомпьютере «УРАН». Выполнен сравнительный анализ реализации алгоритмов как с использованием, так и без использования параллельной структуры. Представлена зависимость времени счета реализованной программы на суперкомпьютере от количества вычислительных ядер.
Solution of the problem of optimal task distribution by the method of dynamic programming with parallel computing, pp. 129-137The aim of the study is to construct a parallel algorithm for solving a bottleneck (minmax) problem connected with partitioning a finite set of tasks between a finite number of agents. We describe the algorithm of finding an optimal partition of tasks through dynamic programming with a parallel computation of the Bellman function and provide a computational complexity estimate for the two algorithms (with and without the parallel construction). The algorithm was implemented for the Uran supercomputer, and a computational experiment was conducted; computation time was measured for the serial algorithm and for the parallel one on varying numbers of processor cores.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.