Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
Обсуждаются вопросы построения допустимых управлений в одной задаче оптимального управления нелинейной динамической системой при наличии ограничений на ее текущее фазовое состояние. Рассматриваемая динамическая система описывает управляемое движение ракеты-носителя от точки старта до момента ее выхода на заданную околоземную эллиптическую орбиту. Задача заключается в построении программного управления, которое обеспечивает выведение ракетой-носителем на орбиту полезной нагрузки максимальной массы и выполнение дополнительных ограничений на текущее фазовое состояние системы. Дополнительные ограничения обусловлены необходимостью учитывать величины скоростного напора, углов атаки и скольжения при движении ракеты в плотных слоях атмосферы и осуществлять падение ее отделяемых частей в заданные районы на земной поверхности. Для ракет-носителей ряда классов такая задача равносильна нелинейной задаче быстродействия с фазовыми ограничениями. Предлагаются и численно исследуются два алгоритма построения в этой задаче допустимых управлений, обеспечивающих выполнение указанных дополнительных фазовых ограничений. Методологическую основу одного алгоритма составляет применение некоторого прогнозирующего управления, которое априори строится в задаче быстродействия без учета в ней дополнительных ограничений, а другого - использование специальных режимов управления. Приводятся результаты численного моделирования.
динамическая система, итерационный метод, нелинейная управляемая система, оптимальное управление, прогнозирующее управление, задача быстродействия, фазовые ограничения, допустимое управлениеThe questions of constructing admissible controls in a problem of optimal control of a nonlinear dynamic system under constraints on its current phase state are discussed. The dynamic system under consideration describes the controlled motion of a carrier rocket from the launching point to the time when the carrier rocket enters a given elliptic earth orbit. The problem consists in designing a program control for the carrier rocket that provides the maximal value of the payload mass led to the given orbit and the fulfillment of a number of additional restrictions on the current phase state of the dynamic system. The additional restrictions are due to the need to take into account the values of the dynamic velocity pressure, the attack and slip angles when the carrier rocket moves in dense layers of the atmosphere. In addition it is required to provide the fall of detachable parts of the rocket into specified regions on the earth surface. For carrier rockets of some classes, such a problem is equivalent to a nonlinear time-optimal problem with phase constraints. Two algorithms for constructing admissible controls ensuring the fulfillment of additional phase constraints are suggested. The numerical analysis of these algorithms is performed. The methodological basis of one algorithm is the application of some predictive control, which is constructed without taking into account the constraints above. Another algorithm is based on special control modes. The results of numerical modeling are presented.
-
Рассматривается линейная задача преследования группой преследователей двух убегающих при равных динамических возможностях всех участников и с фазовыми ограничениями на состояния убегающих в предположении, что убегающие используют одно и то же управление. Движение каждого участника имеет вид $\dot z+a(t)z=w.$ Геометрические ограничения на управления - строго выпуклый компакт с гладкой границей, терминальные множества - начало координат. Предполагается, что убегающие в процессе игры не покидают пределы выпуклого конуса. Целью преследователей является поимка двух убегающих, цель группы убегающих противоположна. Говорят, что в задаче преследования происходит поимка, если существуют два преследователя, из заданной группы преследователей, которые ловят убегающих, при этом моменты поимки могут не совпадать. В терминах начальных позиций получены достаточные условия поимки двух убегающих. Приведены примеры, иллюстрирующие полученные результаты.
On the capture of two evaders in a non-stationary pursuit-evasion problem with phase restrictions, pp. 12-20We consider a linear problem of pursuing two evaders by a group of persecutors in case of equal dynamic opportunities of all participants and under phase restrictions imposed on the states of evaders. We assume that the evaders use the same control. The movement of each participant has the form $ \dot z + a (t) z = w. $ Geometric constraints on the control are strictly convex compact set with smooth boundary, and terminal sets are the origin of coordinates. It is assumed that the evaders do not leave the convex cone. The aim of a group of pursuers is to capture two evaders; the aim of a group of evaders is opposite. We say that a capture holds in the problem of pursuing two evaders if among the specified number of pursuers there are two of them who catch the evaders, possibly at different times. We obtain sufficient conditions for capturing two evaders in terms of initial positions. The results obtained are illustrated by examples.
-
Рассматривается выпуклая задача оптимального управления для параболического уравнения со строго равномерно выпуклым целевым функционалом, с граничным управлением и с распределенными поточечными фазовыми ограничениями типа равенства и неравенства. Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с $s$-й степенью функций при $s\in(1,2)$. В свою очередь, граничное управление принадлежит лебегову пространству с показателем суммируемости $r\in (2,+\infty)$. Основными результатами работы в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями являются регуляризованные, или, другими словами, устойчивые к ошибкам исходных данных, секвенциальные принцип Лагранжа в недифференциальной форме и поточечный принцип максимума Понтрягина.
оптимальное граничное управление, параболическое уравнение, секвенциальная оптимизация, двойственная регуляризация, устойчивость, поточечное фазовое ограничение в лебеговом пространстве, принцип Лагранжа, принцип максимума ПонтрягинаA convex optimal control problem is considered for a parabolic equation with a strictly uniformly convex cost functional, with boundary control and distributed pointwise state constraints of equality and inequality type. The images of the operators that define pointwise state constraints are embedded into the Lebesgue space of integrable with $s$-th degree functions for $s\in(1,2)$. In turn, the boundary control belongs to Lebesgue space with summability index $r\in (2,+\infty)$. The main results of this work in the considered optimal control problem with pointwise state constraints are the two stable, with respect to perturbation of input data, sequential or, in other words, regularized principles: Lagrange principle in nondifferential form and Pontryagin maximum principle.
-
Работа посвящена развитию полиэдральных методов решения двух задач управления линейными многошаговыми системами с неопределенностями при фазовых ограничениях — задач терминального сближения и уклонения. Они возникают в системах с двумя управлениями, где цель одного — привести траекторию на заданное конечное множество в заданный момент времени, не нарушая фазовых ограничений, цель другого — противоположна. Предполагается, что конечное множество — параллелепипед, управления стеснены параллелотопозначными ограничениями, фазовые ограничения заданы в виде полос. Представлены методы решения обеих задач с использованием полиэдральных (параллелотопо- или параллелепипедо-значных) трубок. Методы решения задачи сближения предложены автором ранее, но здесь исследуются их дополнительные свойства. В частности, для случая без фазовых ограничений найдены гарантированные оценки для траектории, обеспечивающие ее нахождение внутри трубки. Даны удобные достаточные условия, гарантирующие получение невырожденных сечений в процессе вычислений. Для задачи уклонения сначала рассматривается общая схема решения, а затем предлагаются полиэдральные методы. Приводятся и сравниваются целые параметрические семейства внешних и внутренних полиэдральных оценок трубок разрешимости обеих задач. Приведен иллюстрирующий пример.
системы с неопределенностью, синтез управлений, задача сближения, задача уклонения, полиэдральные методы, параллелотопы, параллелепипеды
On solving terminal approach and evasion problems for linear discrete-time systems under state constraints, pp. 204-221The paper is devoted to elaboration of polyhedral techniques for solving two control problems for linear discrete-time systems with uncertainties under state constraints, namely, the terminal approach problem and the terminal evasion one. Such problems arise in systems with two controls, where the aim of the first is to steer the trajectory onto a given terminal set at a given instant without violating the state constraints, the aim of the other is opposite. It is assumed that the terminal set is a parallelepiped, the controls are bounded by parallelotope-valued constraints, and the state constraints are given in the form of so-called zones. We present techniques for solving both problems basing on polyhedral (parallelotope-valued or parallelepiped-valued) tubes. The techniques for solving the approach problem were proposed by the author earlier, but here additional properties of them are investigated. In particular, for the case without state constraints, guaranteed estimates are found for the trajectory that ensure that it is inside the tube. Convenient sufficient conditions are given to guarantee the obtaining of nondegenerate cross-sections during the calculations. For the evasion problem, a common solution scheme is considered, and then polyhedral techniques are proposed. The whole parametric families of external and internal polyhedral estimates for the solvability tubes for both problems are presented and compared. An illustrative example is given.
-
Изучается дифференциальная игра преследования со многими преследователями и одним убегающим. Игра описывается бесконечной системой $m$ инерционных уравнений. По определению преследование завершается, если состояние одной из систем и его производная равны нулю в некоторый момент времени. В литературе такое условие завершения игры называется мягкой посадкой. В терминах энергий игроков получено условие, которое является достаточным для завершения преследования в игре. Также построены стратегии преследующих, гарантирующие завершение преследования в игре.
дифференциальная игра, управление, стратегия, много преследователей, бесконечная система дифференциальных уравнений, интегральное ограничениеWe study a pursuit differential game of many pursuers and one evader. The game is described by the infinite systems of $m$ inertial equations. By definition, pursuit in the game is completed if the state and its derivative of one of the systems are equal to zero at some time. In the literature, such a condition of completion of pursuit is also called soft landing. We obtain a condition in terms of energies of players which is sufficient for completion of pursuit in the game. The pursuit strategies are also constructed.
-
Рассматривается задача простого преследования в классе импульсных стратегий группой преследователей. В первой части рассматривается импульсная стратегия убегающего с фазовыми ограничениями. Предполагается, что убегающий не покидает выпуклого многогранного множества. В работе получены достаточные условия поимки одним из преследователей убегающего. Во второй части рассматриваются импульсные стратегии преследователей. Сформулированы достаточные условия поимки одним из преследователей убегающего, не покидающего выпуклого многогранного множества.
The present paper deals with a simple group pursuit problem in a class of impulse strategies. The first part considers the impulse strategy of an evader with phase restrictions on the evader’s state. It is assumed that the evader does not leave a convex polyhedral set. We obtain sufficient conditions for the capture of the evader by one of the pursuers. The second part deals with the impulse strategies of pursuers. Sufficient conditions for the capture of an evader by one of the pursuers under the assumption that the evader does not leave a convex polyhedral set, are stated.
-
Рассматривается задача маршрутизации перемещений с ограничениями и усложненными функциями стоимости. Предполагается, что объекты посещения суть мегаполисы (непустые конечные множества), при посещении которых должны выполняться некоторые работы, именуемые далее внутренними. По постановке задачи имеются ограничения в виде условий предшествования. Стоимость перемещений зависит от списка заданий, которые не выполнены на момент перемещения. Ситуация такого рода возникает, в частности, при аварийных ситуациях, связанных с работой АЭС и подобных происходящим в Чернобыле и Фукусиме. Речь идет об утилизации источников радиоактивного излучения, осуществляемой последовательно во времени; в этом случае исполнитель находится под воздействием источников, которые не были демонтированы на момент соответствующего перемещения. За счет этого в функциях стоимости, оценивающих воздействие радиации на исполнителя, возникает зависимость от списка невыполненных заданий. Последние состоят в том или ином варианте выключения соответствующего источника. В настоящем исследовании излагается подход к решению данной задачи параллельным алгоритмом, реализуемым на суперкомпьютере «УРАН».
We consider a routing problem with constraints and complicated cost functions. The visited objects are assumed to be clusters, or megalopolises (nonempty finite sets), and the visit to each of them entails certain tasks, which we call interior jobs. The order of visits is subject to precedence constraints. The costs of movements depend on the set of pending tasks (not yet complete at the time of the movement), which is also referred to as “sequence dependence”, “position dependence”, and “state dependence”. Such a dependence arises, in particular, in routing problems concerning emergencies at nuclear power plants, similar to the Chernobyl and Fukushima Daiichi incidents. For example, one could consider a disaster recovery problem concerned with sequential dismantlement of radiation sources; in this case, the crew conducting the dismantlement is exposed to radiation from the sources that have not yet been dealt with. This gives rise to dependence on pending tasks in the cost functions that measure the crew's radiation exposure. The latter dependence reflects the “shutdown” operations for the corresponding radiation sources. This paper sets forth an approach to a parallel solution for this problem, which was implemented and run on the URAN supercomputer.
-
Динамическое программирование в обобщенной задаче «на узкие места» и оптимизация точки старта, с. 348-363Рассматривается одна «неаддитивная» задача маршрутизации перемещений, являющаяся обобщением известной задачи «на узкие места». Предполагается заданным параметр в виде положительного числа, степень которого определяет вес соответствующего этапа системы перемещений. Варьированием параметра можно сделать доминирующими начальные или, напротив, финальные этапы перемещения. Вариант агрегирования стоимостей с упомянутыми весами соответствует идейно постановке задачи «на узкие места», но открывает возможности исследования новых постановок задач маршрутизации с ограничениями. Предполагается, однако, что постановка осложнена зависимостью стоимостей от списка заданий и включает ограничения в виде условий предшествования. Кроме того, в интересах оптимизации допускается произвольный выбор начального состояния из заданного априори множества. Для построения решения используется аппарат широко понимаемого динамического программирования. Исследуется возможность реализации глобального экстремума с любой степенью точности в условиях, когда множество возможных начальных состояний не является конечным.
Dynamic programming in the generalized bottleneck problem and the start point optimization, pp. 348-363We consider one non-additive routing problem, which is a generalization of the well-known “bottleneck problem”. The parameter is assumed to be a positive number, the degree of which determines the weight of the corresponding stage of the displacement system. By varying the parameter, it is possible to make the initial or, on the contrary, the final stages of displacement dominant. The variant of aggregation of values with the above-mentioned weights corresponds to the ideological formulation of the “bottleneck problem”, but opens the possibility of investigating new versions of routing problems with constraints. It is assumed, however, that the statement of the problem is complicated by the dependence of values on the list of tasks and includes restrictions in the form of precedence conditions. In addition, in the interest of optimization, an arbitrary choice of the initial state from a given a priori set is allowed. For the construction, the apparatus of widely understood dynamic programming is used. The possibility of realizing a global extremum with any degree of accuracy under conditions when the set of possible initial states is not finite is investigated.
-
В статье изучается задача управления в условиях помех, которая формулируется как задача оптимизации гарантированного результата. В отличие от классической постановки таких задач предполагается, что множество допустимых помех конечно и состоит из кусочно-непрерывных функций. С учетом этого дополнительного функционального ограничения на помеху определяется подходящий класс неупреждающих стратегий (квазистратегий) управления и рассматривается соответствующая величина оптимального гарантированного результата. При некотором техническом предположении о свойстве различимости допустимых помех доказывается, что этот результат может быть достигнут путем использования стратегий управления с полной памятью. Как следствие, устанавливается неулучшаемость класса стратегий с полной памятью. Ключевым элементом доказательства является процедура распознавания действующих в системе помех, которая позволяет всякой неупреждающей стратегии поставить в соответствие близкую по гарантированному результату стратегию с полной памятью. В заключение статьи приводится иллюстрирующий пример.
управление в условиях помех, оптимальная гарантия, неупреждающая стратегия, стратегия с полной памятью, распознавание помех, неулучшаемостьIn this paper, we deal with a control problem under conditions of disturbances, which is stated as a problem of optimization of the guaranteed result. Compared to the classical formulation of such problems, we assume that the set of admissible disturbances is finite and consists of piecewise continuous functions. In connection with this additional functional constraint on the disturbance, we introduce an appropriate class of non-anticipative control strategies and consider the corresponding value of the optimal guaranteed result. Under a technical assumption concerning a property of distinguishability of the admissible disturbances, we prove that this result can be achieved by using control strategies with full memory. As a consequence, we establish unimprovability of the class of full-memory strategies. A key element of the proof is a procedure of recovering the disturbance acting in the system, which allows us to associate every non-anticipative strategy with a full-memory strategy providing a close guaranteed result. The paper concludes with an illustrative example.
-
Рассматривается маршрутная задача о посещении сечений мультифункций с ограничениями в виде условий предшествования. Кроме того, по постановке предусматривается выполнение некоторых "работ" на упомянутых сечениях. Каждое решение определяется в виде упорядоченной пары, компоненты которой имеют смысл маршрута (перестановки индексов) и трассы (траектории) перемещений по сечениям мультифункций. Согласование трассы и маршрута реализуется на основе процедур последовательного выбора упорядоченных пар (пунктов прибытия и отправления) из декартовых "квадратов" сечений мультифункций, занумерованных в соответствии с маршрутом. Агрегирование стоимостей предполагается аддитивным; совокупный критерий включает стоимости (внешних) перемещений между сечениями мультифункций, внутренних "работ" и финального состояния. При построении расширения основной задачи, порождающего используемую далее функцию Беллмана, применяется эквивалентное преобразование ограничений: допустимость маршрутов по предшествованию заменяется допустимостью по вычеркиванию (заданий из списка), что соответствует варианту ограничений на текущие перемещения с одного множества на другое. Получен аналог уравнения Беллмана в виде процедуры преобразования слоёв функции Беллмана. Операция, определяющая данное преобразование, используется далее для построения эвристических алгоритмов, реализованных на ПЭВМ.
About one route problem with interior works, pp. 96-119The route problem about visiting of multifunction sections with constraints of type of preceding conditions is considered. By setting of this problem the fulfilment of works on the above-mentioned sections is provided. Any solution is defined in the form of the ordered pair for which components have the sense of the route (the index permutation) and the trace (trajectory) of the movements with respect to sections of multifunctions. The agreement of the trace and route is realized by procedures of the sequential choice of ordered pairs (the point of arrival and the starting point) of Descartes "squares" of the multifunction sections numbered in correspondence with a route. The cost aggregation is presupposed additive; the total criterion includes the costs of (exterior) movements between sections of multifunctions, interior works, and the final state. Under constructing of extension of the basic problem that realizes the used Bellman function, the equivalent transformation of constraints is applied: admissibility of routes by preceding is replaced onto admissibility by deletion of tasks (of the list) that corresponds to the constraints variant with respect to the current movements from one set onto another. An analog of the Bellman equation realized by procedure of the transformation of layers of Bellman function is obtained. The operation defining this transformation is further used for constructing of heuristic algorithms realized on PC.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.