Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'time-optimal control':
Найдено статей: 23
  1. Кандоба И.Н., Козьмин И.В., Новиков Д.А.
    Численное исследование одной нелинейной задачи быстродействия, с. 429-444

    Обсуждаются вопросы построения допустимых управлений в одной задаче оптимального управления нелинейной динамической системой при наличии ограничений на ее текущее фазовое состояние. Рассматриваемая динамическая система описывает управляемое движение ракеты-носителя от точки старта до момента ее выхода на заданную околоземную эллиптическую орбиту. Задача заключается в построении программного управления, которое обеспечивает выведение ракетой-носителем на орбиту полезной нагрузки максимальной массы и выполнение дополнительных ограничений на текущее фазовое состояние системы. Дополнительные ограничения обусловлены необходимостью учитывать величины скоростного напора, углов атаки и скольжения при движении ракеты в плотных слоях атмосферы и осуществлять падение ее отделяемых частей в заданные районы на земной поверхности. Для ракет-носителей ряда классов такая задача равносильна нелинейной задаче быстродействия с фазовыми ограничениями. Предлагаются и численно исследуются два алгоритма построения в этой задаче допустимых управлений, обеспечивающих выполнение указанных дополнительных фазовых ограничений. Методологическую основу одного алгоритма составляет применение некоторого прогнозирующего управления, которое априори строится в задаче быстродействия без учета в ней дополнительных ограничений, а другого - использование специальных режимов управления. Приводятся результаты численного моделирования.

    Kandoba I.N., Koz'min I.V., Novikov D.A.
    Numerical investigation of a nonlinear time-optimal problem, pp. 429-444

    The questions of constructing admissible controls in a problem of optimal control of a nonlinear dynamic system under constraints on its current phase state are discussed. The dynamic system under consideration describes the controlled motion of a carrier rocket from the launching point to the time when the carrier rocket enters a given elliptic earth orbit. The problem consists in designing a program control for the carrier rocket that provides the maximal value of the payload mass led to the given orbit and the fulfillment of a number of additional restrictions on the current phase state of the dynamic system. The additional restrictions are due to the need to take into account the values of the dynamic velocity pressure, the attack and slip angles when the carrier rocket moves in dense layers of the atmosphere. In addition it is required to provide the fall of detachable parts of the rocket into specified regions on the earth surface. For carrier rockets of some classes, such a problem is equivalent to a nonlinear time-optimal problem with phase constraints. Two algorithms for constructing admissible controls ensuring the fulfillment of additional phase constraints are suggested. The numerical analysis of these algorithms is performed. The methodological basis of one algorithm is the application of some predictive control, which is constructed without taking into account the constraints above. Another algorithm is based on special control modes. The results of numerical modeling are presented.

  2. Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.

    We consider an optimal control problem for an infinite amount of agents of the same type. We assume that agents have a finite state space. The given formulation of the problem involves an objective functional that is common for all agents and a common control center that chooses a strategy for agents. A chosen strategy is supposed to be positional. In this paper we consider a case when the dynamics of agents is given by a Markov chain with continuous time. It is assumed that the Kolmogorov matrix of this chain in each state depends on the current state, the chosen control and the distribution of all agents. For the original problem, it is shown that concerning positional strategies the solution can be obtained through the solution of the deterministic control problem in a finite-dimensional phase space.

  3. В конечномерном нормированном пространстве рассматривается дискретная игровая задача фиксированной продолжительности. Терминальное множество определяется условием принадлежности нормы фазового вектора отрезку с положительными концами. Множество, определяемое данным условием, названо в работе кольцом. Цель первого игрока заключается в том, чтобы в заданный момент времени привести фазовый вектор на терминальное множество. Цель второго игрока противоположна. В данной работе построены оптимальные управления игроков. Проведено компьютерное моделирование игрового процесса. Рассмотрена модификация исходной задачи, в которой у первого игрока в неизвестный момент времени происходит изменение в динамике.

    In a normed space of finite dimension a discrete game problem with fixed duration is considered. The terminal set is determined by the condition that the norm of the phase vector belongs to a segment with positive ends. In this paper, a set defined by this condition is called a ring. The aim of the first player is to lead a phase vector to the terminal set at fixed time. The aim of the second player is the opposite. In this paper, optimal controls of the players are constructed. Computer simulation of the game process is performed. A modification of the original problem, in which at an unknown time there is a change in the dynamics of the first player, is considered.

  4. Для задачи оптимального управления линейным параболическим уравнением с распределенным, начальным и граничным управлениями и с операторным полуфазовым ограничением типа равенства формулируется устойчивый секвенциальный, или, другими словами, регуляризованный, принцип максимума Понтрягина в итерационной форме. Его главное отличие от классического принципа максимума Понтрягина заключается в том, что он, во-первых, формулируется в терминах минимизирующих последовательностей, во-вторых, имеет форму итерационного процесса в пространстве двойственных переменных и, наконец, в-третьих, устойчиво к ошибкам исходных данных оптимизационной задачи порождает в ней минимизирующее приближенное решение в смысле Дж. Варги, т.е. представляет собой регуляризирующий алгоритм. Доказательство регуляризованного принципа максимума Понтрягина в итерационной форме опирается на методы двойственной регуляризации и итеративной двойственной регуляризации. Приводятся результаты модельных расчетов при решении конкретной задачи оптимального управления, иллюстрирующих работу алгоритма, основанного на регляризованном итерационном принципе максимума Понтрягина. В качестве конкретной оптимизационной задачи рассмотрена задача поиска минимальной по норме тройки управлений при операторном ограничении-равенстве в финальный момент времени, или, другими словами, обратная задача финального наблюдения по поиску ее нормального решения.

    The stable sequential Pontryagin maximum principle or, in other words, the regularized Pontryagin maximum principle in iterative form is formulated for the optimal control problem of a linear parabolic equation with distributed, initial and boundary controls and operator semiphase equality constraint. The main difference between it and the classical Pontryagin maximum principle is that, firstly, it is formulated in terms of minimizing sequences, secondly, the iterative process occurs in dual space, and thirdly, it is resistant to error of raw data and gives a minimizing approximate solution in the sense of J. Warga. So it is a regularizing algorithm. The proof of the regularized Pontryagin maximum principle in iterative form is based on the dual regularization methods and iterative dual regularization. The results of model calculations of the concrete optimal control problem illustrating the work of the algorithm based on the regularized iterative Pontryagin maximum principle are presented. The problem of finding a control triple with minimal norm under a given equality constraint at the final instant of time or, in other words, the inverse final observation problem of finding a normal solution is used as a concrete model optimal control problem.

  5. Рассматривается структурированная популяция, особи которой разделены на возрастные или типические группы, заданная нормальной автономной системой разностных уравнений. Для данной популяции исследуется задача оптимального сбора возобновляемого ресурса на конечном или бесконечном промежутках времени. Для популяции, эксплуатируемой на конечном промежутке, описана стратегия промысла, при которой достигается наибольшее значение общей стоимости изымаемого ресурса. Если же добыча ресурса происходит на неограниченном промежутке, то определяется средняя временная выгода и вычисляется ее значение при стационарном режиме эксплуатации; рассматриваются случаи, когда система имеет асимптотически устойчивую неподвижную точку или устойчивый цикл. Также описана стратегия промысла, которая является оптимальной среди других способов эксплуатации; показано, что при определенных условиях она является стационарной или отличается от стационарной только значением управления в начальный момент времени. Результаты работы проиллюстрированы на примере двухвозрастной эксплуатируемой популяции, в которой промысловому изъятию подвержены особи или младшей, или обеих возрастных групп.

    We consider the structured population which individuals are divided into age or typical groups, set by the normal independent system of difference equations. For the given population the problem of optimum harvesting of a renewed resource on finite or infinite time intervals is investigated. For the population maintained on a finite interval, we describe a craft strategy at which the greatest value of a total cost of a withdrawn resource is reached. If resource extraction occurs on an unlimited interval, we define average time profit and calculate its value at a stationary mode of operation; cases when the system has an asymptotically steady motionless point or a steady cycle are considered. A craft strategy which is optimum among other ways of operation is also described; it is shown, that under certain conditions it is stationary or differs from stationary only in value of control during the initial moment of time. The results of work are illustrated by an example of two-age exploited population in which individuals of either younger or both age groups are subject to trade.

  6. Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.

    A zero-sum linear-convex differential game with a quality index that estimates a set of deviations of a motion trajectory at given instants of time from given target points is considered. A case when the saddle point condition in a small game, also known as Isaac's condition, does not hold, is studied. The game is formalized in classes of mixed control strategies of players. A numerical method for approximate computation of the game value and optimal strategies is elaborated. The method is based on the recurrent construction of upper convex hulls of auxiliary program functions. The results of numerical experiments in model examples are given.

  7. В работе рассматриваются динамические биматричные игры с интегральными показателями, дисконтированными на бесконечном интервале времени. Динамика системы задается дифференциальными уравнениями, описывающими изменение поведения игроков в зависимости от поступающих сигналов управления. Рассматривается задача построения равновесных траекторий в рамках минимаксного подхода, предложенного Н.Н. Красовским и А.И. Субботиным в теории дифференциальных игр. Используется конструкция динамического равновесия по Нэшу, которая развита в работах А.Ф. Клейменова. Для синтеза оптимальных стратегий управления применяется принцип максимума Л.С. Понтрягина в сочетании с методом характеристик для уравнений Гамильтона-Якоби. Получены аналитические формулы для кривых переключения оптимальных стратегий управления. Проведен анализ чувствительности равновесных решений в зависимости от параметра дисконтирования в интегральных функционалах выигрыша. Установлена асимптотическая сходимость равновесных траекторий по параметру дисконтирования к решению динамической биматричной игры со среднеинтегральными функционалами выигрыша, которые исследовались в работах В.И. Арнольда. Рассмотрено приложение полученных результатов к динамической модели инвестирования на финансовых рынках.

    The paper is devoted to the analysis of dynamical bimatrix games with integral indices discounted on an infinite time interval. The system dynamics is described by differential equations in which players' behavior changes according to incoming control signals. For this game, a problem of construction of equilibrium trajectories is considered in the framework of minimax approach proposed by N.N. Krasovskii and A.I. Subbotin in the differential games theory. The game solution is based on the structure of dynamical Nash equilibrium developed in papers by A.F. Kleimenov. The maximum principle of L.S. Pontryagin in combination with the method of characteristics for Hamilton-Jacobi equations are applied for the synthesis of optimal control strategies. These methods provide analytical formulas for switching curves of optimal control strategies. The sensitivity analysis for equilibrium solutions is implemented with respect to the discount parameter in the integral payoff functional. It is shown that equilibrium trajectories in the problem with the discounted payoff functional asymptotically converge to the solution of a dynamical bimatrix game with average integral payoff functionals examined in papers by V.I. Arnold. Obtained results are applied to a dynamical model of investments on financial markets.

  8. Рассматривается модель эксплуатируемой однородной популяции, заданная разностным уравнением, зависящим от случайных параметров. При отсутствии эксплуатации развитие популяции описывается уравнением $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ где $X(k)$ — размер популяции или количество биоресурса в момент времени $k,$ $f(x)$ — вещественная дифференцируемая функция, заданная на отрезке $I=[0,a],$ такая, что $f(I)\subseteq I.$ В моменты времени $k=1,2,\ldots$ из популяции извлекается случайная доля ресурса $\omega(k)\in\Omega\subseteq[0,1]$. Процесс сбора может быть остановлен, когда доля собранного ресурса превысит некоторое значение $u(k)\in[0,1)$, чтобы сохранить по возможности большую часть популяции. Тогда доля добываемого ресурса будет равна $\ell(k)=\min (\omega(k),u(k)).$ Средняя временная выгода $H_*$ от извлечения ресурса равна пределу среднего арифметического от количества добываемого ресурса $X(k)\ell(k)$ в моменты времени $1,2,\ldots,k$ при $k\to\infty.$ Решается задача выбора управления процессом промыслового изъятия, при котором значение $H_*$ можно оценить снизу с вероятностью единица по возможности наибольшим числом. Оценки средней временной выгоды существенно зависят от свойств функции $f(x),$ определяющей динамику популяции; данные оценки получены для трех классов уравнений с функциями $f(x),$ обладающими определенными свойствами. Результаты работы проиллюстрированы численными примерами, построенными методом динамического программирования на основании того, что исследуемый процесс эксплуатации популяции является марковским процессом принятия решений.

    Rodin A.A., Rodina L.I., Chernikova A.V.
    On how to exploit a population given by a difference equation with random parameters, pp. 211-227

    We consider a model of an exploited homogeneous population given by a difference equation depending on random parameters. In the absence of exploitation, the development of the population is described by the equation $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ where $X(k)$ is the population size or the amount of bioresources at time $k,$ $f(x)$ is a real differentiable function defined on $I=[0,a]$ such that $f(I)\subseteq I.$ At moments $k=1,2,\ldots$, a random fraction of the resource $\omega(k)\in\omega\subseteq[0,1]$ is extracted from the population. The harvesting process can be stopped when the share of the harvested resource exceeds a certain value of $u(k)\in[0,1)$ to keep as much of the population as possible. Then the share of the extracted resource will be equal to $\ell(k)=\min (\omega(k),u(k)).$ The average temporary benefit $H_*$ from the extraction of the resource is equal to the limit of the arithmetic mean from the amount of extracted resource $X(k)\ell(k)$ at moments $1,2,\ldots,k$ when $k\to\infty.$ We solve the problem of choosing the control of the harvesting process, in which the value of $H_*$ can be estimated from below with probability one, as large a number as possible. Estimates of the average time benefit depend on the properties of the function $f(x)$, determining the dynamics of the population; these estimates are obtained for three classes of equations with $f(x)$, having certain properties. The results of the work are illustrated, by numerical examples using dynamic programming based on, that the process of population exploitation is a Markov decision process.

  9. Для двухпараметрического семейства функций введено понятие TA-системы, которое является обобщением известного понятия T-системы для однопараметрического семейства функций. Сформулирован и доказан ряд утверждений о системах функций, образующих TA-систему. Построенная теория TA-систем применена для изучения линейных нестационарных управляемых систем с многомерным управлением. Для указанных выше систем решена задача о быстродействии в нуль при условии, что начальная точка движения находится внутри множества докритичности.

    The notion of TA-system is introduced for a two-dimensional family of functions. This concept generalizes the well-known notion of T-system for a one-dimensional family of functions. A number of statements about TA-systems of functions is formulated and proved. The developed theory of TA-systems is used to studying of linear non-stationary control systems. For such systems the time optimal problem is solved provided the initial point belongs the interior of the subcritical set.

  10. Излагаются элементы численно-аналитического подхода к построению решения для одного класса задач быстродействия на плоскости. Предложены алгоритмы конструирования множества негладкости функции оптимального результата. Выявлена структура множеств Лебега этой функции. Обоснованы формулы для точек прекращения сингулярных кривых. Приведены результаты моделирования решений задач быстродействия для случая, когда целевое множество является невыпуклым и имеет кусочно-гладкую границу. Работа продолжает исследование обобщенных решений задач Дирихле для уравнений типа Гамильтона-Якоби.

    Singular lines and nonsmooth singularities of cost function in one class of optimal-time problems are studied.  Equations for their end points are written. Their relation with the geometry of the goal set is shown. Connection of the optimal-time problem and the first order PDE with boundary condition is ascertained.  Examples of some problems' solving and graphs of solutions are given.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref