Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'time optimal function':
Найдено статей: 17
  1. Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.

    We consider an optimal control problem for an infinite amount of agents of the same type. We assume that agents have a finite state space. The given formulation of the problem involves an objective functional that is common for all agents and a common control center that chooses a strategy for agents. A chosen strategy is supposed to be positional. In this paper we consider a case when the dynamics of agents is given by a Markov chain with continuous time. It is assumed that the Kolmogorov matrix of this chain in each state depends on the current state, the chosen control and the distribution of all agents. For the original problem, it is shown that concerning positional strategies the solution can be obtained through the solution of the deterministic control problem in a finite-dimensional phase space.

  2. Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.

    A zero-sum linear-convex differential game with a quality index that estimates a set of deviations of a motion trajectory at given instants of time from given target points is considered. A case when the saddle point condition in a small game, also known as Isaac's condition, does not hold, is studied. The game is formalized in classes of mixed control strategies of players. A numerical method for approximate computation of the game value and optimal strategies is elaborated. The method is based on the recurrent construction of upper convex hulls of auxiliary program functions. The results of numerical experiments in model examples are given.

  3. В работе рассматриваются динамические биматричные игры с интегральными показателями, дисконтированными на бесконечном интервале времени. Динамика системы задается дифференциальными уравнениями, описывающими изменение поведения игроков в зависимости от поступающих сигналов управления. Рассматривается задача построения равновесных траекторий в рамках минимаксного подхода, предложенного Н.Н. Красовским и А.И. Субботиным в теории дифференциальных игр. Используется конструкция динамического равновесия по Нэшу, которая развита в работах А.Ф. Клейменова. Для синтеза оптимальных стратегий управления применяется принцип максимума Л.С. Понтрягина в сочетании с методом характеристик для уравнений Гамильтона-Якоби. Получены аналитические формулы для кривых переключения оптимальных стратегий управления. Проведен анализ чувствительности равновесных решений в зависимости от параметра дисконтирования в интегральных функционалах выигрыша. Установлена асимптотическая сходимость равновесных траекторий по параметру дисконтирования к решению динамической биматричной игры со среднеинтегральными функционалами выигрыша, которые исследовались в работах В.И. Арнольда. Рассмотрено приложение полученных результатов к динамической модели инвестирования на финансовых рынках.

    The paper is devoted to the analysis of dynamical bimatrix games with integral indices discounted on an infinite time interval. The system dynamics is described by differential equations in which players' behavior changes according to incoming control signals. For this game, a problem of construction of equilibrium trajectories is considered in the framework of minimax approach proposed by N.N. Krasovskii and A.I. Subbotin in the differential games theory. The game solution is based on the structure of dynamical Nash equilibrium developed in papers by A.F. Kleimenov. The maximum principle of L.S. Pontryagin in combination with the method of characteristics for Hamilton-Jacobi equations are applied for the synthesis of optimal control strategies. These methods provide analytical formulas for switching curves of optimal control strategies. The sensitivity analysis for equilibrium solutions is implemented with respect to the discount parameter in the integral payoff functional. It is shown that equilibrium trajectories in the problem with the discounted payoff functional asymptotically converge to the solution of a dynamical bimatrix game with average integral payoff functionals examined in papers by V.I. Arnold. Obtained results are applied to a dynamical model of investments on financial markets.

  4. Рассматривается модель эксплуатируемой однородной популяции, заданная разностным уравнением, зависящим от случайных параметров. При отсутствии эксплуатации развитие популяции описывается уравнением $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ где $X(k)$ — размер популяции или количество биоресурса в момент времени $k,$ $f(x)$ — вещественная дифференцируемая функция, заданная на отрезке $I=[0,a],$ такая, что $f(I)\subseteq I.$ В моменты времени $k=1,2,\ldots$ из популяции извлекается случайная доля ресурса $\omega(k)\in\Omega\subseteq[0,1]$. Процесс сбора может быть остановлен, когда доля собранного ресурса превысит некоторое значение $u(k)\in[0,1)$, чтобы сохранить по возможности большую часть популяции. Тогда доля добываемого ресурса будет равна $\ell(k)=\min (\omega(k),u(k)).$ Средняя временная выгода $H_*$ от извлечения ресурса равна пределу среднего арифметического от количества добываемого ресурса $X(k)\ell(k)$ в моменты времени $1,2,\ldots,k$ при $k\to\infty.$ Решается задача выбора управления процессом промыслового изъятия, при котором значение $H_*$ можно оценить снизу с вероятностью единица по возможности наибольшим числом. Оценки средней временной выгоды существенно зависят от свойств функции $f(x),$ определяющей динамику популяции; данные оценки получены для трех классов уравнений с функциями $f(x),$ обладающими определенными свойствами. Результаты работы проиллюстрированы численными примерами, построенными методом динамического программирования на основании того, что исследуемый процесс эксплуатации популяции является марковским процессом принятия решений.

    Rodin A.A., Rodina L.I., Chernikova A.V.
    On how to exploit a population given by a difference equation with random parameters, pp. 211-227

    We consider a model of an exploited homogeneous population given by a difference equation depending on random parameters. In the absence of exploitation, the development of the population is described by the equation $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ where $X(k)$ is the population size or the amount of bioresources at time $k,$ $f(x)$ is a real differentiable function defined on $I=[0,a]$ such that $f(I)\subseteq I.$ At moments $k=1,2,\ldots$, a random fraction of the resource $\omega(k)\in\omega\subseteq[0,1]$ is extracted from the population. The harvesting process can be stopped when the share of the harvested resource exceeds a certain value of $u(k)\in[0,1)$ to keep as much of the population as possible. Then the share of the extracted resource will be equal to $\ell(k)=\min (\omega(k),u(k)).$ The average temporary benefit $H_*$ from the extraction of the resource is equal to the limit of the arithmetic mean from the amount of extracted resource $X(k)\ell(k)$ at moments $1,2,\ldots,k$ when $k\to\infty.$ We solve the problem of choosing the control of the harvesting process, in which the value of $H_*$ can be estimated from below with probability one, as large a number as possible. Estimates of the average time benefit depend on the properties of the function $f(x)$, determining the dynamics of the population; these estimates are obtained for three classes of equations with $f(x)$, having certain properties. The results of the work are illustrated, by numerical examples using dynamic programming based on, that the process of population exploitation is a Markov decision process.

  5. Для двухпараметрического семейства функций введено понятие TA-системы, которое является обобщением известного понятия T-системы для однопараметрического семейства функций. Сформулирован и доказан ряд утверждений о системах функций, образующих TA-систему. Построенная теория TA-систем применена для изучения линейных нестационарных управляемых систем с многомерным управлением. Для указанных выше систем решена задача о быстродействии в нуль при условии, что начальная точка движения находится внутри множества докритичности.

    The notion of TA-system is introduced for a two-dimensional family of functions. This concept generalizes the well-known notion of T-system for a one-dimensional family of functions. A number of statements about TA-systems of functions is formulated and proved. The developed theory of TA-systems is used to studying of linear non-stationary control systems. For such systems the time optimal problem is solved provided the initial point belongs the interior of the subcritical set.

  6. Излагаются элементы численно-аналитического подхода к построению решения для одного класса задач быстродействия на плоскости. Предложены алгоритмы конструирования множества негладкости функции оптимального результата. Выявлена структура множеств Лебега этой функции. Обоснованы формулы для точек прекращения сингулярных кривых. Приведены результаты моделирования решений задач быстродействия для случая, когда целевое множество является невыпуклым и имеет кусочно-гладкую границу. Работа продолжает исследование обобщенных решений задач Дирихле для уравнений типа Гамильтона-Якоби.

    Singular lines and nonsmooth singularities of cost function in one class of optimal-time problems are studied.  Equations for their end points are written. Their relation with the geometry of the goal set is shown. Connection of the optimal-time problem and the first order PDE with boundary condition is ascertained.  Examples of some problems' solving and graphs of solutions are given.

  7. Рассматривается нелинейная управляемая система в конечномерном евклидовом пространстве, заданная на конечном промежутке времени. Изучается одна из основных задач математической теории управления - задача о сближении фазового вектора управляемой системы с компактным целевым множеством в фазовом пространстве в фиксированный момент времени. В этой работе в качестве целевого множества выбрано множество Лебега скалярной липшицевой функции, определенной на фазовом пространстве. Упомянутая задача о сближении тесно связана с многими важными и ключевыми задачами теории управления, в частности с задачей об оптимальном по быстродействию приведении управляемой системы на целевое множество. Из-за сложности задачи о сближении для нетривиальных управляемых систем аналитическое представление решений невозможно даже для относительно простых управляемых систем. Поэтому в настоящей работе мы изучаем прежде всего вопросы, связанные с конструированием приближенного решения задачи о сближении. Конструирование приближенного решения тем методом, который изложен в работе, связано прежде всего с конструированием интегральной воронки управляемой системы, представленной в так называемом «обратном» времени. К настоящему времени известно несколько алгоритмов конструирования разрешающего программного управления в задаче о сближении. Здесь представлен алгоритм построения управления, основанный на максимальном притяжении движения системы к множеству разрешимости задачи о сближении. В работе приведены примеры.

    We consider a nonlinear controlled system in a finite-dimensional Euclidean space defined on a finite time interval. One of the main problems of mathematical control theory is studied: the problem of approaching a phase vector of a controlled system with a compact target set in the phase space at a fixed time instant. In this paper, a Lebesgue set of a scalar Lipschitz function defined on the phase space is a target set. The mentioned approach problem is closely connected with many important and key problems of control theory and, in particular, with the problem of optimally reducing a controlled system to a target set. Due to the complexity of the approach problem for nontrivial controlled systems, an analytical representation of solutions is impossible even for relatively simple controlled systems. Therefore, in the present work, we study first of all the issues related to the construction of an approximate solution of the approach problem. The construction of an approximate solution by the method described in the paper is primarily concerned with the design of the integral funnel of the controlled system, presented in the so-called “reverse” time. To date, there are several algorithms for constructing a resolving program control in the approach problem. This paper presents an algorithm for constructing a control based on the maximum attraction of the system's motion to the solvability set of the approach problem. Examples are provided.

  8. Рассматривается регуляризация принципа Лагранжа (ПЛ) в выпуклой задаче условной оптимизации с операторным ограничением-равенством в гильбертовом пространстве и конечным числом функциональных ограничений-неравенств. Целевой функционал задачи не является, вообще говоря, сильно выпуклым, а на множество ее допустимых элементов, которое также принадлежит гильбертову пространству, не накладывается условие ограниченности. Получение регуляризованного ПЛ основано на методе двойственной регуляризации и предполагает использование двух параметров регуляризации и двух соответствующих условий согласования одновременно. Один из регуляризирующих параметров «отвечает» за регуляризацию двойственной задачи, другой же содержится в сильно выпуклом регуляризирующем добавке к целевому функционалу исходной задачи. Основное предназначение регуляризованного ПЛ — устойчивое генерирование обобщенных минимизирующих последовательностей, аппроксимирующих точное решение задачи по функции и по ограничениям, для целей ее непосредственного практического устойчивого решения.

    We consider the regularization of the Lagrange principle (LP) in the convex constrained optimization problem with operator constraint-equality in a Hilbert space and with a finite number of functional inequality-constraints. The objective functional of the problem is not, generally speaking, strongly convex. The set of admissible elements of the problem is also embedded into a Hilbert space and is not assumed to be bounded. Obtaining a regularized LP is based on the dual regularization method and involves the use of two regularization parameters and two corresponding matching conditions at the same time. One of the regularization parameters is «responsible» for the regularization of the dual problem, while the other is contained in a strongly convex regularizing addition to the objective functional of the original problem. The main purpose of the regularized LP is the stable generation of generalized minimizing sequences that approximate the exact solution of the problem by function and by constraint, for the purpose of its practical stable solving.

  9. Рассматривается задача оптимизации гарантированного результата для управляемой системы, описываемой обыкновенным дифференциальным уравнением, и функционала качества, непрерывно зависящего от траектории движения системы. Значения управления и помехи ограничены в каждый момент компактными множествами. Предполагается, что помеха порождается некоторой неизвестной заранее функцией типа Каратеодори, то есть функцией непрерывной по пространственной переменной при каждом значении временной переменной и измеримой по временной переменной при каждом значении пространственной. Оптимальное управление ищется в классе стратегий управления с полной памятью о движении системы и о реализовавшемся управлении.

    Показано, что для достаточно широкого семейства управляемых систем оптимальный гарантированный результат в классе стратегий с полной памятью совпадает с оптимальным гарантированным результатом в классе квазистратегий. Для этого семейства управляемых систем построена разрешающая стратегия, допускающая численную реализацию. Приводится иллюстрирующий пример для нелинейной управляемой системы.

    The problem of the optimization of a guaranteed result for the control system, described by an ordinary differential equation, and a continuous payoff functional, is considered. At every moment the values of the control and of the disturbance are in the given compact sets. The actions of the disturbance are assumed to be generated by an unknown function of the Caratheodory type, i.e. by the function continuous with respect to the spatial variable for every value of time variable and measurable with respect to the time variable for every value of spatial one. The actions of control are formed by the strategies with full memory.

    It is demonstrated, that for a class of control systems the optimal guaranteed result in this problem is equal to the value of the lower game, i.e. to the value of the optimal guaranteed result in the class of quasi–strategies. The optimal strategy with full memory, that allows numerical implementation, is provided. An illustrative nonlinear example is given.

  10. Рассматривается задача оптимизации гарантированного результата для управляемой системы, описываемой обыкновенным дифференциальным уравнением, и функционала качества, непрерывно зависящего от траектории системы. Значения управления и помехи ограничены в каждый момент компактными множествами. Предполагается также, что помеха стеснена некоторым неизвестным функциональным ограничением из заданного семейства ограничений.

    Показано, что в данной задаче оптимальный гарантированный результат совпадает со значением нижней (максиминной) игры. Для получения эффективно реализуемых алгоритмов управления указываются дополнительные условия на правую часть рассматриваемой управляемой системы и подходящие способы построения оптимальной стратегии.

    The problem of the optimization of a guaranteed result for the control system, described by an ordinary differential equation, and a continuous payoff functional, is considered. At every moment the values of the control and of the disturbance are in the given compact sets. The disturbances as functions of time are subject to functional constraints belonging to a given family of constraints. The actions of control are formed by the strategies with full memory.

    It is demonstrated, that optimal guaranteed result in this problem is equal to the value of the lower game. For the effectiveness of implemented control algorithm additional conditions on the system and appropriate ways of constructing an optimal strategy are specified.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref