Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
Для произвольной игровой задачи наведения на множество предложен метод преобразования к задаче наведения «в момент».
The method of transformation of the guidance problem for the conict-controlled system into the problem of guidance "into the moment" is suggested. The transformation is realized by changing the dynamic function.
-
Работа посвящена исследованию равновесия по Нэшу в неантагонистической детерминированной дифференциальной игре двух лиц в классе рандомизированных стратегий. Предполагается, что игроки информированы об управлении своего партнера, реализовавшегося к текущему времени. Поэтому игра формализуется в классе рандомизированных квазистратегий. В работе получена характеризация множества выигрышей (пар ожидаемых выигрышей игроков) в ситуациях равновесия по Нэшу с использованием вспомогательных антагонистических игр. Показано, что множество выигрышей в ситуациях рандомизированного равновесия по Нэшу является выпуклой оболочкой множества выигрышей в классе детерминированных стратегий. Приведен пример, показывающий дополнительные возможности, которые возникают при переходе к рандомизированным стратегиям.
Randomized Nash equilibrium for differential games, pp. 299-308The paper is concerned with the randomized Nash equilibrium for a nonzero-sum deterministic differential game of two players. We assume that each player is informed about the control of the partner realized up to the current moment. Therefore, the game is formalized in the class of randomized non-anticipative strategies. The main result of the paper is the characterization of a set of Nash values considered as pairs of expected players' outcomes. The characterization involves the value functions of the auxiliary zero-sum games. As a corollary we get that the set of Nash values in the case when the players use randomized strategies is a convex hull of the set of Nash values in the class of deterministic strategies. Additionally, we present an example showing that the randomized strategies can enhance the outcome of the players.
-
Рассматривается задача простого группового преследования группы из m убегающих (m ≥ 1) с равными возможностями. Говорят, что в задаче преследования одного убегающего (m = 1) происходит многократная поимка, если заданное количество преследователей ловят его, при этом моменты поимки могут не совпадать. В задаче об одновременной поимке одного убегающего требуется, чтобы моменты поимки совпадали. В работе введено понятие одновременной многократной поимки группы убегающих (m ≥ 2). Одновременная многократная поимка всей группы убегающих происходит, если в результате преследования происходит одновременная многократная поимка каждого убегающего, причем в один и тот же момент времени. В терминах начальных позиций участников получены необходимые и достаточные условия одновременной многократной поимки всей группы убегающих.
поимка, многократная поимка, одновременная многократная поимка, преследование, убегание, дифференциальные игры, конфликтно управляемые процессы.The present paper deals with the problem of simple pursuit of group of m evaders (m ≥ 1) with equal opportunities. We say that a multiple capture in the problem of pursuit of one evader (m = 1) holds if the specified number of pursuers catch him, possibly at different times. The problem of the simultaneous capture of one evader requires that capture moments coincide. We introduce the concept of multiple simultaneous capture of the whole group of evaders (m ≥ 2). We say that the simultaneous multiple capture of the whole group of evaders holds if the simultaneous multiple capture of every evader holds in the same time. We obtain necessary and sufficient conditions for simultaneous multiple capture of the whole group of evaders in terms of initial positions of the participants.
-
Рассматривается абстрактная задача управления и ее релаксации, связанные с ослаблением ограничений на выбор управляющих программ. Исследуются соотношения, связывающие множества допустимых элементов исходной задачи и ее расширения. Получены условия, достаточные для устойчивости (с точностью до замыкания) достижимого множества невозмущенной задачи.
The abstract problem of control and its relaxations connected with a weakening of constraints on the choice of programmed strategies are considered. Relations connecting the sets of admissible elements of the initial problem and its extension are investigated. Conditions sufficient for the stability of the initial attainable set (with the exactness until a closure) are obtained.
-
Рассматривается задача преследования группы из m убегающих (m≥1) в конфликтно управляемом процессе с равными возможностями. Говорят, что в задаче преследования одного убегающего (m=1) происходит многократная поимка, если заданное количество преследователей ловят его, при этом моменты поимки могут не совпадать. В задаче об одновременной многократной поимке одного убегающего требуется, чтобы моменты поимки совпадали. Одновременная многократная поимка всей группы убегающих (m≥2) происходит, если в результате преследования происходит одновременная многократная поимка каждого убегающего, причем в один и тот же момент времени. В терминах начальных позиций участников получены необходимые и достаточные условия одновременной многократной поимки всей группы убегающих.
поимка, многократная поимка, одновременная многократная поимка, преследование, убегание, дифференциальные игры, конфликтно управляемые процессыThe present paper deals with the problem of pursuit of the group of m evaders (m≥1) in a conflict-controlled process with equal opportunities. We say that a multiple capture in the problem of pursuit of one evader (m=1) holds if the specified number of pursuers catch him, possibly at different times. The problem of the simultaneous multiple capture of one evader requires that capture moments coincide. We say that the simultaneous multiple capture of the whole group of evaders (m≥2) holds if the simultaneous multiple capture of every evader holds at the same time. We obtain necessary and sufficient conditions for simultaneous multiple capture of the whole group of evaders in terms of initial positions of the participants.
-
Рассматривается структурированная популяция, особи которой разделены на возрастные или типические группы, заданная нормальной автономной системой разностных уравнений. Для данной популяции исследуется задача оптимального сбора возобновляемого ресурса на конечном или бесконечном промежутках времени. Для популяции, эксплуатируемой на конечном промежутке, описана стратегия промысла, при которой достигается наибольшее значение общей стоимости изымаемого ресурса. Если же добыча ресурса происходит на неограниченном промежутке, то определяется средняя временная выгода и вычисляется ее значение при стационарном режиме эксплуатации; рассматриваются случаи, когда система имеет асимптотически устойчивую неподвижную точку или устойчивый цикл. Также описана стратегия промысла, которая является оптимальной среди других способов эксплуатации; показано, что при определенных условиях она является стационарной или отличается от стационарной только значением управления в начальный момент времени. Результаты работы проиллюстрированы на примере двухвозрастной эксплуатируемой популяции, в которой промысловому изъятию подвержены особи или младшей, или обеих возрастных групп.
модель популяции, подверженной промыслу, средняя временная выгода, оптимальная эксплуатация, режимы эксплуатации популяцииWe consider the structured population which individuals are divided into age or typical groups, set by the normal independent system of difference equations. For the given population the problem of optimum harvesting of a renewed resource on finite or infinite time intervals is investigated. For the population maintained on a finite interval, we describe a craft strategy at which the greatest value of a total cost of a withdrawn resource is reached. If resource extraction occurs on an unlimited interval, we define average time profit and calculate its value at a stationary mode of operation; cases when the system has an asymptotically steady motionless point or a steady cycle are considered. A craft strategy which is optimum among other ways of operation is also described; it is shown, that under certain conditions it is stationary or differs from stationary only in value of control during the initial moment of time. The results of work are illustrated by an example of two-age exploited population in which individuals of either younger or both age groups are subject to trade.
-
Рассматривается задача преследования группы жестко скоординированных убегающих в нестационарном конфликтно управляемом процессе с равными возможностями: $$\begin{array}{llllllllcccc} P_i & : & \dot x_i = A(t)x_i + u_i,& u_i \in U(t), & x_i(t_0) = X_i^0, & i = 1,2, \dots, n, \\ E_j & : & \dot y_j = A(t)y_j + v, & v \in U(t) , & y_j(t_0) = Y_j^0 , & j = 1,2, \dots, m. \\ \end{array}$$ Говорят, что в задаче преследования происходит многократная поимка, если заданное количество преследователей ловят убегающих, при этом моменты поимки могут не совпадать: $$x_\alpha (\tau_\alpha) = y_{j_\alpha}(\tau_\alpha), \quad \alpha \in \Lambda, \quad \Lambda \subset \{1,2, \dots, n\}, \quad |\Lambda| = b\quad (n \geqslant b \geqslant 1), \\ j_\alpha \subset \{1,2, \dots, m\}.$$ В задаче о нестрогой одновременной многократной поимке требуется, чтобы моменты поимки совпадали: $$x_\alpha (\tau) = y_{j_\alpha}(\tau), \quad \alpha \in \Lambda.$$ Одновременная многократная поимка происходит, если совпадают наименьшие моменты поимки: $$x_\alpha (\tau) = y_{j_\alpha}(\tau), \quad x_\alpha(s) \ne y_{j_\alpha}(s), \quad s \in [t_0, \tau), \quad \alpha \in \Lambda.$$ В данной работе получены необходимые и достаточные условия многократной и нестрогой одновременной многократной поимок.
поимка, многократная поимка, одновременная многократная поимка, преследование, убегание, дифференциальные игры, конфликтно управляемые процессыThe present paper deals with the problem of pursuit of a group of rigidly coordinated evaders in a nonstationary conflict-controlled process with equal opportunities $$\begin{array}{llllllllcccc} P_i & : & \dot x_i = A(t)x_i + u_i,& u_i \in U(t), & x_i(t_0) = X_i^0, & i = 1,2, \dots, n, \\ E_j & : & \dot y_j = A(t)y_j + v, & v \in U(t) , & y_j(t_0) = Y_j^0 , & j = 1,2, \dots, m. \\ \end{array}$$ We say that a multiple capture in the problem of pursuit holds if the specified number of pursuers catch evaders, possibly at different times $$x_\alpha (\tau_\alpha) = y_{j_\alpha}(\tau_\alpha), \quad \alpha \in \Lambda, \quad \Lambda \subset \{1,2, \dots, n\}, \quad |\Lambda| = b\quad (n \geqslant b \geqslant 1), \\ j_\alpha \subset \{1,2, \dots, m\}.$$ The problem of nonstrict simultaneous multiple capture requires that capture moments coincide $$x_\alpha (\tau) = y_{j_\alpha}(\tau), \quad \alpha \in \Lambda.$$ The problem of a simultaneous multiple capture requires that lowest capture moments coincide $$x_\alpha (\tau) = y_{j_\alpha}(\tau), \quad x_\alpha(s) \ne y_{j_\alpha}(s), \quad s \in [t_0, \tau), \quad \alpha \in \Lambda.$$ In this paper we obtain necessary and sufficient conditions for simultaneous multiple capture and nonstrict simultaneous multiple capture.
-
Об определении равномерной полной управляемости, с. 326-343Рассматривается линейная управляемая система $$\dot x=A(t)x+B(t)u,\quad t\in\mathbb R,\quad x\in\mathbb R^{n},\quad u\in\mathbb R^{m}, \qquad \qquad (1)$$ в предположении непрерывности по $t$ и $s$ матрицы Коши $X(t,s)$ свободной системы $\dot x=A(t)x$. На каждом отрезке $[\tau,\tau+\vartheta]$ фиксированной длины $\vartheta$ задается нормированное пространство $Z_{\tau}$ функций, определенных на этом отрезке. Управление $u$ на отрезке $[\tau,\tau+\vartheta]$ называется допустимым, если $u\in Z_{\tau}$ и существует $\mathcal Q_{\tau}(u):=\int_{\tau}^{\tau+\vartheta}X(\tau,s)B(s)u(s)\,ds$. Векторное подпространство $U_{\tau}$ пространства $Z_{\tau}$, на котором определен оператор $\mathcal Q_{\tau}$, называется пространством допустимых управлений для системы $(1)$ на отрезке $[\tau,\tau+\vartheta]$. Предложено определение равномерной полной управляемости системы $(1)$ для случая произвольной зависимости пространства допустимых управлений от момента начала процесса управления. Получены прямые и двойственные необходимые и достаточные условия равномерной полной управляемости линейной системы в этой ситуации. Показано, что при должном выборе пространства допустимых управлений полученные условия эквивалентны классическим определениям равномерной полной управляемости.
We consider a linear control system $$\dot x = A(t)x + B(t)u,\quad t\in\mathbb{R},\quad x\in\mathbb{R}^{n},\quad u\in\mathbb{R}^{m}, \qquad \qquad(1)$$ under the assumption that the transition matrix $X(t,s)$ of the free system $\dot x = A(t)x$ is continuous with respect to $t$ and $s$ separately. We also suppose that on each interval $[\tau, \tau + \vartheta]$ of fixed length $\vartheta$ the normed space $Z_{\tau} $ of functions defined on this interval is given. A control $u$ on the interval $[\tau, \tau+\vartheta]$ is called admissible if $u\in Z_{\tau}$ and there exists the integral $\mathcal Q_{\tau}(u):=\int_{\tau}^{\tau+\vartheta}X(\tau,s)B(s)u(s)\,ds$. The vector subspace $U_{\tau}$ of the space $Z_{\tau}$ where the operator $\mathcal Q_{\tau}$ is defined is called the space of admissible controls for the system $(1)$ on the interval $[\tau,\tau +\vartheta]$. We propose a definition of uniform complete controllability of the system $(1)$ for the case of an arbitrary dependence of the space of admissible controls on the moment of the beginning of the control process. In this situation direct and dual necessary and sufficient conditions for uniform complete controllability of a linear system are obtained. It is shown that with proper choice of the space of admissible controls, the resulting conditions are equivalent to the classical definitions of uniform complete controllability.
-
О способах эксплуатации популяции, заданной разностным уравнением со случайными параметрами, с. 211-227Рассматривается модель эксплуатируемой однородной популяции, заданная разностным уравнением, зависящим от случайных параметров. При отсутствии эксплуатации развитие популяции описывается уравнением $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ где $X(k)$ — размер популяции или количество биоресурса в момент времени $k,$ $f(x)$ — вещественная дифференцируемая функция, заданная на отрезке $I=[0,a],$ такая, что $f(I)\subseteq I.$ В моменты времени $k=1,2,\ldots$ из популяции извлекается случайная доля ресурса $\omega(k)\in\Omega\subseteq[0,1]$. Процесс сбора может быть остановлен, когда доля собранного ресурса превысит некоторое значение $u(k)\in[0,1)$, чтобы сохранить по возможности большую часть популяции. Тогда доля добываемого ресурса будет равна $\ell(k)=\min (\omega(k),u(k)).$ Средняя временная выгода $H_*$ от извлечения ресурса равна пределу среднего арифметического от количества добываемого ресурса $X(k)\ell(k)$ в моменты времени $1,2,\ldots,k$ при $k\to\infty.$ Решается задача выбора управления процессом промыслового изъятия, при котором значение $H_*$ можно оценить снизу с вероятностью единица по возможности наибольшим числом. Оценки средней временной выгоды существенно зависят от свойств функции $f(x),$ определяющей динамику популяции; данные оценки получены для трех классов уравнений с функциями $f(x),$ обладающими определенными свойствами. Результаты работы проиллюстрированы численными примерами, построенными методом динамического программирования на основании того, что исследуемый процесс эксплуатации популяции является марковским процессом принятия решений.
разностные уравнения, уравнения со случайными параметрами, оптимальная эксплуатация, средняя временная выгодаWe consider a model of an exploited homogeneous population given by a difference equation depending on random parameters. In the absence of exploitation, the development of the population is described by the equation $$X(k+1)=f\bigl(X(k)\bigr), \quad k=1,2,\ldots,$$ where $X(k)$ is the population size or the amount of bioresources at time $k,$ $f(x)$ is a real differentiable function defined on $I=[0,a]$ such that $f(I)\subseteq I.$ At moments $k=1,2,\ldots$, a random fraction of the resource $\omega(k)\in\omega\subseteq[0,1]$ is extracted from the population. The harvesting process can be stopped when the share of the harvested resource exceeds a certain value of $u(k)\in[0,1)$ to keep as much of the population as possible. Then the share of the extracted resource will be equal to $\ell(k)=\min (\omega(k),u(k)).$ The average temporary benefit $H_*$ from the extraction of the resource is equal to the limit of the arithmetic mean from the amount of extracted resource $X(k)\ell(k)$ at moments $1,2,\ldots,k$ when $k\to\infty.$ We solve the problem of choosing the control of the harvesting process, in which the value of $H_*$ can be estimated from below with probability one, as large a number as possible. Estimates of the average time benefit depend on the properties of the function $f(x)$, determining the dynamics of the population; these estimates are obtained for three classes of equations with $f(x)$, having certain properties. The results of the work are illustrated, by numerical examples using dynamic programming based on, that the process of population exploitation is a Markov decision process.
-
Рассматриваются вопросы, связанные с решением аддитивной задачи последовательного обхода множеств с ограничениями предшествования и функциями стоимости, допускающими зависимость от списка заданий. В качестве базового метода используется широко понимаемое динамическое программирование (ДП), дополняемое в случае задач ощутимой размерности декомпозициями семейства заданий и преобразованием параметров исходной задачи. Возможные применения связаны, в частности, с задачей управления инструментом при фигурной листовой резке деталей на машинах с ЧПУ. В этой задаче важным обстоятельством является учет условий предшествования, имеющих, в частности, следующий смысл: в случае детали с отверстиями резка каждого из внутренних контуров (отвечающих отверстиям) должна предшествовать резке внешнего контура. Сам критерий качества в данной задаче, как правило, является аддитивным. Другой тип ограничений касается избежания термических деформаций деталей. При использовании подхода с применением штрафов за нарушение условий, связанных с эффективным отводом тепла при выполнении врезки, возникают функции стоимости, допускающие зависимость от списка заданий, выполненных на текущий момент времени. Заметим, что в другой прикладной задаче, а именно в задаче о демонтаже радиационно опасных объектов, возникают функции стоимости с зависимостью от списка заданий, не выполненных на данный момент (а, следовательно, касающихся недемонтированных объектов). В итоге мы приходим к очень общей задаче с ограничениями предшествования и функциями стоимости с зависимостью от списка заданий. Применяемая в случае ощутимой размерности декомпозиция с последующей реализацией ДП требует, с одной стороны, разработки методов кластеризации, а, с другой, построения адекватной конструкции распределения глобальных условий предшествования по кластерам. В теоретической части работы обсуждается случай двух кластеров, который позволяет охватить единой схемой целый ряд практически интересных задач диапазонного (в смысле размерности) типа. Указан алгоритм построения композиционного решения, включающий этап обучения кластеризации на основе жадного алгоритма. Данный «композиционный» алгоритм реализован на ПЭВМ; проведен вычислительный эксперимент.
Some constructions for solving routing problems using decompositions and transformations of target sets, pp. 518-540Issues related to solving the additive problem of sequential traversal of sets with precedence restrictions and cost functions that allow dependence on the list of tasks are considered. The basic method is a broadly understood dynamic programming (DP), supplemented in the case of problems of appreciable dimension by decompositions of the family of tasks and transformation of the parameters of the original problem. Possible applications are related, in particular, to the problem of tool control in figured sheet cutting of parts on CNC machines. In this problem, an important circumstance is taking into account the precedence conditions, which have, in particular, the following meaning: in the case of a part with holes, cutting of each of the internal contours (corresponding to the holes) should precede cutting of the external contour. The quality criterion itself in this problem, as a rule, is additive. Another type of constraints concerns avoiding thermal deformations of parts. When using the approach with penalties for violating the conditions associated with effective heat dissipation during cutting, cost functions arise that allow dependence on the list of tasks completed to date. Note that in another applied problem, namely, in the problem of dismantling radiation hazardous objects, cost functions arise with dependence on the list of tasks that have not been completed at the moment (and, consequently, concern the objects that have not been dismantled). As a result, we arrive at a very general problem with precedence constraints and cost functions with dependence on the list of tasks. The decomposition applied in the case of a noticeable dimensionality with subsequent implementation of the DP requires, on the one hand, the development of clustering methods, and, on the other, the construction of an adequate structure for distributing global precedence conditions among clusters. In the theoretical part of the work, the case of two clusters is discussed, which makes it possible to cover with a single scheme a number of practically interesting problems of a range (in terms of dimensionality) type. An algorithm for constructing a composite solution is indicated, including a stage of clustering training based on a greedy algorithm. This “composite” algorithm is implemented on a PC; a computational experiment was carried out.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.