Текущий выпуск Выпуск 2, 2025 Том 35

Все выпуски

Результыты поиска по 'set-valued strategies':

Найдено статей: 10

Авербух Ю.В.
Рандомизированное равновесие по Нэшу в дифференциальных играх, с. 299-308

Работа посвящена исследованию равновесия по Нэшу в неантагонистической детерминированной дифференциальной игре двух лиц в классе рандомизированных стратегий. Предполагается, что игроки информированы об управлении своего партнера, реализовавшегося к текущему времени. Поэтому игра формализуется в классе рандомизированных квазистратегий. В работе получена характеризация множества выигрышей (пар ожидаемых выигрышей игроков) в ситуациях равновесия по Нэшу с использованием вспомогательных антагонистических игр. Показано, что множество выигрышей в ситуациях рандомизированного равновесия по Нэшу является выпуклой оболочкой множества выигрышей в классе детерминированных стратегий. Приведен пример, показывающий дополнительные возможности, которые возникают при переходе к рандомизированным стратегиям.

дифференциальные игры, равновесие по Нэшу, рандомизированные стратегии

Averboukh Y.V.
Randomized Nash equilibrium for differential games, pp. 299-308

The paper is concerned with the randomized Nash equilibrium for a nonzero-sum deterministic differential game of two players. We assume that each player is informed about the control of the partner realized up to the current moment. Therefore, the game is formalized in the class of randomized non-anticipative strategies. The main result of the paper is the characterization of a set of Nash values considered as pairs of expected players' outcomes. The characterization involves the value functions of the auxiliary zero-sum games. As a corollary we get that the set of Nash values in the case when the players use randomized strategies is a convex hull of the set of Nash values in the class of deterministic strategies. Additionally, we present an example showing that the randomized strategies can enhance the outcome of the players.

differential games, Nash equilibrium, randomized strategies
Гомоюнов М.И.
К задаче оптимизации гарантии в системе с запаздыванием по управлению, с. 21-36

Для динамической системы, подверженной воздействиям управления и помехи и содержащей последействие в управляющих силах, рассматривается задача об управлении с оптимальным гарантированным результатом для показателя качества, представляющего собой евклидову норму совокупности отклонений движения системы в заданные моменты времени от заданных целей. На основе функциональной трактовки, опирающейся на своеобразный прогноз движений, исходная задача сводится к вспомогательной дифференциальной игре для системы без запаздывания и с терминальной платой. Функция цены этой игры вычисляется на базе конструкции выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза, оптимальные стратегии строятся методом экстремального сдвига на сопутствующие точки. Рассматриваются иллюстрирующие примеры, приводятся результаты численных экспериментов.

оптимальное управление, дифференциальные игры, запаздывание по управлению.

Gomoyunov M.I.
On the problem of optimizing the guarantee in a system with delay in control, pp. 21-36

For a dynamical system under control and disturbances, and with delay in control, the problem of control with the optimal guaranteed result is considered for a quality index which is the Euclidean norm of the set of deviations of a system motion at the given instants from the given targets. On the basis of a functional treatment basing on a proper prediction of the motion the problem is reduced to an auxiliary differential game for a system without delay and with a terminal quality index. The value of this game is calculated from the construction of upper convex hulls of auxiliary functions from the method of stochastic program synthesis, optimal strategies are formed by the method of an extremal shift to the corresponding points. Illustrating examples and results of numerical experiments are presented.

optimal control, differential games, delay in control.
Егорова А.В., Родина Л.И.
Об оптимальной добыче возобновляемого ресурса из структурированной популяции, с. 501-517

Рассматривается структурированная популяция, особи которой разделены на возрастные или типические группы, заданная нормальной автономной системой разностных уравнений. Для данной популяции исследуется задача оптимального сбора возобновляемого ресурса на конечном или бесконечном промежутках времени. Для популяции, эксплуатируемой на конечном промежутке, описана стратегия промысла, при которой достигается наибольшее значение общей стоимости изымаемого ресурса. Если же добыча ресурса происходит на неограниченном промежутке, то определяется средняя временная выгода и вычисляется ее значение при стационарном режиме эксплуатации; рассматриваются случаи, когда система имеет асимптотически устойчивую неподвижную точку или устойчивый цикл. Также описана стратегия промысла, которая является оптимальной среди других способов эксплуатации; показано, что при определенных условиях она является стационарной или отличается от стационарной только значением управления в начальный момент времени. Результаты работы проиллюстрированы на примере двухвозрастной эксплуатируемой популяции, в которой промысловому изъятию подвержены особи или младшей, или обеих возрастных групп.

модель популяции, подверженной промыслу, средняя временная выгода, оптимальная эксплуатация, режимы эксплуатации популяции

Egorova A.V., Rodina L.I.
On optimal harvesting of renewable resource from the structured population, pp. 501-517

We consider the structured population which individuals are divided into age or typical groups, set by the normal independent system of difference equations. For the given population the problem of optimum harvesting of a renewed resource on finite or infinite time intervals is investigated. For the population maintained on a finite interval, we describe a craft strategy at which the greatest value of a total cost of a withdrawn resource is reached. If resource extraction occurs on an unlimited interval, we define average time profit and calculate its value at a stationary mode of operation; cases when the system has an asymptotically steady motionless point or a steady cycle are considered. A craft strategy which is optimum among other ways of operation is also described; it is shown, that under certain conditions it is stationary or differs from stationary only in value of control during the initial moment of time. The results of work are illustrated by an example of two-age exploited population in which individuals of either younger or both age groups are subject to trade.

model of the population subject to harvesting, average time profit, optimal exploitation, modes of exploitation of the population
Корнев Д.В., Лукоянов Н.Ю.
О численном решении дифференциальных игр с нетерминальной платой в классах смешанных стратегий, с. 34-48

Рассматривается антагонистическая линейно-выпуклая дифференциальная игра с показателем качества, оценивающим совокупность отклонений траектории движения в наперед заданные моменты времени от заданных целевых точек. Исследуется случай, когда не выполняется условие седловой точки в маленькой игре, также известное как условие Айзекса. Игра формализуется в классах смешанных стратегий управления игроков. Описывается численный метод для приближенного вычисления цены игры и построения оптимальных стратегий. Метод основывается на попятном построении выпуклых сверху оболочек вспомогательных программных функций. Приводятся результаты численных экспериментов на модельных примерах.

дифференциальные игры, цена игры, седловая точка, смешанные стратегии

Kornev D.V., Lukoyanov N.Yu.
On numerical solution of differential games with nonterminal payoff in classes of mixed strategies, pp. 34-48

A zero-sum linear-convex differential game with a quality index that estimates a set of deviations of a motion trajectory at given instants of time from given target points is considered. A case when the saddle point condition in a small game, also known as Isaac's condition, does not hold, is studied. The game is formalized in classes of mixed control strategies of players. A numerical method for approximate computation of the game value and optimal strategies is elaborated. The method is based on the recurrent construction of upper convex hulls of auxiliary program functions. The results of numerical experiments in model examples are given.

differential games, game value, saddle point, mixed strategies
Петров Н.Н., Щелчков К.А.
О взаимосвязи двух линейных стационарных задач уклонения со многими убегающими, с. 52-58

Рассматривается линейная стационарная задача преследования с участием группы преследователей и группы убегающих при условиях, что матрица системы является скалярной, среди преследователей имеются как участники, у которых множество допустимых управлений совпадает с множеством допустимых управлений убегающих, так и участники с меньшими возможностями. Множеством значений допустимых управлений убегающих является шар с центром в нуле. Цель группы преследователей состоит в том, чтобы «переловить» всех убегающих. Цель группы убегающих - помешать этому, то есть предоставить возможность по крайней мере одному из убегающих уклониться от встречи. Преследователи и убегающие используют кусочно-программные стратегии. Показано, что если в игре, в которой все участники обладают равными возможностями, происходит уклонение от встречи хотя бы одного убегающего на бесконечном промежутке времени, то добавление любого числа преследователей с меньшими возможностями приводит к тому, что хотя бы один из убегающих уклонится от встречи на любом конечном промежутке времени.

дифференциальная игра, групповое преследование, преследователь, убегающий, цена игры

Petrov N.N., Shchelchkov K.A.
On the interrelation of two linear stationary evasion problems with many evaders, pp. 52-58

A linear stationary pursuit problem with a group of pursuers and a group of evaders is considered under the following conditions: the matrix of the system is a scalar matrix, among the pursuers there are participants whose set of admissible controls coincides with the set of admissible controls of evaders, and there are participants with fewer opportunities. The set of values of admissible controls of evaders is a ball with center at the origin. The pursuers' goal is to capture all evaders. The evaders' goal is to prevent this, i.e. to provide an opportunity for at least one of them to escape meeting. Pursuers and evaders use piecewise-program strategies. It is shown that if all participants of the game have equal opportunities and at least one of the evaders avoids meeting on the infinite time interval, then the addition of any number of pursuers with fewer opportunities leads to evasion of at least one evader on any finite time interval.

differential game, group pursuit, pursuer, evader, the price of game
Гомоюнов М.И., Серков Д.А.
Об оптимизации гарантии в задаче управления с конечным множеством помех, с. 613-628

В статье изучается задача управления в условиях помех, которая формулируется как задача оптимизации гарантированного результата. В отличие от классической постановки таких задач предполагается, что множество допустимых помех конечно и состоит из кусочно-непрерывных функций. С учетом этого дополнительного функционального ограничения на помеху определяется подходящий класс неупреждающих стратегий (квазистратегий) управления и рассматривается соответствующая величина оптимального гарантированного результата. При некотором техническом предположении о свойстве различимости допустимых помех доказывается, что этот результат может быть достигнут путем использования стратегий управления с полной памятью. Как следствие, устанавливается неулучшаемость класса стратегий с полной памятью. Ключевым элементом доказательства является процедура распознавания действующих в системе помех, которая позволяет всякой неупреждающей стратегии поставить в соответствие близкую по гарантированному результату стратегию с полной памятью. В заключение статьи приводится иллюстрирующий пример.

управление в условиях помех, оптимальная гарантия, неупреждающая стратегия, стратегия с полной памятью, распознавание помех, неулучшаемость

Gomoyunov M.I., Serkov D.A.
On guarantee optimization in control problem with finite set of disturbances, pp. 613-628

In this paper, we deal with a control problem under conditions of disturbances, which is stated as a problem of optimization of the guaranteed result. Compared to the classical formulation of such problems, we assume that the set of admissible disturbances is finite and consists of piecewise continuous functions. In connection with this additional functional constraint on the disturbance, we introduce an appropriate class of non-anticipative control strategies and consider the corresponding value of the optimal guaranteed result. Under a technical assumption concerning a property of distinguishability of the admissible disturbances, we prove that this result can be achieved by using control strategies with full memory. As a consequence, we establish unimprovability of the class of full-memory strategies. A key element of the proof is a procedure of recovering the disturbance acting in the system, which allows us to associate every non-anticipative strategy with a full-memory strategy providing a close guaranteed result. The paper concludes with an illustrative example.

control problem under disturbances, optimal guaranteed result, non-anticipative strategy, full-memory strategy, recovery of disturbances, unimprovability
Серков Д.А.
Оптимальная гарантия при помехах, порождаемых функциями Каратеодори, с. 74-83

Рассматривается задача оптимизации гарантированного результата для управляемой системы, описываемой обыкновенным дифференциальным уравнением, и функционала качества, непрерывно зависящего от траектории движения системы. Значения управления и помехи ограничены в каждый момент компактными множествами. Предполагается, что помеха порождается некоторой неизвестной заранее функцией типа Каратеодори, то есть функцией непрерывной по пространственной переменной при каждом значении временной переменной и измеримой по временной переменной при каждом значении пространственной. Оптимальное управление ищется в классе стратегий управления с полной памятью о движении системы и о реализовавшемся управлении.

Показано, что для достаточно широкого семейства управляемых систем оптимальный гарантированный результат в классе стратегий с полной памятью совпадает с оптимальным гарантированным результатом в классе квазистратегий. Для этого семейства управляемых систем построена разрешающая стратегия, допускающая численную реализацию. Приводится иллюстрирующий пример для нелинейной управляемой системы.

гарантированное управление, каратеодориевские помехи, стратегии с полной памятью, нижняя игра.

Serkov D.A.
Optimal guarantee under the disturbances of Caratheodory type, pp. 74-83

The problem of the optimization of a guaranteed result for the control system, described by an ordinary differential equation, and a continuous payoff functional, is considered. At every moment the values of the control and of the disturbance are in the given compact sets. The actions of the disturbance are assumed to be generated by an unknown function of the Caratheodory type, i.e. by the function continuous with respect to the spatial variable for every value of time variable and measurable with respect to the time variable for every value of spatial one. The actions of control are formed by the strategies with full memory.

It is demonstrated, that for a class of control systems the optimal guaranteed result in this problem is equal to the value of the lower game, i.e. to the value of the optimal guaranteed result in the class of quasi–strategies. The optimal strategy with full memory, that allows numerical implementation, is provided. An illustrative nonlinear example is given.

optimal guarantee, disturbance of Caratheodory type, strategy with full memory, lower game.
Серков Д.А.
Оптимальное управление при компактных в L_p ограничениях на помеху, с. 79-87

Рассматривается задача оптимизации гарантированного результата для управляемой системы, описываемой обыкновенным дифференциальным уравнением, и функционала качества, непрерывно зависящего от траектории системы. Значения управления и помехи ограничены в каждый момент компактными множествами. Предполагается также, что помеха стеснена некоторым неизвестным функциональным ограничением из заданного семейства ограничений.

Показано, что в данной задаче оптимальный гарантированный результат совпадает со значением нижней (максиминной) игры. Для получения эффективно реализуемых алгоритмов управления указываются дополнительные условия на правую часть рассматриваемой управляемой системы и подходящие способы построения оптимальной стратегии.

гарантированное управление, стратегии с полной памятью, нижняя игра

Serkov D.A.
Optimal control under L_p-compact constraints on the disturbance, pp. 79-87

The problem of the optimization of a guaranteed result for the control system, described by an ordinary differential equation, and a continuous payoff functional, is considered. At every moment the values of the control and of the disturbance are in the given compact sets. The disturbances as functions of time are subject to functional constraints belonging to a given family of constraints. The actions of control are formed by the strategies with full memory.

It is demonstrated, that optimal guaranteed result in this problem is equal to the value of the lower game. For the effectiveness of implemented control algorithm additional conditions on the system and appropriate ways of constructing an optimal strategy are specified.

optimal guarantee, strategy with full memory, lower game
Серков Д.А.
О построении частично неупреждающего мультиселектора и его использовании в задачах динамической оптимизации, с. 410-434

В контексте задач гарантированного управления рассматриваются следующие вопросы: связь возможности пошагового (на заданном разбиении $\Delta$) вычисления селектора мультифункции (м/ф) $\alpha$ для неизвестного, восстанавливаемого по шагам $\Delta$, аргумента с существованием у $\alpha$ мультиселектора (м/с) со специальным свойством (названым здесь $\Delta$-неупреждаемостью или частичной неупреждаемостью); второй вопрос — способы построение такого м/с для произвольной пары $(\alpha, \Delta)$; и последний — поиск эффективно проверяемых условий, обеспечивающих совпадение $\Delta$-неупреждающего м/с с неупреждающим.

Мотивом к рассмотрению этих вопросов послужила схема управления, возникающая, например, в методе альтернированного интеграла, при использовании в управлении контрстратегий, или в некоторых задачах при использовании метода управления с поводырём.

В работе показано, что рассматриваемая пошаговая схема управления реализуема тогда и только тогда, когда м/ф $\alpha$ имеет $\Delta$-неупреждающий и непустозначный м/с. Дана конечношаговая процедура построения такого м/с. Указаны эффективно проверяемые условия, обеспечивающие неупреждаемость частично неупреждающего м/с. Рассмотрены иллюстрирующие примеры.

неупреждающие мультиселекторы, многозначные стратегии, оптимизация гарантированного результата

Serkov D.A.
On the construction of partially non-anticipative multiselector and its application to dynamic optimization problems, pp. 410-434

Let sets of functions $Z$ and $\Omega$ on the time interval $T$ be given, let there also be a multifunction (m/f) $\alpha$ acting from $\Omega$ to $Z$ and a finite set $\Delta$ of moments from $T$. The work deals with the following questions: the first one is the connection between the possibility of stepwise construction (specified by $\Delta$) of a selector $z$ of $\alpha(\omega)$ for an unknown step-by-step implemented argument $\omega\in\Omega$ and the existence of a multiselector (m/s) $\beta$ of the m/f $\alpha$ with a non-anticipatory property of special kind (we call it partially or $\Delta$-non-anticipated); the second question is when and how non-anticipated m/s could be expressed by means of partially non-anticipated one; and the last question is how to build the above $\Delta$-non-anticipated m/s $\beta$ for a given pair $(\alpha,\Delta)$.

The consideration of these questions is motivated by the presence of such step-by-step procedures in the differential game theory, for example, in the alternating integral method, in pursuit-evasion problems posed with use of counter-strategies, and in the method of guide control.

It is shown that the step-by-step construction of the value $z\in\alpha(\omega)$ can be carried out for any steps-implemented argument $\omega$ if and only if the above m/s $\beta$ is non-empty-valued. The key point of the work is the description of finite-step procedure for calculation of this $\Delta$-non-anticipated m/s $\beta$. Conditions are given that guarantee the m/s $\beta$ be a non-anticipative one. Illustrative examples are considered that include, in particular, control problems with disturbance.

non-anticipative multi-selectors, set-valued strategies, optimization of guarantee
Ухоботов В.И., Михайлова Е.С.
О сравнении нечетких чисел в задачах принятия решений, с. 87-94

В задачах принятия решений, когда лицо, принимающее решение, получает информацию о возможном выигрыше в результате выбора стратегии в виде нечеткого числа, возникает проблема сравнения нечетких чисел. При выборе того или иного метода сравнения нечетких чисел нужно исходить из специфики задачи. Предлагаемый в статье подход сравнения нечетких чисел основан на сравнении множеств уровня. Эти множества уровня являются отрезками. При сравнении отрезков, в которых может находиться величина выигрыша лица, принимающего решение, берется один из критериев, применяемых в задачах принятия решения при наличии неопределенности (критерии Вальда, Сэвиджа, Гурвица и другие). Результаты сравнения по множествам уровня усредняются. Нечеткие числа сравниваются с помощью этих средних значений. Дана геометрическая интерпретация полученного результата, которая сводит сравнение нечетких чисел к сравнению величин площадей соответствующих фигур, образованных графиками функций принадлежности нечетких чисел. В качестве примера рассмотрены нечеткие числа с колоколообразными и трапецеидальными функциями принадлежности.

нечеткое число, функция принадлежности, множества уровня

Ukhobotov V.I., Mihailova E.S.
Comparison of fuzzy numbers in decision-making problems, pp. 87-94

The paper deals with decision-making problems, when a decision maker receives information about possible pay-off as a result of a strategy selection. This information can be given as a fuzzy number and the problem of its comparison appears. A specific character of the problem is a main factor to choose the method of the fuzzy numbers comparison. In this paper an approach of comparing fuzzy numbers has been proposed, it’s based on the comparison of $\alpha$-cuts. These $\alpha$-cuts are segments. During the comparison of the segments, each segment can contain a merit value; one of the decision-making criteria is chosen (Wald's maximin model, Regret theory models, Routh-Hurwitz stability criterion etc.). The results of the comparison are averaged out. Fuzzy numbers are compared according to these mean values. According to geometrical interpretation which has been given, the comparison of fuzzy numbers is equivalent to the comparison of figures' areas. These areas are formed by graphics of membership functions of the fuzzy numbers. As an example trapezoidal and bell-shaped fuzzy numbers are examined.

fuzzy number, membership function, level set

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал входит в систему Российского индекса научного цитирования.

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в