Все выпуски
- 2025 Том 35
- 2024 Том 34
- 2023 Том 33
- 2022 Том 32
- 2021 Том 31
- 2020 Том 30
- 2019 Том 29
- 2018 Том 28
- 2017 Том 27
- 2016 Том 26
- 2015 Том 25
- 2014
- 2013
- 2012
- 2011
- 2010
- 2009
- 2008
-
В статье исследуются свойства функции цены задачи оптимального управления на бесконечном горизонте с неограниченным подынтегральным индексом, входящим в функционал качества с дисконтирующим множителем. Выводится оценка аппроксимации функции цены в задаче с бесконечным горизонтом значениями функции цены в задачах с удлиняющимся конечным горизонтом. Выявляется структура функции цены через значения стационарной функции цены, зависящей только от фазовой переменной. Дается описание асимптотики роста значений функции цены для функционалов качества различного вида, принятых в экономическом и финансовом моделировании: логарифмических, степенных, экспоненциальных, линейных. Устанавливается свойство непрерывности функции цены и выводятся оценки гёльдеровских параметров непрерывности. Полученные оценки необходимы для разработки сеточных алгоритмов построения функций цены в задачах оптимального управления с бесконечным горизонтом.
-
Обсуждаются вопросы построения допустимых управлений в одной задаче оптимального управления нелинейной динамической системой при наличии ограничений на ее текущее фазовое состояние. Рассматриваемая динамическая система описывает управляемое движение ракеты-носителя от точки старта до момента ее выхода на заданную околоземную эллиптическую орбиту. Задача заключается в построении программного управления, которое обеспечивает выведение ракетой-носителем на орбиту полезной нагрузки максимальной массы и выполнение дополнительных ограничений на текущее фазовое состояние системы. Дополнительные ограничения обусловлены необходимостью учитывать величины скоростного напора, углов атаки и скольжения при движении ракеты в плотных слоях атмосферы и осуществлять падение ее отделяемых частей в заданные районы на земной поверхности. Для ракет-носителей ряда классов такая задача равносильна нелинейной задаче быстродействия с фазовыми ограничениями. Предлагаются и численно исследуются два алгоритма построения в этой задаче допустимых управлений, обеспечивающих выполнение указанных дополнительных фазовых ограничений. Методологическую основу одного алгоритма составляет применение некоторого прогнозирующего управления, которое априори строится в задаче быстродействия без учета в ней дополнительных ограничений, а другого - использование специальных режимов управления. Приводятся результаты численного моделирования.
-
Об обобщенной краевой задаче для управляемой системы с обратной связью и бесконечным запаздыванием, с. 167-185Рассматривается нелокальная граничная задача для управляемой системы с обратной связью, описываемой полулинейным функционально-дифференциальным включением дробного порядка с бесконечным запаздыванием в сепарабельном банаховом пространстве. Приводится общий принцип существования решений задачи в терминах отличия от нуля топологической степени соответствующего векторного поля. Доказывается конкретный пример (теорема 6) реализации этого общего принципа. Доказывается существование оптимального решения поставленной задачи, минимизирующего заданный полунепрерывный снизу функционал качества.
-
Дифференциальные включения типа среднего поля возникают в рамках теории управления средним полем при овыпуклении правой части. Мы исследуем случай, когда правая часть дифференциального включения зависит от положения агента и от распределения всех агентов полунепрерывно. Основной результат статьи состоит в доказательстве существования и стабильности решений дифференциальных включений типа среднего поля. Также мы показываем полунепрерывную снизу зависимость функции цены задачи оптимального управления средним полем от начального состояния и параметра.
-
О единственности решения задачи мультипликативного управления для модели дрейфа–диффузии электронов, с. 3-18Исследуется задача мультипликативного управления для стационарной диффузионно-дрейфовой модели зарядки полярного диэлектрика. Роль управления играет старший коэффициент в уравнении модели, имеющий смысл коэффициента диффузии электронов. Глобальная разрешимость краевой задачи и локальная единственность ее решения, а также разрешимость экстремальной задачи доказана в предыдущих работах авторов. В настоящей работе для задачи управления выводится система оптимальности и устанавливаются условия локальной регулярности множителя Лагранжа. На основе анализа данной системы доказывается локальная единственность решения задачи мультипликативного управления для конкретных функционалов качества.
-
В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению $$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t),\qquad x(0) = x_0.$$ Здесь $x(t)$ - фазовая координата, $u(t)$ - управляющая функция, $W(t)$ - винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t)=Φ(t,u(t)W(t)+y(t))$, в котором $Φ(t,v)$ - известная функция, полностью определяющаяся коэффициентом $σ(t,x)$, и не зависит от управления, а $y(t)$ - решение потраекторно-детерминированного дифференциального уравнения с мерой вида
$$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$
Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.
-
Рассматривается выпуклая задача оптимального управления для параболического уравнения со строго равномерно выпуклым целевым функционалом, с граничным управлением и с распределенными поточечными фазовыми ограничениями типа равенства и неравенства. Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с $s$-й степенью функций при $s\in(1,2)$. В свою очередь, граничное управление принадлежит лебегову пространству с показателем суммируемости $r\in (2,+\infty)$. Основными результатами работы в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями являются регуляризованные, или, другими словами, устойчивые к ошибкам исходных данных, секвенциальные принцип Лагранжа в недифференциальной форме и поточечный принцип максимума Понтрягина.
-
Позиционные стратегии в задачах управления средним полем на пространстве конечного числа состояний, с. 15-21Рассматривается задача оптимального управления системой бесконечного числа однотипных агентов. Пространство допустимых для агентов состояний является конечным. В рассматриваемой постановке имеется общий для всех агентов оптимизируемый функционал и общий центр управления, выбирающий стратегию для агентов. Предполагается, что выбираемая стратегия является позиционной. В настоящей работе рассматривается случай, когда динамика состояний агентов задается некоторой марковской цепью с непрерывным временем. Предполагается, что матрица Колмогорова этой цепи в каждом состоянии зависит от текущего состояния, выбранного управления и распределения всех агентов. Для такой задачи в работе показано, что решение в классе позиционных стратегий может быть построено на основе решения детерминированной задачи оптимального управления в конечномерном фазовом пространстве.
-
В конечномерном нормированном пространстве рассматривается дискретная игровая задача фиксированной продолжительности. Терминальное множество определяется условием принадлежности нормы фазового вектора отрезку с положительными концами. Множество, определяемое данным условием, названо в работе кольцом. Цель первого игрока заключается в том, чтобы в заданный момент времени привести фазовый вектор на терминальное множество. Цель второго игрока противоположна. В данной работе построены оптимальные управления игроков. Проведено компьютерное моделирование игрового процесса. Рассмотрена модификация исходной задачи, в которой у первого игрока в неизвестный момент времени происходит изменение в динамике.
-
Неупреждающие стратегии в задачах оптимизации гарантии при функциональных ограничениях на помехи, с. 553-571Для динамической системы, управляемой в условиях помех, рассматривается задача оптимизации гарантированного результата. Особенностью задачи является наличие функциональных ограничений на помехи, при которых свойство замкнутости множества допустимых помех относительно операции «склейки» двух его элементов, вообще говоря, отсутствует. Это обстоятельство препятствует непосредственному применению методов теории дифференциальных игр для исследования задачи и тем самым приводит к необходимости их походящей модификации. В работе предложено новое понятие неупреждающей стратегии управления (квазистратегии). Доказано, что соответствующий функционал оптимального гарантированного результата удовлетворяет принципу динамического программирования. Как следствие, установлены так называемые свойства $u$- и $v$-стабильности этого функционала, которые в дальнейшем позволят построить конструктивное решение задачи в позиционных стратегиях.
Журнал индексируется в Web of Science (Emerging Sources Citation Index)
Журнал входит в базы данных zbMATH, MathSciNet
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в перечень ВАК.
Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.