Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'стохастическое оптимальное управление':
Найдено статей: 2
  1. В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению $$dx(t) = b(t,x(t),u(t))dt +\sigma(t,x(t))u(t)dW(t),\qquad x(0) = x_0.$$ Здесь $x(t)$ - фазовая координата, $u(t)$ - управляющая функция, $W(t)$ - винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t)=Φ(t,u(t)W(t)+y(t))$, в котором $Φ(t,v)$ - известная функция, полностью определяющаяся коэффициентом $σ(t,x)$, и не зависит от управления, а $y(t)$ - решение потраекторно-детерминированного дифференциального уравнения с мерой вида

    $$dy(t) = B(t,y(t),u(t))dt - W(t)du(t).$$

    Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.

  2. Для динамической системы, подверженной воздействиям управления и помехи и содержащей последействие в управляющих силах, рассматривается задача об управлении с оптимальным гарантированным результатом для показателя качества, представляющего собой евклидову норму совокупности отклонений движения системы в заданные моменты времени от заданных целей. На основе функциональной трактовки, опирающейся на своеобразный прогноз движений, исходная задача сводится к вспомогательной дифференциальной игре для системы без запаздывания и с терминальной платой. Функция цены этой игры вычисляется на базе конструкции выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза, оптимальные стратегии строятся методом экстремального сдвига на сопутствующие точки. Рассматриваются иллюстрирующие примеры, приводятся результаты численных экспериментов.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref