Дифференциальные Игры

Раздел математич. теории управления (см. Автоматического управления теория), в к-ром изучается управление в конфликтных ситуациях. Теория Д. и. примыкает также к общей игр теории. Первые работы по теории Д. и. появились в сер. 50-х гг. 20 в. Постановка задач теории дифференциальных игр. Различают Д. и. двух игроков и нескольких игроков. Основные результаты получены для задач с двумя игроками. Содержательное описание этих задач укладывается в следующую схему. Имеется динамическая система, в к-рой часть управляющих воздействий подчинена игроку I, а другая часть — игроку II. При постановке задачи, стоящей перед игроком I или II, предполагается, что выбор управлений этого игрока, гарантирующий ему достижение определенной цели при любом неизвестном заранее управлении противника, может опираться лишь на нек-рую информацию о текущих состояниях системы. В теории Д. и. рассматриваются также задачи управления в условиях неопределенности, когда помехи, действующие на систему, трактуются как управления противника. Напр., постановка задачи игрока I описывается следующим образом. Обычно предполагается, что движение управляемой системы задается дифференциальным уравнением где х- фазовый вектор системы, ии v- управляющие векторы игроков I и II соответственно. Определен класс стратегий игрока I, и для каждой стратегии определен пучок движений X(U), к-рый порожден этой стратегией в паре со всевозможными управлениями противника и выходит из начального состояния системы (1). Эти понятия выбираются так, чтобы они соответствовали заданным ограничениям на управления игроков и характеру информации о текущих состояниях системы, предоставленной игроку I. На движениях x(t), t>t0, системы (1) задан функционал (плата игры), значение к-рого игрок I стремится минимизировать (иногда функционал g зависит также от реализаций u(t), v(t), t>t0, управлений игроков). Учитывая самую неблагоприятную реализацию движения выбор к-рой в этой задаче предоставляется противнику, качество стратегий оценивается величиной Задача игрока I состоит в определении стратегии на к-рой достигается минимум функционала х 1 (эта задача наз. задачей степени). Иногда рассматривается так наз. задача качества, в к-рой требуется определить условия существования стратегии удовлетворяющей неравенству где с- нек-рое заданное число. Аналогичным образом формулируются задачи игрока II, к-рый максимизирует плату игры. Стратегии игрока II оцениваются величиной Задача степени здесь состоит в выборе стратегии максимизирующей значение функционала x2, а задача качества — в определении условий, при к-рых для нек-рой стратегии Если в задачах игроков I и II классы стратегий и таковы, что для всякой пары можно определить хотя бы одно движение порожденное этой парой, то говорят, что эти две задачи составляют дифференциальную игру, определенную на классе стратегий Если в Д. и. выполняется равенство то величина с 0 наз. ценой дифференциальной игры. Типичным примером Д. и. является игра преследования — уклонения. В этой игре х= ( х 1, . . ., xk+l) =(y1, ..., у k,z1, . . ., zl), где уи z — фазовые векторы преследователя и преследуемого соответственно, движение к-рых описывается уравнениями Наиболее часто рассматривается случай, когда выбор управлений стеснен ограничениями вида (2) где Р и Q- некоторые компакты. Платой в этой игре является время до встречи, т. е. где т и т — векторы, составленные из первых ткомпонент векторов y и z. Таким образом, сближение точек m и m нa заданное расстояние е трактуется как встреча объектов. В случае, когда игроки располагают информацией о текущей позиции игры (t, x(t)), т. е. в позиционной игре преследования-уклонения, существует цена игры. Формализации дифференциальных игр. Для математич. формализации Д. и. необходимы строгие определения перечисленных выше понятий. Основное внимание в теории Д. и. было уделено задачам, в к-рых игрокам известна позиция игры, а управления удовлетворяют ограничениям (2). В этом случае естественно было определить стратегии игроков как функции u=u(t, x), v=v(t, х )со значениями в компактах Ри Qсоответственно. Оказалось, однако, что при таком подходе нередки случаи, когда приходится рассматривать разрывные стратегии, а порожденные ими движения нельзя определить известными в теории дифференциальных уравнений понятиями. Трудности, возникшие сначала на этом пути, привели к созданию иных постановок Д. и. Ниже рассмотрены такие формализации, где не используются позиционные стратегии. Затем дана формализация позиционных Д. и., к-рая охватывает разрывные позиционные стратегии и базируется на специальном определении движений. Среди сложившихся направлений в теории Д. и. прежде всего следует отметить цикл исследований (см., напр., [2] — [4]), восходящих к работе У. Флеминга [1]. Здесь рассматривается аппроксимация Д. и. многошаговыми играми, где игроки последовательно (по шагам) выбирают свои управления на заданных промежутках времени [ti, ti+1), i=0, 1, . .., N. Причем обычно выделяется игрок, выбирающий каждый раз свое управление первым и сообщающий этот выбор противнику. В зависимости от того, минимизирует или максимизирует этот игрок плату игры, различают мажорантную и минорантную многошаговые игры. Применение этого подхода сводится к доказательству теорем существования цены Д. и., определенной здесь как общее значение, к к-рому сходятся цены мажорантной и минорантной игр при измельчении разбиений [ti, ti+1), i=0, 1, .. ., N (увеличении числа шагов). Однако построение позиционных стратегии, не зависящих от дискретизации времени, при таком подходе, как правило, не рассматривается. Л. С. Понтрягин предложил постановку игровых задач управления (см., напр., [5] — [8]), где допускается информационная дискриминация противника, т.

Источник: Математическая энциклопедия на Gufo.me

Дифференциальные Игры

Значения в других словарях