基本介紹
追逃對(duì)策(pursuit-evasion game)是雙方對(duì)追及與否的對(duì)策,一類典型的定性微分對(duì)策。參與對(duì)策的追、逃兩方,分別記為P和E,P方欲迫近E,E方相反,欲遠(yuǎn)離P,若P方接近到E方的一定范圍,并用ψ(x)≤0(目標(biāo)集)表示,則稱“追及”或“捕獲”,這時(shí)對(duì)策結(jié)束1。
目標(biāo)集(termination set)是一種集合,是定性微分對(duì)策結(jié)束時(shí)所要求實(shí)現(xiàn)的集合。在定性微分對(duì)策中,對(duì)策結(jié)束時(shí)所要求實(shí)現(xiàn)的條件界定的集合,如用導(dǎo)彈攔截飛機(jī),要求在攔截過程結(jié)束時(shí),飛機(jī)處于導(dǎo)彈爆炸時(shí)能擊毀飛機(jī)的有效范圍內(nèi),亦即導(dǎo)彈與飛機(jī)間的距離不超過某一給定值。一般地,目標(biāo)集可寫成ψ(x)≤0。
詳細(xì)介紹追蹤對(duì)策現(xiàn)象在軍事上是經(jīng)常出現(xiàn)的,例如,殲擊機(jī)與轟炸機(jī)的戰(zhàn)斗: 敵方的轟炸機(jī)要轟炸我方的目標(biāo),我方的殲擊機(jī)為保衛(wèi)這些目標(biāo),必須在轟炸機(jī)進(jìn)人目標(biāo)的轟炸有效范圍之前打掉它或至少趕走它。此時(shí),對(duì)策是由雙方駕駛員進(jìn)行的。也有不是人直接指揮的追蹤對(duì)策,例如,反導(dǎo)彈跟蹤彈道導(dǎo)彈就是靠導(dǎo)彈內(nèi)部的自動(dòng)控制裝置指揮的。在追蹤對(duì)策中追逃雙方是在空間或地面運(yùn)動(dòng)的。這里逃的一方有時(shí)不是單純逃,而是企圖在被追到以前達(dá)到某種目的(例如達(dá)到有效轟炸的目的)。而追的一方就要在逃方達(dá)到那么,對(duì)于追蹤問題我們應(yīng)該怎樣來研究呢? 微分對(duì)策提供了一種思路。讓我們來看一個(gè)有趣的例子。
設(shè)想有一只老鼠在圓湖邊碰上了貓,它想回洞已來不及,只好跳人湖中企圖逃走。但貓?jiān)诎渡吓艿乃俣缺仁笤诤杏蔚乃俣瓤斓枚?例如是鼠速的4 倍。粗看起來,老鼠沒有好辦法,只有束手就擒。但是,仔細(xì)研究一下,老鼠還是可以跑掉的。我們將老鼠所跑路線的奧妙介紹如下。
圖1中大圓表示圓湖,其半徑設(shè)為R,取,為半徑作一同心小圓K (我們將看到這是很有意思的區(qū)域),于是老鼠跳人湖中后,先游到小圓K內(nèi),然后轉(zhuǎn)圈游,貓?jiān)诎渡习磮D中的路線跟著老鼠;但用同樣的時(shí)間,老鼠在圓K內(nèi)轉(zhuǎn)圈所轉(zhuǎn)過的角度比貓沿湖岸轉(zhuǎn)圈轉(zhuǎn)過的角度要大。所以老鼠可以游到和貓不在同一半徑,而在同一直徑的圓K的邊界點(diǎn)*的位置上去,然后沿此直徑游向湖岸。因?yàn)?點(diǎn)到湖岸的最短距離是
設(shè)鼠的速度為v,則鼠由*點(diǎn)到湖岸所需的時(shí)間是
由于貓的位置同*點(diǎn)不在同一半徑上,所以貓到達(dá)同一地點(diǎn)的路程正好是半圓周,即
。那么,貓的速度雖是鼠的4 倍(即4v),但貓所需時(shí)間是
,而
,所以鼠先上岸,且有時(shí)間迅速跑入附近的鼠洞而溜掉。因此鼠確實(shí)有逃掉的辦法,此也即為鼠的最優(yōu)策略。所以發(fā)現(xiàn)這個(gè)有意思的小圓很重要。自然會(huì)問,對(duì)于一般追蹤問題,存不存在這樣或那樣的有意思的區(qū)域呢? 同樣會(huì)問,各種初始情況下,追逃雙方的最優(yōu)策略是什么? 微分對(duì)策的理論,就是提供一些思路來幫助人們找到這些問題的答案2。
根本要素追蹤問題也存在對(duì)策現(xiàn)象所共有的根本要素:
局中人此時(shí)局中人就是追者與逃者,例如在空戰(zhàn)中是一方的殲擊機(jī)和另一方的轟炸機(jī),在空防中是攻方的轟炸機(jī)和守方的高射炮,在導(dǎo)彈戰(zhàn)中是一方的導(dǎo)彈和另一方的反導(dǎo)彈等等。
策略追逃雙方都有自己的可選擇的行動(dòng)方案,例如轟炸機(jī)可選擇飛行路線和投彈方式等,殲擊機(jī)可選擇迎擊時(shí)間,飛行路線和攻擊方式等,高射炮可選擇發(fā)射角度等等。不過在追蹤問題中局中人的完整的行動(dòng)方案(即所謂策略)比矩陣對(duì)策中的完整的行動(dòng)方案要復(fù)雜得多了。因?yàn)樵谧粉檰栴}中,局中人例如殲擊機(jī)必須每時(shí)每刻都掌握雙方的相對(duì)位置和某些情況以便跟蹤追擊。同樣轟炸機(jī)也得每時(shí)每刻都能掌握雙方的相對(duì)位置和某些情況以便躲過攻擊,飛達(dá)轟炸目標(biāo)。所以用數(shù)學(xué)描述追蹤對(duì)策中的策略,也必須要反映出這種連續(xù)動(dòng)態(tài)的決策過程。這就得借助微分方程的理論,因此這類對(duì)策理論稱為微分對(duì)策。
在微分對(duì)策中,通常用向量X(t)表示時(shí)刻t 時(shí)各方為繼續(xù)進(jìn)行對(duì)策所必須知道的雙方的狀況的量,例如空戰(zhàn)中雙方飛機(jī)的相對(duì)位置和機(jī)頭所指方向等等,因此X(t)也被稱為狀況變量。
同時(shí),各局中人都有控制自己運(yùn)動(dòng)路線的手段,例如飛機(jī)駕駛員可以做改變機(jī)速和使機(jī)頭拐彎等操作,于是機(jī)速和機(jī)頭拐彎的曲率半徑等是屬于局中人直接可控的量,這些量的改變就能引起前述狀況變量的改變,并且這些量將怎么變,對(duì)方是不知道的,所以這些量稱做控制量。
于是局中人的一個(gè)策略就是決定一個(gè)連續(xù)控制的規(guī)律,即對(duì)任意狀況變量X(t) 給出自己應(yīng)選的控制量。所以控制規(guī)律就是狀況變量的函數(shù),記為(對(duì)追者),
(對(duì)逃者)。
一般,當(dāng)控制規(guī)律為各方選定以后,雙方的運(yùn)動(dòng)情況可由某個(gè)微分方程組描述:
此方程組也稱為運(yùn)動(dòng)方程。
從理論上說,當(dāng)給定了初始狀況和控制規(guī)律
后,由運(yùn)動(dòng)方程可解出雙方在這局對(duì)策中自始至終的運(yùn)動(dòng)路線2。
一局對(duì)策的得失對(duì)于追蹤對(duì)策,當(dāng)追著了或逃掉了,即到達(dá)運(yùn)動(dòng)路線的終點(diǎn)時(shí),這局對(duì)策也就結(jié)束了。但在終點(diǎn)上的得失不光是追著或逃掉,因?yàn)橛袝r(shí)逃者并非單純逃,而是企圖在被追到以前達(dá)到某種目的。那么,追者必須在逃者達(dá)到目的之前追著它才是最好的。所以數(shù)學(xué)上應(yīng)根據(jù)雙方的目的,對(duì)得失(下面稱作支付)作出不同的描述。例如:
(1) 如果關(guān)心的是能否追著,那么支付就可以用追著的時(shí)間來描述,沒追著就對(duì)應(yīng)于追著時(shí)間為無窮大或大于某個(gè)時(shí)刻T(即追者因動(dòng)力燃料限制不能無限追下去)。支付這樣描述時(shí),追者是要盡快追著,即極小化追著的時(shí)間,而逃者則要極大化追著的時(shí)間。
(2) 如果關(guān)心的是進(jìn)不進(jìn)入某目標(biāo)的鄰域,那么支付可用追著時(shí)離目標(biāo)鄰域的距離來描述。此時(shí)保衛(wèi)此目標(biāo)者要極大化此距離,而襲擊此目標(biāo)者則要極小化這個(gè)距離。
總之在追蹤問題中,對(duì)得失作出恰當(dāng)?shù)牧康拿枋鲋?,總是一方要極大化這個(gè)量,而另一方則要極小化這個(gè)量。所以,在追蹤問題中以極大極小原則定義最優(yōu)策略,也是很令人信服的2。
解決這一類問題,可運(yùn)用連續(xù)函數(shù)的運(yùn)動(dòng)學(xué)微分方程求解:
式中為追方的控制函數(shù)關(guān)系,
為逃方的控制函數(shù)關(guān)系,X是描寫追逃雙方相互位置的狀態(tài)變量。若能給定初條件,則可解該方程以求得雙方的運(yùn)動(dòng)路線。