多智能體控制產(chǎn)生于21世紀(jì)初。到如今已經(jīng)發(fā)展了二十余年。積累了大量的論文,常出現(xiàn)各類研究方向的介紹上,但多智能體控制究竟是做什么的,回望這二十余年的研究歷程,我們又得到了哪些啟示,未來又有哪些方向可以進(jìn)一步努力,都是比較直接但又需要說明的問題,在這里就啰嗦一下個(gè)人的感受,供各位批評(píng)指正。
1. 概念的演進(jìn)
控制理論的一個(gè)基礎(chǔ)和核心是對(duì)系統(tǒng)的研究,因此我們先從系統(tǒng)的概念開始梳理,按照時(shí)間線討論各個(gè)名詞的興起。從最早的大規(guī)模系統(tǒng)研究到現(xiàn)在的CPS研究,粗略分的話,與網(wǎng)絡(luò)相關(guān)的概念有五個(gè)。大規(guī)模系統(tǒng)或者叫網(wǎng)絡(luò)化系統(tǒng)、網(wǎng)絡(luò)化控制、多智能體系統(tǒng)、復(fù)雜網(wǎng)絡(luò)、信息物理系統(tǒng)。這五個(gè)的聯(lián)系與區(qū)別,可以看到,這五個(gè)各自產(chǎn)生了許多文章。
首先要清楚的是,這五個(gè)的發(fā)源地都是圖論。對(duì)于圖論的研究始于柯尼斯堡七橋問題。隨著技術(shù)進(jìn)步,在工業(yè)上,我們遇到了需要將多個(gè)個(gè)體之間使用網(wǎng)絡(luò)通信相連的問題,既然是多個(gè)體相連,我們首先注意到的是它們之間的通信方式與通信效果,比如:
擁塞控制是在網(wǎng)絡(luò)中使用反饋的早期例子。在保持高吞吐量的同時(shí),對(duì)向網(wǎng)絡(luò)中注入數(shù)據(jù)包的速率進(jìn)行調(diào)節(jié)以避免擁塞(Jacobson,1988年)。事實(shí)上,TCP(后來的TCP/IP協(xié)議)正是互聯(lián)網(wǎng)的核心,也是互聯(lián)網(wǎng)迅速發(fā)展的原因之一。一般來說,網(wǎng)絡(luò)的運(yùn)行需要多個(gè)層次的控制原則和控制回路。
進(jìn)而關(guān)注點(diǎn)聚焦于:
從網(wǎng)絡(luò)傳輸數(shù)據(jù)包角度來看,具有三個(gè)重要特征:網(wǎng)絡(luò)處理傳入數(shù)據(jù)包的速度、由于網(wǎng)絡(luò)上的流量負(fù)載,數(shù)據(jù)包在到達(dá)預(yù)定目的地之前可能遇到的延遲,以及網(wǎng)絡(luò)可能遇到丟棄數(shù)據(jù)包的概率或可能性。
通信是網(wǎng)絡(luò)化控制的一個(gè)重要研究角度。這里就到了第一個(gè)區(qū)分點(diǎn),大規(guī)模系統(tǒng)或者叫網(wǎng)絡(luò)化系統(tǒng)是多個(gè)個(gè)體,而中文表達(dá)上較為相似的網(wǎng)絡(luò)化控制則是偏向于控制器與被控對(duì)象通過網(wǎng)絡(luò)相連,也可以是單體系統(tǒng)。
90年代末,興起了兩件新事物,一個(gè)多智能體、一個(gè)復(fù)雜網(wǎng)絡(luò)。多智能體系統(tǒng)走入了人們的視野:
相對(duì)于網(wǎng)絡(luò)化系統(tǒng)對(duì)于通信速率的關(guān)注,多智能體系統(tǒng)則源于對(duì)“簡單規(guī)則產(chǎn)生復(fù)雜行為”的好奇與模仿,并且將這一問題抽象簡化為所有狀態(tài)收斂到同一數(shù)值的一致性問題展開初步研究。當(dāng)然,隨著研究深入,這兩個(gè)方向也變得越來越融合了,但拿最新文獻(xiàn)對(duì)比,我們?nèi)匀豢梢钥闯鲆幌卵芯克悸飞系募?xì)微區(qū)別:
比如,我們以可控性研究為例,多智能體系統(tǒng)可控性的文獻(xiàn)中,比如Chao Sun, Guoqiang Hu, and Lihua Xie. Controllability of Multiagent Networks With Antagonistic Interactions.IEEE TRANSACTIONS ON AUTOMATIC CONTROL, VOL. 62, NO. 10 ,會(huì)利用到拉普拉斯矩陣,換句話說,要想寫出這個(gè)矩陣需要提前知道網(wǎng)絡(luò)結(jié)構(gòu)是怎樣的。
而在同樣研究可控性的網(wǎng)絡(luò)化系統(tǒng)文獻(xiàn)中,Yuyu Zhou and Tong Zhou, A Revisit to the Controllability and Observability of Networked Dynamic Systems,IEEE Transactions on Control of Network Systems ,DOI 10.1109/TCNS.2021.3078070. 則用抽象的耦合矩陣代替了圖,而不需要提前知道網(wǎng)絡(luò)結(jié)構(gòu)是什么樣子。反映了建模思路上的差異。
隨著考慮節(jié)點(diǎn)的增多,無論是畫圖分析還是給出耦合矩陣都變的力不從心,統(tǒng)計(jì)物理此時(shí)進(jìn)入了人們的視野,小世界網(wǎng)絡(luò)、無標(biāo)度網(wǎng)絡(luò)相繼誕生,每一個(gè)進(jìn)入網(wǎng)絡(luò)科學(xué)學(xué)習(xí)的新人首先接受的也是各種統(tǒng)計(jì)量。復(fù)雜網(wǎng)絡(luò)的研究就這樣展開了。
隨著時(shí)間的推移,這幾個(gè)的界限是越來越模糊了,但從研究主流來看,如果搜索關(guān)鍵詞,大規(guī)模系統(tǒng)的研究高潮已經(jīng)逐漸過去,復(fù)雜網(wǎng)絡(luò)還是統(tǒng)計(jì)特色和社會(huì)類研究為主,多智能體和部分網(wǎng)絡(luò)化系統(tǒng)則更聚焦于一致性,網(wǎng)絡(luò)化控制則傾向于通信的具體實(shí)現(xiàn)。
我們暫停一下,仔細(xì)想一想這么一個(gè)問題,剛才的介紹里是不是不由自主的使用了某幾種假設(shè)?比如,復(fù)雜網(wǎng)絡(luò)使用統(tǒng)計(jì)物理的前提是什么?是網(wǎng)絡(luò)天生存在,只是我們不知道網(wǎng)絡(luò)具體結(jié)構(gòu)。網(wǎng)絡(luò)化控制呢?控制器與被控對(duì)象通過網(wǎng)絡(luò)相連,該網(wǎng)絡(luò)也是類似于天生的。但到了多智能體系統(tǒng),本來一個(gè)個(gè)個(gè)體是獨(dú)立的,是我們?cè)O(shè)計(jì)了通信網(wǎng)絡(luò)將其連接在一起,也就是網(wǎng)絡(luò)人工設(shè)計(jì)。這里的區(qū)別是,天生網(wǎng)絡(luò)的研究成果往往需要所開發(fā)的方法適用于多么一般的網(wǎng)絡(luò),而人工網(wǎng)絡(luò)的研究則需要實(shí)現(xiàn)目的即可,更多的可能要討論帶有某種最優(yōu)指標(biāo)的拓?fù)湓O(shè)計(jì)問題。
那么,有沒有既有天生又有人工的呢?進(jìn)一步,如果我們將天生網(wǎng)絡(luò)定義為物理耦合關(guān)系,即物理層。而人工網(wǎng)絡(luò)則稱為信息層。我們就得到了一個(gè)這幾年的熱詞:信息物理系統(tǒng)。
一個(gè)概念的引入自然會(huì)帶來新問題,比如網(wǎng)絡(luò)攻擊問題。以往的網(wǎng)絡(luò)化系統(tǒng),很少有人考慮攻擊的問題,因?yàn)槠鋵儆诰钟蚓W(wǎng),且不與外界相連,攻擊的可能性很低,而隨著技術(shù)進(jìn)步,尤其是工業(yè)互聯(lián)網(wǎng)的發(fā)展、數(shù)據(jù)分析技術(shù)的引入,在帶來方便的同時(shí),也給了攻擊的機(jī)會(huì),為理論分析提供了可行性。有了這個(gè)可行性作保證,無論是網(wǎng)絡(luò)化系統(tǒng)、多智能體還是復(fù)雜網(wǎng)絡(luò)都引入了安全的因素,相關(guān)文章成了這幾年的一個(gè)熱點(diǎn)。
又比如“將調(diào)整通信邊作為一種控制手段”,CPS系統(tǒng)結(jié)構(gòu)帶來了調(diào)整拓?fù)渎?lián)系的可能性,這一點(diǎn)在2020年的TAC文章中有體現(xiàn):
In our paper, instead, we deal with the open problem of modifying the structure of the network of interaction in a multi-agent systems such that to obtain arbitrarily selected clusters.........by implementing a cyber-layer of controllers operating in parallel with the physical connections of the multi-agent system and providing the further inputs generated by the coupling terms of the control layer..........
(Lucia Valentina Gambuzza, Mattia Frasca,Distributed control of multi-consensus ,IEEE TAC,DOI 10.1109/TAC.2020.3006820)
從事多智能體系統(tǒng)研究的同行們可能覺得加邊、減邊這類操作比較新,但我們將視角轉(zhuǎn)向網(wǎng)絡(luò)科學(xué),則會(huì)發(fā)現(xiàn),在網(wǎng)絡(luò)科學(xué)中的網(wǎng)絡(luò)性能分析中,像某種指標(biāo)比如可控性在節(jié)點(diǎn)失效、邊失效、增加邊等變化下的魯棒性能問題工作還是不少的,可以參考香港城市大學(xué)陳關(guān)榮教授的工作。同樣的,節(jié)點(diǎn)失效、邊失效、增加邊等變化對(duì)其他復(fù)雜行為又有什么影響?進(jìn)一步,如果把“節(jié)點(diǎn)失效、邊失效、增加邊”這類操作如果放在多智能體系統(tǒng)控制里去考慮,一個(gè)能貼近的場(chǎng)景是應(yīng)變能力。我們以往考慮的系統(tǒng)往往都是固定的拓?fù)浠蛘呤前凑找欢ㄒ?guī)律切換的拓?fù)洹栴}在于,如果我們遇到一種突發(fā)情況,被動(dòng)的改變拓?fù)涞臅r(shí)候,怎么去處理這種情況?等等,這類工作與控制設(shè)計(jì)結(jié)合,最終都會(huì)歸為**最優(yōu)拓?fù)湓O(shè)計(jì)問題。**這些都是近年來概念演進(jìn)帶來的一些新思路。
2.從基本一致性出發(fā)
關(guān)于多智能體系統(tǒng)協(xié)同控制目前主要研究在于一致性。一致性,簡單理解,就是網(wǎng)絡(luò)當(dāng)中的每一個(gè)個(gè)體都達(dá)到了同一個(gè)狀態(tài)。**一個(gè)經(jīng)典結(jié)論在于有向生成樹的存在與一致性的強(qiáng)相關(guān)關(guān)系。**如果我們轉(zhuǎn)化一下,就可以歸結(jié)成微分方程的穩(wěn)定性問題。關(guān)于穩(wěn)定性問題,控制理論體系里有很多的研究工具。特別對(duì)于多智能體系統(tǒng)而言,針對(duì)拉普拉斯矩陣的性質(zhì)。也有一些比較成熟的處理工具,大家如果看這方面論文認(rèn)為比較多的話,相信都會(huì)有這樣一個(gè)感覺:場(chǎng)景雖然不同,但是核心方法都是類似的。
單看一致性,從被控對(duì)象上看:線性一致性、非線性一致性、時(shí)滯的一致性、異構(gòu)的一致性、切換拓?fù)涞囊恢滦?、從通信上,丟包的一致性,事件觸發(fā)的一致性、網(wǎng)絡(luò)攻擊條件下的一致性和彈性一致性,隱私保護(hù)的一致性,從應(yīng)用上,編隊(duì)、合圍等。基本所有控制理論的經(jīng)典成果都可以用到多智能體一致性研究上。我們這里統(tǒng)稱是應(yīng)用場(chǎng)景上的新東西。
我們這里并不打算念名詞,那樣就喪失了圖解的意義,但可以用幾條線串起來,比如一個(gè)很容易會(huì)產(chǎn)生的問題:**多智能體僅僅是一致就行了嗎?**首先我們來看這個(gè)一致性的定義。網(wǎng)絡(luò)中的每一個(gè)個(gè)體都達(dá)到同一個(gè)狀態(tài)。比如說這個(gè)狀態(tài)是位置信息的話,那么說。全部的個(gè)體從四面八方而來,都匯集到了一個(gè)位置。那么一個(gè)很自然的拓展就是,如果我們?cè)O(shè)計(jì)的目的是:要求一部分個(gè)體去A點(diǎn)會(huì)合,一部分個(gè)體去B點(diǎn)會(huì)合。或者說類似的這類情況。那么這種情況又該如何處理呢?這里就引出了一個(gè)有關(guān)鍵詞。叫分組一致或者聚類一致(group consensus or cluster consensus or multi consensus)。這方面的研究基礎(chǔ)是討論矩陣的零特征值的重?cái)?shù),結(jié)合比較特殊的網(wǎng)絡(luò)結(jié)構(gòu)(比如Eqiutable partition or Acyclic partition)或者滿足一定條件的組間耦合關(guān)系。這里多提幾句:group consensus 和 cluster consensus 還是有些區(qū)別的,group consensus不要求各個(gè)組之間狀態(tài)嚴(yán)格不同,做仿真有可能會(huì)出現(xiàn)不同組的曲線匯合現(xiàn)象,而cluster consensus往往會(huì)要求。
又比如近幾年的研究當(dāng)中,出現(xiàn)了對(duì)于一致性的進(jìn)一步限定。比如positive consensus:
The positive systems mean that the states of the systems can be always nonnegative for any nonnegative initial conditions. Some significant conclusions have been acquired for the positive consensus of integer-order multiagent systems (IOMASs).
再比如搞研究時(shí)經(jīng)常想到的“有何必要”疑問,如何我們按這個(gè)角度來看,讓所有個(gè)體都精確達(dá)到一個(gè)相同的狀態(tài),是永遠(yuǎn)必要的嗎?比如我們需要驅(qū)趕群體越過某條線,大于某個(gè)值算個(gè)體通過,而不去管它究竟大了多少,或者對(duì)于投票模型,設(shè)定個(gè)體狀態(tài)超過某個(gè)數(shù)即為同意,只關(guān)心是不是同意票,而不關(guān)心個(gè)體同意的程度。這個(gè)目標(biāo)在2018年被拿出來單獨(dú)研究,至今也產(chǎn)生了那么幾篇文章吧,稱作Herdability,屬于剛開始的研究階段。諸如此類有意思的概念,等等。
回到Consensus,有讀者就問了,以上是consensus的擴(kuò)展,那對(duì)于consensus,有沒有一條線能串起來,讓大家清楚大部分工作在什么地方。在重新審視圖的時(shí)候,確實(shí)發(fā)現(xiàn)了這條線。就是權(quán)重形式的變化。
最早的工作其實(shí)并不討論權(quán)重,只看是否連接,連接了就標(biāo)為1。后來引入了權(quán)重的概念,使用數(shù)值為正的數(shù)來表示通信強(qiáng)度。從數(shù)學(xué)上,有正就有負(fù),最為廣泛和成功的改造討論當(dāng)屬符號(hào)網(wǎng)絡(luò),考慮到符號(hào)網(wǎng)絡(luò)是對(duì)社會(huì)網(wǎng)絡(luò)的某種簡化,我們放在這里起到承上啟下的作用。所謂符號(hào)網(wǎng)絡(luò),是指權(quán)重引入了負(fù)數(shù),用來模擬個(gè)體之間的對(duì)抗關(guān)系,像歷史上的諸多概念一樣,也是被不同學(xué)科的多人獨(dú)立發(fā)現(xiàn),最早考慮符號(hào)網(wǎng)絡(luò)的一致性問題的是Claudio Altafini 在2013年的文章,首次建立了結(jié)構(gòu)平衡與一種特殊的狀態(tài):二分一致性的關(guān)系。揭示出當(dāng)網(wǎng)絡(luò)滿足結(jié)構(gòu)平衡特性時(shí),可以收斂到絕對(duì)值相等、符號(hào)相反的兩個(gè)狀態(tài),而對(duì)于結(jié)構(gòu)不平衡網(wǎng)絡(luò)則一般收斂到零。用通俗的話解釋結(jié)構(gòu)平衡,就是這里有兩幫人,幫內(nèi)團(tuán)結(jié)、對(duì)外斗爭(zhēng)、達(dá)到了實(shí)力均衡。需要注意的是,二分一致的達(dá)成使用了針對(duì)符號(hào)網(wǎng)絡(luò)專門設(shè)計(jì)的協(xié)議。
有了有正到負(fù)的先例,2016年的一篇碩士論文里,討論了復(fù)權(quán)多智能體網(wǎng)絡(luò)的模一致性問題,但并未引起多少關(guān)注,這方面的一些理論成果尚待挖掘。以上都是權(quán)重為標(biāo)量的情況,2018年受基于剛性圖編隊(duì)的啟發(fā),矩陣權(quán)重網(wǎng)絡(luò)重新得到關(guān)注,目前仍然出于非常初步的階段,現(xiàn)有研究大部分集中于對(duì)稱矩陣,一個(gè)值得一提的發(fā)現(xiàn)是,當(dāng)研究者使用對(duì)稱正定和負(fù)定矩陣來將符號(hào)網(wǎng)絡(luò)二分一致性的結(jié)論推廣到矩陣權(quán)重圖時(shí),很快發(fā)現(xiàn)按照Altafini 協(xié)議,即使在結(jié)構(gòu)不平衡的情況,二分一致仍可達(dá)到。這個(gè)問題在上海交通大學(xué)Chongzhi Wang、Haibin Duan 的新工作得到了進(jìn)一步揭示,這個(gè)結(jié)果也暗示我們,結(jié)構(gòu)平衡只是某種更為深刻的機(jī)理的表面反映,仍然尚待挖掘。而已經(jīng)開始興起的矢量權(quán)重、非對(duì)稱矩陣權(quán)重、包括理論上的復(fù)矩陣權(quán)重等各類權(quán)重形式,很多情況下仍然是一片未知海洋。
3.生物、團(tuán)隊(duì)與社會(huì)網(wǎng)絡(luò)的啟發(fā)
第二部分提到了目前對(duì)于基本一致性概念的一些改進(jìn)和拓展。提到了幾個(gè)算是比較新的但也是能夠歸為一致性一類的概念。還以權(quán)重為主線梳理了目前的一致性研究。這部分就把思維稍微的發(fā)散一下。考慮一下場(chǎng)景問題。當(dāng)然,這里所提到的場(chǎng)景,不是指之前提到的羅列關(guān)鍵詞的列表式場(chǎng)景,也不是將理論用到工程應(yīng)用比如編隊(duì)的場(chǎng)景,這兩部分上邊這張圖已經(jīng)展示的比較詳細(xì)了。本片還是主要以理論視角為主。
其實(shí)在第二部分的研究的一些成果當(dāng)中已經(jīng)有所提醒,**我們所追求的協(xié)同控制,它的關(guān)鍵點(diǎn)應(yīng)該落在哪里?**或者說多智能體領(lǐng)域最初的研究動(dòng)機(jī)是?我們這里來回顧一下多智能體系統(tǒng)研究的起源:
匈牙利Vicsek等人1995年發(fā)表在物理雜志PRL上的一篇文章,考慮在平面上運(yùn)動(dòng)的多個(gè)粒子,采用nearest neighbor rule相互局部協(xié)調(diào),最終達(dá)到整體一致運(yùn)動(dòng)。這篇以仿真為主的文章在剛發(fā)表的幾年里沒有引起多大的關(guān)注,也沒有多少文章引用。Vicsek, T., Czirók, A., Ben-Jacob, E., Cohen, I., & Shochet, O. (1995). Novel type of phase transition in a system of self-driven particles. Physical Review Letters, 75(6), 1226.
我們可以很清晰的看到,雖然我們現(xiàn)在看到的大多數(shù)文章都是在研究一致性,但是,一開始的研究并不是為了追求一致性,而是重點(diǎn)放在了基于鄰居的規(guī)則。也就是代表了這樣的一個(gè)科學(xué)問題:通過局部的鄰居之間的簡單交互,如何去產(chǎn)生全局性的復(fù)雜的行為?
站在現(xiàn)在這個(gè)角度上。我們已經(jīng)知道的是,人們從控制協(xié)議的角度上針對(duì)不同場(chǎng)景提出了多種的方案設(shè)計(jì)。理論證明都能夠達(dá)到一致和預(yù)期的設(shè)計(jì)目標(biāo)。但是這僅僅是問題的第一步。也就是說我們利用了已有的控制理論。實(shí)現(xiàn)了這一效果。但是達(dá)成各種一致這就夠了嗎?顯然不是。而如果我們繼續(xù)走,比如觀察鳥群的行為,有時(shí)候不是簡單的飛到一塊或者分成幾群就完事了,形狀的變化千奇百怪。這一點(diǎn)可以去看一下相關(guān)的紀(jì)錄片。那么它們呈現(xiàn)的復(fù)雜集體行為屬于什么機(jī)理?因此研究者們從生物學(xué)的角度也進(jìn)行了進(jìn)一步的探索,提出了一些仿生機(jī)理的方法,比如華中科技大學(xué)的Haitao Zhang課題組等。這些代表性的工作是從局部規(guī)則與群體行為的關(guān)系入手去考慮的,它代表著人們對(duì)于生物界中存在的群體行為的理解。這個(gè)問題到目前為止仍然沒有得到很好的解決。
鳥群、魚群等群體的集體行為引人關(guān)注,但我們要注意,有一個(gè)更大的群體就擺在眼前,那就是我們自己。
比如團(tuán)隊(duì)合作里有很多問題其實(shí)值得進(jìn)一步思考。舉個(gè)例子,有些時(shí)候談多智能體必說協(xié)同控制,那么我們來想象一下協(xié)同控制的流程,而不僅僅限于一致性,首先一個(gè)工程上的群體,我們需要給他安排一個(gè)任務(wù)。這個(gè)任務(wù)是需要共同完成的,那么這里就出現(xiàn)了一個(gè)問題:也就是誰去完成這個(gè)任務(wù)?是所有的人都去,還是一部分一部分的對(duì)任務(wù)進(jìn)行分解之后,再去完成子任務(wù),最后匯總成目標(biāo)。第二個(gè),如果是分解成子任務(wù),那么分配就是一個(gè)關(guān)鍵問題,誰去比較合適?去多少人比較合適?這是都是問題。但是這些問題很少出現(xiàn)在控制理論的研究當(dāng)中,但是在多機(jī)器人領(lǐng)域的研究還是比較多的,詳情可以參考:Cooperative Heterogeneous MRS_2019_ACM。
不妨再大些,多智能體系統(tǒng),不僅可以用來建模工程系統(tǒng),還可以用來建模社會(huì)系統(tǒng)。一旦有了這么一個(gè)認(rèn)識(shí),那么很自然的就可以去考慮比如觀點(diǎn)動(dòng)力學(xué)(Opinion Dynamic)問題,疾病傳播動(dòng)力學(xué)問題。比如拿觀點(diǎn)動(dòng)力學(xué)問題來說,雖然模型與工程系統(tǒng)不一樣,但是仍然存在著如何通過調(diào)控,使得最終群體達(dá)到一致意見的需求。而對(duì)于疾病傳播動(dòng)力學(xué)模型,這幾年的熱度就不多說了。
雖然無論是觀點(diǎn)動(dòng)力學(xué)還是疾病傳播動(dòng)力學(xué)問題,以往都在其他領(lǐng)域都得到了大量的關(guān)注。但在這幾年,相關(guān)的研究在控制領(lǐng)域逐漸開始興起。人們開始利用控制理論的視角去分析了這些問題,相關(guān)的工作,**可以關(guān)注一下Ming Cao、Mengbin Ye、Ji Liu等相關(guān)課題組的工作。**利用已經(jīng)有的研究基礎(chǔ),無論是控制系統(tǒng)的指標(biāo)還是控制系統(tǒng)的設(shè)計(jì)方法,在這樣一個(gè)新背景下,能否得到新的結(jié)論,挖掘新的特性,都是一個(gè)未知的內(nèi)容。這也是交叉學(xué)科的獨(dú)特魅力之一。
在提及的觀點(diǎn)動(dòng)力學(xué)和疾病傳播動(dòng)力學(xué)僅僅是兩個(gè)例子。在近些年的控制領(lǐng)域頂刊上,我們還可以看到對(duì)社會(huì)系統(tǒng)進(jìn)行建模的,比如決策系統(tǒng)、投票系統(tǒng)都是屬于這一類,在這些理論的新背景下相關(guān)的研究,將推進(jìn)我們對(duì)于一致性機(jī)制的理解。
順帶一提,既然討論社會(huì)網(wǎng)絡(luò),那么智能因素是肯定要考慮的,雖然一開始的比如觀點(diǎn)動(dòng)力學(xué)模型、傳播模型也是微分方程模型。但智能時(shí)代可以更進(jìn)一步了,比如說,
①對(duì)于每個(gè)個(gè)體引入合作-競(jìng)爭(zhēng)、或者博弈的因素。這在觀念傳播動(dòng)力學(xué)模型近期研究文章當(dāng)中是比較常見的方法。也就是說,如果賦予每個(gè)個(gè)體一定自主性(選擇權(quán)利),那么又是如何變化的?
②近幾年,計(jì)算機(jī)界風(fēng)起云涌,機(jī)器學(xué)習(xí)這個(gè)概念從課本走向大眾。而在眾多的機(jī)器學(xué)習(xí)的概念當(dāng)中,多智能體強(qiáng)化學(xué)習(xí),同樣帶有多智能體這四個(gè)字。那么這就啟發(fā)我們。如果給每個(gè)個(gè)體引入記憶-學(xué)習(xí)的能力,放在我們所熟知的網(wǎng)絡(luò)里面,比如考慮網(wǎng)絡(luò)結(jié)構(gòu)的多智能體強(qiáng)化學(xué)習(xí),去探討我們上面提到的問題。又會(huì)得到怎樣的一種新的啟示?
③數(shù)據(jù)驅(qū)動(dòng)的觀念可以引入處理社會(huì)網(wǎng)絡(luò)的復(fù)雜性,以便進(jìn)行更好的調(diào)控。
我們可以關(guān)注到,很多長期從事多智能體研究的課題組,近幾年也在轉(zhuǎn)向這個(gè)方向。一方面,雖然社會(huì)網(wǎng)絡(luò)也屬于經(jīng)典學(xué)科了,但帶著控制觀點(diǎn)去處理分析社會(huì)網(wǎng)絡(luò)確實(shí)是新興產(chǎn)物,尤其是這幾年大背景下,另一方面,大家也都在尋找未來的著手點(diǎn)。
當(dāng)然,這種問題跨度大,難度高。是多個(gè)學(xué)科共同關(guān)注的問題,并且多次入選了自然雜志年度科學(xué)問題表里面。值得一提的是,2021年諾貝爾物理學(xué)獎(jiǎng)獲得者喬治帕里西也研究過這個(gè)問題(可以參考科普著作《隨椋鳥飛行》)。無論是數(shù)學(xué)界、生物界、物理界還是計(jì)算機(jī)界等,都有大量的學(xué)者在探索這個(gè)問題,但是每個(gè)學(xué)科都有其獨(dú)特的方法論。對(duì)于我們而言,雖然不能一下子就全部跳到這個(gè)領(lǐng)域進(jìn)行攻關(guān),但是相關(guān)成果我們是可以借鑒的。原因正如上邊所說。**對(duì)于控制學(xué)科來說,我們不僅期望的是探索新場(chǎng)景的機(jī)理,我們更期望的是受到啟發(fā)設(shè)計(jì)調(diào)控的方式。**比如考慮博弈或者學(xué)習(xí)的系統(tǒng),理論分析存在很高的價(jià)值,也出現(xiàn)了很多可以稱為經(jīng)典的分析工作,但實(shí)際應(yīng)用上怎么說服設(shè)計(jì)人員去采用?這一點(diǎn)需要深入挖掘,尤其是跟傳統(tǒng)方法對(duì)比,有什么傳統(tǒng)方法解決不了的問題。這將是控制科學(xué)框架下的研究重點(diǎn)。
4.網(wǎng)絡(luò)主干剖析:圖論
從控制理論誕生那天起,系統(tǒng)分析與控制就形影不離了。系統(tǒng)特性為我們?cè)O(shè)計(jì)控制器提供了很多方便,更有很多時(shí)候系統(tǒng)性能直接否定了控制的可能性。因此,即使在專注于控制器設(shè)計(jì)的工作,也會(huì)在最開頭列出使用幾條假設(shè)。因此,專門研究系統(tǒng)性能的工作是值得單獨(dú)一個(gè)單元來討論的。
說到群體的性能研究,除了上部分提到的生物集群,我們也會(huì)想到上個(gè)世紀(jì)末誕生的網(wǎng)絡(luò)科學(xué),網(wǎng)絡(luò)科學(xué)目前也發(fā)展出了許多經(jīng)典成果,由于處理節(jié)點(diǎn)比較多,大部分使用統(tǒng)計(jì)概念和統(tǒng)計(jì)工具去描述網(wǎng)絡(luò),側(cè)重于網(wǎng)絡(luò)行為揭示和性能分析。而在閱讀相關(guān)文章中,我們很多時(shí)候能夠看到作者對(duì)于網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行的一些假設(shè),比如包含一棵有向生成樹,圖是連通的等等,這些假設(shè)是為了后續(xù)結(jié)論的討論和證明方便而設(shè)立的。如果我們把多智能體系統(tǒng)不斷簡化提煉,那么我們得到的就是一張圖。因此,雖然側(cè)重點(diǎn)和工具不同,網(wǎng)絡(luò)科學(xué)和多智能體系統(tǒng)仍然具有天生的可結(jié)合點(diǎn)。
網(wǎng)絡(luò)科學(xué)里有很多結(jié)論指向了網(wǎng)絡(luò)的特殊結(jié)構(gòu)。嚴(yán)格來說,特殊結(jié)構(gòu)這個(gè)對(duì)于控制領(lǐng)域的研究人員也不算陌生,在上個(gè)世紀(jì)發(fā)展出的“系統(tǒng)的圖表示”理論中我們已經(jīng)見識(shí)過了。對(duì)于網(wǎng)絡(luò)尤其是特殊網(wǎng)絡(luò)結(jié)構(gòu)的研究,能夠產(chǎn)生幫助我們理解、輔助我們?cè)O(shè)計(jì)的有效工具。這里我們簡單舉一個(gè)例子:
在圖論里面有一個(gè)概念叫做Equitable partition,為了討論方便,我們這里討論最為簡單的圖。即無向無權(quán)重?zé)o符號(hào)圖。我們將具有相同鄰居節(jié)點(diǎn)的個(gè)體稱為等價(jià)節(jié)點(diǎn),這種節(jié)點(diǎn)的重要標(biāo)志是它接收的和傳出的信息是完全一樣的。因此在全過程里,它們狀態(tài)始終一致,在不引入新的控制信號(hào)條件下,無法使得它們之間達(dá)到不一樣的狀態(tài)。也就是控制理論當(dāng)中所描述的不可控情況。當(dāng)然這里描述的比較簡單,具體證明就不展開了。受這個(gè)現(xiàn)象啟發(fā),對(duì)于任何一個(gè)網(wǎng)絡(luò)化系統(tǒng),只要根據(jù)該網(wǎng)絡(luò)化系統(tǒng)的特點(diǎn),找到接收和發(fā)出信號(hào)完全一樣的節(jié)點(diǎn),并給出針對(duì)性的尋找方法,那么我們就可以在可控性上得到相關(guān)的結(jié)論。正如第二節(jié)所提到,這種節(jié)點(diǎn)間狀態(tài)始終一致的現(xiàn)象,在研究分組一致時(shí)獲得了高度重視。我們今天去搜索這個(gè)關(guān)鍵詞時(shí),除了從圖論角度討論數(shù)學(xué)問題的文章,基本都是在各個(gè)領(lǐng)域應(yīng)用這一特性討論分組一致的文章,大多發(fā)表于物理學(xué)期刊,有些文章也發(fā)表在了控制領(lǐng)域的頂級(jí)期刊上。目前這種工具已經(jīng)成為分組一致研究領(lǐng)域一種常用的工具。
更多的,對(duì)于網(wǎng)絡(luò)特殊結(jié)構(gòu)的研究,可以大體分為以下幾個(gè)角度:
第一就是某種網(wǎng)絡(luò)結(jié)構(gòu)對(duì)于系統(tǒng)性能的影響,這里面涉及的內(nèi)容比較多。像路圖、樹圖,環(huán)圖等,圖論當(dāng)中的擴(kuò)張、匹配等,還有一些圖的工具,比如獨(dú)立強(qiáng)連通分量、等價(jià)劃分、零迫集等。研究的性能指標(biāo)也相當(dāng)?shù)亩?,像可控性、可觀性、魯棒性、可鎮(zhèn)定性、結(jié)構(gòu)可控性、結(jié)構(gòu)可觀性等等等等。
第二是在第一基礎(chǔ)上,什么時(shí)候 我們構(gòu)造 什么樣的網(wǎng)絡(luò)結(jié)構(gòu) 來完成什么樣的指標(biāo) 是最好的,或者對(duì)處理問題是方便的。
第三是新型網(wǎng)絡(luò)的建模。借鑒了圖論的一些新成果,比如矢量、矩陣權(quán)重網(wǎng)絡(luò),再比如超圖。也誕生了一些比較不錯(cuò)的交叉工作。
對(duì)系統(tǒng)性能的研究進(jìn)一步豐富了設(shè)計(jì)控制器時(shí)需要注意的原則和可以優(yōu)化的思路。我們舉例子時(shí)經(jīng)常說,這種控制方法處理一萬個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)怎么辦?這里我們就看一下如果一個(gè)網(wǎng)絡(luò)中有一萬個(gè)節(jié)點(diǎn)會(huì)對(duì)系統(tǒng)分析與控制有什么影響?
①對(duì)分布式的嚴(yán)格要求:盡管我們使用了分布式協(xié)議,但不少協(xié)議的設(shè)計(jì)過程相較于集中控制優(yōu)勢(shì)并不明顯,仍然需要精確知道全局信息,假設(shè)都一萬個(gè)節(jié)點(diǎn)了,如果還是整體設(shè)計(jì),單純算矩陣就費(fèi)勁,如果其中幾個(gè)節(jié)點(diǎn)失效了呢,又該怎么處理,是不是還得再對(duì)萬維大矩陣下手?完全分布式或者分散設(shè)計(jì)的作用在此時(shí)體現(xiàn)出來,相較于完全分布式控制(可參考Zhongkui Li課題組的工作),使用完全分布式的判據(jù)去分析系統(tǒng)性能,大多數(shù)時(shí)候還是一個(gè)開放問題。
②未知帶來的挑戰(zhàn):一萬個(gè)節(jié)點(diǎn)情況,未知的情況很多,比如這堆節(jié)點(diǎn)內(nèi)部怎么連接?即使知道了全部結(jié)構(gòu),每條邊上的權(quán)重呢?或者節(jié)點(diǎn)動(dòng)力學(xué)是什么情況?都是問題。對(duì)于未知,人們一方面開發(fā)了數(shù)據(jù)驅(qū)動(dòng)的方式去控制,這點(diǎn)跟網(wǎng)絡(luò)科學(xué)使用統(tǒng)計(jì)工具去處理很相似。進(jìn)一步,針對(duì)具體未知的情況分別討論:針對(duì)內(nèi)部連接不知道的情況,網(wǎng)絡(luò)科學(xué)有社團(tuán)發(fā)現(xiàn)的相關(guān)研究,控制里面也有工作嘗試從輸出觀察網(wǎng)絡(luò)結(jié)構(gòu)(可觀性)的研究。針對(duì)權(quán)重不知道的情況,人們想起來了結(jié)構(gòu)化系統(tǒng)理論的概念,放到網(wǎng)絡(luò)上就是研究一類系統(tǒng),它們網(wǎng)絡(luò)結(jié)構(gòu)一樣,邊權(quán)重不一樣,這類系統(tǒng)的共同性質(zhì)??梢詤⒖糀n overview of structural systems theory。
5.未來在特色問題上
幾千字無法窮盡多智能體的研究,就在寫文章的這個(gè)上午,幾篇新工作可能已經(jīng)悄然上線,我們無法精確預(yù)料到五年后的多智能體系統(tǒng)研究會(huì)有什么新因素出現(xiàn),新權(quán)重、新網(wǎng)絡(luò),網(wǎng)絡(luò)科學(xué)交叉等誰會(huì)搶先出現(xiàn)突破、占據(jù)主流,更不用說有可能一種嶄新的理論會(huì)產(chǎn)生并席卷控制理論了。但是,如果我們從脈絡(luò)上把握,而非糾結(jié)具體名詞,那預(yù)測(cè)顯而易見:特色問題。
談到控制學(xué)科,它的目的是實(shí)現(xiàn)對(duì)系統(tǒng)的調(diào)控,那么它的核心基礎(chǔ)就是對(duì)系統(tǒng)的認(rèn)識(shí)和剖析,所以需要抓住所研究系統(tǒng)的特性進(jìn)行進(jìn)一步的討論。以上這句話大概是每一個(gè)接觸過控制學(xué)科的人都知道的,但是這里面仍然有一些值得思索的內(nèi)容,比方說,拿到一個(gè)研究成果,它真的符合這句話嗎?
我們可以在控制理論結(jié)構(gòu)圖當(dāng)中任選一個(gè)名詞,并且把它加上多智能體的前綴,放到任何一種文獻(xiàn)庫,里面都能搜到很多篇文章。 我們這時(shí)候回頭再來看開頭的一句話,就是這些文章的特色究竟是在什么地方?或者說的更清楚一點(diǎn),就是這些處理方法,**有沒有抓住多智能體系統(tǒng)的特色?**我們這里不再多言前面四個(gè)部分具體提到的特色。但我們回過頭來去看前四部分的這些開創(chuàng)性的工作,就可以很簡單的得到一個(gè)道理,所有的開創(chuàng)性都是根據(jù)這個(gè)系統(tǒng)自身的特色而來,這對(duì)于控制研究來說就是一個(gè)啟發(fā),如果說你深刻的了解了系統(tǒng)的特色,抓住了這個(gè)系統(tǒng)的一些小小的特性,你就能夠出一些開創(chuàng)的工作,進(jìn)而去解決別人沒有解決甚至沒有意識(shí)的問題。
特色不是一成不變的,而是隨著概念演進(jìn)會(huì)不斷出現(xiàn),因此不必?fù)?dān)心特色被挖掘清楚的情況,有些讀者可能會(huì)問,新特色傳統(tǒng)控制方法解決不了,那是不是非得轉(zhuǎn)行啊。對(duì)于這個(gè)問題,有這么一段話說的很好,
在一個(gè)更大的問題框架下利用控制理論的思想和技術(shù),也能探索實(shí)現(xiàn)更加符合時(shí)代的“系統(tǒng)”的可行性。1950年的飛機(jī)大炮工業(yè)生產(chǎn)需要維納控制論,2050年的無人駕駛、無人工廠、聯(lián)網(wǎng)基礎(chǔ)設(shè)施、災(zāi)難救援動(dòng)物保護(hù)等等也需要新的“控制論”,方法和技術(shù)手段不斷在迭代適應(yīng)新的基礎(chǔ)設(shè)施和硬件條件,但歸根結(jié)底還是對(duì)系統(tǒng)加以研究和分析以及實(shí)現(xiàn),并沒有脫離控制理論本身,兼收并蓄博取眾長可能會(huì)是一個(gè)好的心態(tài)。
控制理論這個(gè)詞,如果要準(zhǔn)確的來說,應(yīng)該叫做系統(tǒng)調(diào)控理論,控制理論每個(gè)時(shí)期都應(yīng)該有不同的內(nèi)涵,這是需要突破的,至少在認(rèn)識(shí)上要突破,如果我們從已有的控制理論框架去思考問題,我們的思維就有可能局限于這個(gè)框架,心里往往想的是如何去繼續(xù)做,然后產(chǎn)生一個(gè)好摘的果子都摘完的感覺,但是如過從研究初心出發(fā),奔著解決問題去,不要排斥任何東西,強(qiáng)化學(xué)習(xí)也好,博弈論也罷,這些東西在他們各自領(lǐng)域閃閃發(fā)光,把他們搬過來,能不能用到我們這里?
6.結(jié)語
經(jīng)歷二十余年,多智能體控制領(lǐng)域即使“單純羅列概念得用一張A4紙”,這條擁擠的賽道有人退出,有人泛化,有人繼續(xù),也有新人在門外張望,又是一年畢業(yè)季和申博讀研擇校招生季,祝好吧。