【導(dǎo)語(yǔ)】博弈論又稱對(duì)策論,是一門研究沖突與合作的學(xué)問(wèn)?,F(xiàn)實(shí)中博弈論的應(yīng)用廣泛,小到個(gè)人決策大到國(guó)家關(guān)系等。“漫談系統(tǒng)”廣播第三季時(shí),中國(guó)系統(tǒng)工程學(xué)會(huì)第四屆青年科技獎(jiǎng)獲得者、北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院曹志剛教授介紹了合作博弈論中的囚徒困境。時(shí)隔一年,已成為中國(guó)系統(tǒng)工程學(xué)會(huì)十一屆理事會(huì)理事,負(fù)責(zé)教育與普及工作委員會(huì)工作事務(wù)的學(xué)會(huì)副秘書(shū)長(zhǎng),醉心于博弈論研究的曹老師繼續(xù)“漫談系統(tǒng)”廣播第四季里繼續(xù)講述博弈論的有趣的話題。2022年11月30日美國(guó)OpenAI 公司發(fā)布了基于大語(yǔ)言模型的聊天機(jī)器人程序ChatGPT,它能夠通過(guò)理解和學(xué)習(xí)人類的語(yǔ)言來(lái)進(jìn)行對(duì)話,能根據(jù)聊天的上下文互動(dòng),真正像人類一樣對(duì)話交流,甚至能完成撰寫(xiě)郵件、視頻腳本、文案、翻譯、代碼,寫(xiě)作等諸多任務(wù)。在“漫談系統(tǒng)”廣播第四季的開(kāi)篇,曹志剛教授帶來(lái)大語(yǔ)言模型對(duì)博弈論發(fā)展的可能的影響。
大家好,我是北京交通大學(xué)的曹志剛。這期節(jié)目我們蹭熱點(diǎn),聊聊ChatGPT對(duì)博弈論的啟發(fā)。
其實(shí)呢,這個(gè)熱點(diǎn)還真不是硬蹭的,因?yàn)槔斫釩hatGPT和博弈論有一個(gè)共同的核心關(guān)鍵詞,那就是語(yǔ)言。ChatGPT自然不用多說(shuō),它是大語(yǔ)言模型的代表,是人工智能在自然語(yǔ)言處理方面的巨大突破。而博弈論也是一種語(yǔ)言,是分析沖突與合作的標(biāo)準(zhǔn)語(yǔ)言。另外,語(yǔ)言的演化本身也是一種博弈,是協(xié)同博弈。著名的博弈論學(xué)家Rubinstein還出版過(guò)用博弈論研究語(yǔ)言演化的專著。
我們首先得清楚,對(duì)于人類而言,語(yǔ)言是件不得了的事情。人類是地球上唯一使用復(fù)雜語(yǔ)言的動(dòng)物,語(yǔ)言是我們與其他生物最顯著的區(qū)別之一。作為對(duì)比,人類的視覺(jué)和聽(tīng)覺(jué)并沒(méi)有太多值得稱道的,這也是人工智能在圖像和聲音處理方面的突破遠(yuǎn)沒(méi)有在語(yǔ)言方面突破來(lái)得意義重大的原因。
語(yǔ)言允許我們用抽象的符號(hào)來(lái)表達(dá)情感、意愿和思想,從而促進(jìn)人類之間的交流,使得復(fù)雜大規(guī)模合作成為可能,人類得以成為社會(huì)的動(dòng)物。這種社會(huì)性是我們?nèi)祟愖鳛橹侨四軌虼驍∧岚驳铝腥说年P(guān)鍵。語(yǔ)言交流還產(chǎn)生了哲學(xué)、科學(xué)、藝術(shù)和文學(xué)等附屬產(chǎn)品,幫助我們建立了風(fēng)俗、文化、法律等各種非正式或正式的社會(huì)制度,使我們共同應(yīng)對(duì)生存和發(fā)展中的各種不確定性。無(wú)需多說(shuō),語(yǔ)言跟思維、智能和理性的關(guān)系更是異常密切。很難想象沒(méi)有語(yǔ)言的話人類能發(fā)展到今天的文明,也很難想象任何一種生物自發(fā)演化出像人類這樣復(fù)雜的語(yǔ)言但是沒(méi)有高度的文明。
博弈論也是一種語(yǔ)言?;谥T如參與人、策略、納什均衡、特征函數(shù)、核等概念和術(shù)語(yǔ),博弈論構(gòu)建了一整套描述分析沖突與合作問(wèn)題的規(guī)范語(yǔ)言。在馮諾依曼和納什正式建立博弈論之前,由于缺乏均衡的概念和思想,很難嚴(yán)謹(jǐn)分析和描述各種互動(dòng)決策環(huán)境,諸如《孫子兵法》之類的著作,盡管非常偉大留下很多重要的軍事學(xué)思想,并不是決策科學(xué)意義上的著作,因?yàn)闆](méi)有抽象出足夠合適的概念,沒(méi)有形成一套完整的分析框架和語(yǔ)言。目前博弈論已經(jīng)成功應(yīng)用于社會(huì)科學(xué)的幾乎所有分支,被譽(yù)為“社會(huì)科學(xué)里的微積分”。正如數(shù)學(xué)之于自然科學(xué),其意義不僅僅是提供了強(qiáng)大的分析工具,還在于提供了一種描述問(wèn)題的精準(zhǔn)語(yǔ)言。博弈論對(duì)于社會(huì)科學(xué)的意義也是如此。
博弈論的研究通常用到較多數(shù)學(xué),博弈論中描述的參與人也經(jīng)常依賴復(fù)雜計(jì)算進(jìn)行決策。但現(xiàn)實(shí)世界中人們?cè)谶M(jìn)行決策和博弈時(shí),并不總是像博弈理論中所假設(shè)的那樣精通計(jì)算和依賴計(jì)算,而是常常借助語(yǔ)言進(jìn)行評(píng)估和決策,正如我們通常借助語(yǔ)言進(jìn)行思維一樣。這是一種非常有趣的有限理性。對(duì)這種有限理性很難數(shù)學(xué)建模,比如討價(jià)還價(jià)或者談判是博弈論的重要研究?jī)?nèi)容,但是模型里通常設(shè)置嚴(yán)格的談判程序,不是依賴語(yǔ)言的自由談判。
作為一種強(qiáng)大的語(yǔ)言模型,ChatGPT的出現(xiàn)和普及可能為博弈論的發(fā)展帶來(lái)一定的機(jī)遇和挑戰(zhàn)。我們今天主要來(lái)談?wù)凜hatGPT對(duì)現(xiàn)實(shí)中的博弈以及博弈論教學(xué)的可能影響,暫時(shí)不去談ChatGPT對(duì)博弈論學(xué)術(shù)研究的機(jī)遇和挑戰(zhàn)。
根據(jù)賓默爾三原則,博弈論目前的分析框架只在博弈規(guī)則清晰簡(jiǎn)單,參與人的激勵(lì)足夠強(qiáng)且有糾錯(cuò)機(jī)制的時(shí)候才比較靠譜。博弈論在現(xiàn)實(shí)世界中的真正應(yīng)用受到很多限制,特別是環(huán)境比較復(fù)雜或者決策比較緊急的時(shí)候,很難有量化的嚴(yán)謹(jǐn)?shù)牟┺哪P蛠?lái)輔助決策。決策者通常需要依賴經(jīng)驗(yàn)、直覺(jué)、簡(jiǎn)單的推理評(píng)估以及朋友或者咨詢機(jī)構(gòu)的建議進(jìn)行決策。ChatGPT作為一種強(qiáng)大又便捷的的語(yǔ)言模型,可以扮演咨詢機(jī)構(gòu)的角色,在促進(jìn)現(xiàn)實(shí)世界中博弈論應(yīng)用方面具有巨大潛力。
首先,ChatGPT可以幫助人們提高博弈效率,因?yàn)榻柚鶦hatGPT,用戶可以在復(fù)雜的博弈場(chǎng)景中快速進(jìn)行策略評(píng)估和選擇。通過(guò)實(shí)時(shí)提供策略建議和概率估計(jì),ChatGPT可以幫助用戶在短時(shí)間內(nèi)作出更明智的決策,從而提高決策效率。比如ChatGPT可以模擬律師協(xié)助我們進(jìn)行合同談判和資源分配等問(wèn)題。也已經(jīng)有人借助ChatGPT進(jìn)行申訴從航空公司得到了飛機(jī)延誤理賠。這類糾紛在沒(méi)有ChatGPT這類工具的時(shí)候可能會(huì)因談判成本過(guò)高而放棄。
其次,ChatGPT可以幫助用戶降低博弈策略的實(shí)施難度。比如不依賴特定的工具,我們很難完美執(zhí)行混合策略。而ChatGPT是個(gè)軟件,可以輕松生成隨機(jī)數(shù),協(xié)助我們實(shí)施混合策略。大家可能不知道,著名的蘭德公司出版過(guò)厚厚的一本全是隨機(jī)數(shù)的書(shū),作用就是幫助大家實(shí)施混合策略。
另外,在現(xiàn)實(shí)世界中,許多博弈問(wèn)題涉及參與者的復(fù)雜的信息結(jié)構(gòu)。借助ChatGPT,用戶可以更容易地理解和分析博弈局勢(shì),找到更好的博弈策略。比如已經(jīng)有人在嘗試用ChatGPT來(lái)模擬狼人殺,盡管目前的效果并不十分理想。
我們知道,ChatGPT對(duì)整個(gè)教育行業(yè)都帶來(lái)了巨大沖擊,博弈論的教學(xué)當(dāng)然也不例外。博弈論學(xué)習(xí)中經(jīng)常涉及許多復(fù)雜的概念和術(shù)語(yǔ),對(duì)于初學(xué)者而言,理解和掌握這些概念和術(shù)語(yǔ)可能具有一定的挑戰(zhàn)性。作為一種強(qiáng)大的語(yǔ)言模型,ChatGPT在提供直觀的解釋方面具有重要價(jià)值。ChatGPT可以將復(fù)雜的數(shù)學(xué)概念和博弈策略用自然語(yǔ)言解釋,并通過(guò)例子進(jìn)行說(shuō)明,使其更易于理解。
ChatGPT在編程方面已經(jīng)發(fā)揮了巨大威力。由于代碼本質(zhì)上也是一種語(yǔ)言,我們相信ChatGPT在協(xié)助學(xué)生學(xué)習(xí)博弈論這門語(yǔ)言的時(shí)候也能發(fā)揮其巨大威力。
節(jié)目最后,我們要感謝一下ChatGPT,因?yàn)楸酒诠?jié)目的文字稿寫(xiě)作過(guò)程中得到了它的協(xié)助。
作者簡(jiǎn)介:曹志剛教授長(zhǎng)期從事合作博弈、交通博弈、網(wǎng)絡(luò)博弈和算法博弈等方面的研究,在Operations Research、Mathematics ofOperations Research和Games and Economic Behavior等期刊發(fā)表多篇論文,并獲得國(guó)家自然科學(xué)基金優(yōu)青項(xiàng)目。