圖靈測(cè)試(The Turing Test)起源于計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)艾倫·麥席森·圖靈發(fā)表于1950年的一篇論文《計(jì)算機(jī)器與智能》。該測(cè)試的流程是,一名測(cè)試者寫(xiě)下自己的問(wèn)題,隨后將問(wèn)題以純文本的形式(如計(jì)算機(jī)屏幕和鍵盤(pán))發(fā)送給另一個(gè)房間中的一個(gè)人與一臺(tái)機(jī)器。測(cè)試者根據(jù)他們的回答來(lái)判斷哪一個(gè)是真人,哪一個(gè)是機(jī)器。所有參與測(cè)試的人或機(jī)器都會(huì)被分開(kāi)。這個(gè)測(cè)試旨在探究機(jī)器能否模擬出與人類(lèi)相似或無(wú)法區(qū)分的智能1。
現(xiàn)在的圖靈測(cè)試測(cè)試時(shí)長(zhǎng)通常為5分鐘,如果電腦能回答由人類(lèi)測(cè)試者提出的一系列問(wèn)題,且其超過(guò)30%的回答讓測(cè)試者誤認(rèn)為是人類(lèi)所答,則電腦通過(guò)測(cè)試。2014年6月7日是圖靈逝世60周年紀(jì)念日。這一天,在英國(guó)皇家學(xué)會(huì)舉行的“圖靈測(cè)試”大會(huì)上,聊天程序“尤金·古斯特曼”(Eugene Goostman)首次“通過(guò)”了圖靈測(cè)試。
盡管圖靈測(cè)試在學(xué)術(shù)界引起了廣泛的討論和爭(zhēng)議,但它仍然被視為是評(píng)估人工智能智能程度的經(jīng)典方法。
創(chuàng)始人物
艾倫·麥席森·圖靈(Alan Mathison Turing),英國(guó)數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家、邏輯學(xué)家和密碼分析學(xué)家,被譽(yù)為計(jì)算機(jī)科學(xué)與人工智能之父10。
1931年,圖靈進(jìn)入劍橋大學(xué)國(guó)王學(xué)院,畢業(yè)后到美國(guó)普林斯頓大學(xué)攻讀博士學(xué)位。
1936年,圖靈向倫敦權(quán)威的數(shù)學(xué)雜志投一篇論文,題為《論可計(jì)算數(shù)及其在判定問(wèn)題上的應(yīng)用》11。在這篇開(kāi)創(chuàng)性的論文中,圖靈給“可計(jì)算數(shù)”下了一個(gè)嚴(yán)格的數(shù)學(xué)定義,并提出著名的“圖靈機(jī)”(Turing Machine)的設(shè)想?!皥D靈機(jī)”不是一種具體的機(jī)器,而是一種思想模型,可制造一種十分簡(jiǎn)單但運(yùn)算能力極強(qiáng)的計(jì)算裝置,用來(lái)計(jì)算所有能想象得到的可計(jì)算函數(shù)?!皥D靈機(jī)”與“馮·諾伊曼機(jī)”齊名,被永遠(yuǎn)載入計(jì)算機(jī)的發(fā)展史中。
1950年,圖靈發(fā)表了一篇?jiǎng)潟r(shí)代的論文,文中預(yù)言了創(chuàng)造出具有真正智能的機(jī)器的可能性1。也正是這篇文章,為圖靈贏得了“人工智能之父”的桂冠。圖靈預(yù)測(cè)稱(chēng),到2000年,人類(lèi)應(yīng)該可以用10GB的計(jì)算機(jī)設(shè)備,制造出可以騙過(guò)30%成年人的人工智能。
研究歷程
1936年,哲學(xué)家阿爾弗雷德·艾耶爾思考心靈哲學(xué)問(wèn)題:我們?cè)趺粗榔渌嗽型瑯拥捏w驗(yàn)。在《語(yǔ)言,真理與邏輯》中,艾爾建議區(qū)別有意識(shí)的人類(lèi)及無(wú)意識(shí)的機(jī)器。
1950年,圖靈發(fā)表的《計(jì)算機(jī)器與智能》中預(yù)言了創(chuàng)造出具有真正智能的機(jī)器的可能性。由于注意到“智能”這一概念難以確切定義,他提出了著名的圖靈測(cè)試:如果一臺(tái)機(jī)器能夠與人類(lèi)展開(kāi)對(duì)話(通過(guò)電傳設(shè)備)而不能被辨別出其機(jī)器身份,那么稱(chēng)這臺(tái)機(jī)器具有智能。這一簡(jiǎn)化使得圖靈能夠令人信服地說(shuō)明“思考的機(jī)器”是可能的。論文中還回答了對(duì)這一假說(shuō)的各種常見(jiàn)質(zhì)疑。圖靈測(cè)試是人工智能哲學(xué)方面第一個(gè)嚴(yán)肅的提案。
1956年達(dá)特茅斯會(huì)議之前,英國(guó)研究者已經(jīng)探索十幾年的機(jī)器人工智能研究。比率俱樂(lè)部是一個(gè)非正式的英國(guó)控制論和電子產(chǎn)品研究團(tuán)體,成員包括艾倫·麥席森·圖靈。
1967年由英國(guó)哲學(xué)家費(fèi)麗帕弗特提出。鐵軌上有五個(gè)小孩在玩,停用的岔軌上有一個(gè)小孩在玩,要把車(chē)轉(zhuǎn)移到岔軌上壓死一個(gè)孩子救下五個(gè)嗎?這是一個(gè)非常典型的關(guān)于道德問(wèn)題的直覺(jué)泵。
1980年約翰·塞爾在《心智、大腦和程序》一文中提到的中文屋子思想實(shí)驗(yàn),對(duì)圖靈測(cè)試發(fā)表了批評(píng)。
2014年6月8日,一臺(tái)名為尤金·古斯特曼的計(jì)算機(jī)成功讓人類(lèi)相信它是一個(gè)13歲的男孩,成為有史以來(lái)首臺(tái)通過(guò)圖靈測(cè)試的計(jì)算機(jī)。這被認(rèn)為是人工智能發(fā)展的一個(gè)里程碑事件2。但倫敦帝國(guó)理工學(xué)院教授默里-沙納漢(Murray Shanahan)對(duì)該測(cè)試的有效性和科學(xué)依據(jù)提出質(zhì)疑,認(rèn)為它“完全放錯(cuò)了地方,貶低了真正的人工智能研究的價(jià)值。它讓人覺(jué)得科幻小說(shuō)中的人工智能就快實(shí)現(xiàn)了,而事實(shí)上并沒(méi)有,而且難度大得驚人”6。博客 Techdirt 的編輯邁克-馬斯尼克(Mike Masnick)也持懷疑態(tài)度,他認(rèn)為 “創(chuàng)造一個(gè)能愚弄人類(lèi)的聊天機(jī)器人與創(chuàng)造人工智能其實(shí)不是一回事”7。
2015年11月,《Science》雜志封面刊登了一篇重磅研究:人工智能終于能像人類(lèi)一樣學(xué)習(xí),并通過(guò)了圖靈測(cè)試。測(cè)試的對(duì)象是一種AI系統(tǒng),研究者分別進(jìn)行了展示它未見(jiàn)過(guò)的書(shū)寫(xiě)系統(tǒng)(例如,藏文)中的一個(gè)字符例子,并讓它寫(xiě)出同樣的字符、創(chuàng)造相似字符等任務(wù)。結(jié)果表明這個(gè)系統(tǒng)能夠迅速學(xué)會(huì)寫(xiě)陌生的文字,同時(shí)還能識(shí)別出非本質(zhì)特征(也就是那些因書(shū)寫(xiě)造成的輕微變異),通過(guò)了圖靈測(cè)試,這也是人工智能領(lǐng)域的一大進(jìn)步8。
2023年7月25日,Nature刊登新聞指出ChatGPT已經(jīng)能突破圖靈測(cè)試,并建議尋求新的人工智能評(píng)估方法9。
2024年6月,來(lái)自加利福尼亞大學(xué)圣迭戈分校認(rèn)知科學(xué)家本杰明·伯根(Benjamin Bergen)和卡梅隆·瓊斯(Cameron Jones)的最新研究結(jié)果表明,越來(lái)越多的人難以在圖靈測(cè)試中區(qū)分GPT-4和人類(lèi)。在上述科學(xué)家所做的一項(xiàng)實(shí)驗(yàn)中,500名人類(lèi)與四種AI語(yǔ)言模型進(jìn)行了5分鐘的對(duì)話,其中GPT-4在54%的時(shí)間里被誤認(rèn)為是人類(lèi),這個(gè)比例超過(guò)了此前版本GPT-3.5的相應(yīng)比例(50%)。這一結(jié)果表明,GPT-4已通過(guò)圖靈測(cè)試。
測(cè)試內(nèi)容
圖靈提出了一種測(cè)試機(jī)器是不是具備人類(lèi)智能的方法。即假設(shè)有一臺(tái)電腦,其運(yùn)算速度非??臁⒂洃浫萘亢瓦壿媶卧臄?shù)目也超過(guò)了人腦,而且還為這臺(tái)電腦編寫(xiě)了許多智能化的程序,并提供了合適種類(lèi)的大量數(shù)據(jù),是否就能說(shuō)這臺(tái)機(jī)器具有思維能力。
圖靈肯定機(jī)器可以思考的,他還就智能問(wèn)題從行為主義的角度給出了定義,由此提出假想:即一個(gè)人在不接觸對(duì)方的情況下,通過(guò)一種特殊的方式,和對(duì)方進(jìn)行一系列的問(wèn)答,如果在相當(dāng)長(zhǎng)時(shí)間內(nèi),他無(wú)法根據(jù)這些問(wèn)題判斷對(duì)方是人還是計(jì)算機(jī),那么,就可以認(rèn)為這個(gè)計(jì)算機(jī)具有同人相當(dāng)?shù)闹橇?,即這臺(tái)計(jì)算機(jī)是能思維的。這就是著名的“圖靈測(cè)試”(Turing Testing)。當(dāng)時(shí)全世界只有幾臺(tái)電腦,其他幾乎所有計(jì)算機(jī)根本無(wú)法通過(guò)這一測(cè)試3。
要分辨一個(gè)想法是“自創(chuàng)”的思想還是精心設(shè)計(jì)的“模仿”是非常難的,任何自創(chuàng)思想的證據(jù)都可以被否決。圖靈試圖解決長(zhǎng)久以來(lái)關(guān)于如何定義思考的哲學(xué)爭(zhēng)論,他提出一個(gè)雖然主觀但可操作的標(biāo)準(zhǔn):如果一臺(tái)電腦表現(xiàn)(act)、反應(yīng)(react)和互相作用(interact)都和有意識(shí)的個(gè)體一樣,那么它就應(yīng)該被認(rèn)為是有意識(shí)的。
為消除人類(lèi)心中的偏見(jiàn),圖靈設(shè)計(jì)了一種“模仿游戲”即圖靈測(cè)試:遠(yuǎn)處的人類(lèi)測(cè)試者在一段規(guī)定的時(shí)間內(nèi),根據(jù)兩個(gè)實(shí)體對(duì)他提出的各種問(wèn)題的反應(yīng)來(lái)判斷是人類(lèi)還是電腦。通過(guò)一系列這樣的測(cè)試,從電腦被誤判斷為人的幾率就可以測(cè)出電腦智能的成功程度。
圖靈預(yù)言,在20世紀(jì)末,一定會(huì)有電腦通過(guò)“圖靈測(cè)試”。2014年6月7日在英國(guó)皇家學(xué)會(huì)舉行的“2014圖靈測(cè)試”大會(huì)上,舉辦方英國(guó)雷丁大學(xué)發(fā)布新聞稿,宣稱(chēng)俄羅斯人弗拉基米爾·維西羅夫(Vladimir Veselov)創(chuàng)立的人工智能軟件尤金·古斯特曼(Eugene Goostman)通過(guò)了圖靈測(cè)試。雖然“尤金”軟件還遠(yuǎn)不能“思考”,但也是人工智能乃至于計(jì)算機(jī)史上的一個(gè)標(biāo)志性事件4。
測(cè)試方法
圖靈測(cè)試的方法是:被測(cè)試人,和一個(gè)待測(cè)試的機(jī)器。測(cè)試時(shí),測(cè)試人與被測(cè)試人是分開(kāi)的,測(cè)試人只有以純文本的方式向被測(cè)試人問(wèn)一些問(wèn)題,這些問(wèn)題隨便是什么問(wèn)題都可以。問(wèn)過(guò)一些問(wèn)題后,如果測(cè)試人能夠正確地分出誰(shuí)是人誰(shuí)是機(jī)器,那機(jī)器就沒(méi)有通過(guò)圖靈測(cè)試,如果測(cè)試人沒(méi)有分出誰(shuí)是機(jī)器誰(shuí)是人,那這個(gè)機(jī)器就是有智能的1。
2014的舉辦方英國(guó)雷丁大學(xué)發(fā)布新聞稿,宣稱(chēng)俄羅斯人弗拉基米爾維西羅夫(VIadimir Veselov)創(chuàng)立的人工智能軟件尤金古斯特曼(Eugene Goos man)通過(guò)了圖靈測(cè)試12。如果這—結(jié)論獲得確認(rèn),那么這將是人工智能乃至于計(jì)算機(jī)史上的一個(gè)里程碑事件。
人機(jī)測(cè)試
圖靈采用“問(wèn)”與“答”模式,即觀察者通過(guò)控制打字機(jī)向兩個(gè)測(cè)試對(duì)象通話,其中一個(gè)是人,另一個(gè)是機(jī)器。要求觀察者不斷提出各種問(wèn)題,從而辨別回答者是人還是機(jī)器。圖靈還為這項(xiàng)測(cè)試親自擬定了幾個(gè)示范性問(wèn)題:
問(wèn): 請(qǐng)給我寫(xiě)出有關(guān)“第四號(hào)橋”主題的十四行詩(shī)。
答:不要問(wèn)我這道題,我從來(lái)不會(huì)寫(xiě)詩(shī)。
問(wèn):34957加70764等于多少?
答:(停30秒后)105721
問(wèn):你會(huì)下國(guó)際象棋嗎?
答:是的。
問(wèn):我在我的K1處有棋子K;你僅在K6處有棋子K,在R1處有棋子R。輪到你走,你應(yīng)該下哪步棋?
答:(停15秒鐘后)棋子R走到R8處,將軍!
圖靈指出:“如果機(jī)器在某些現(xiàn)實(shí)的條件下,能夠非常好地模仿人回答問(wèn)題,以至提問(wèn)者在相當(dāng)長(zhǎng)時(shí)間里誤認(rèn)它不是機(jī)器,那么機(jī)器就可以被認(rèn)為是能夠思維的?!?/p>
從表面上看,要使機(jī)器回答按一定范圍提出的問(wèn)題似乎沒(méi)有什么困難,可以通過(guò)編制特殊的程序來(lái)實(shí)現(xiàn)。然而,如果提問(wèn)者并不遵循常規(guī)標(biāo)準(zhǔn),編制回答的程序是極其困難的事情。例如,提問(wèn)與回答呈現(xiàn)出下列狀況:
問(wèn):你會(huì)下國(guó)際象棋嗎?
答:是的。
問(wèn):你會(huì)下國(guó)際象棋嗎?
答:是的。
問(wèn):請(qǐng)?jiān)俅位卮?,你?huì)下國(guó)際象棋嗎?
答:是的。
你多半會(huì)想到,面前的這位是一部笨機(jī)器。如果提問(wèn)與回答呈現(xiàn)出另一種狀態(tài):
問(wèn): 你會(huì)下國(guó)際象棋嗎?
答:是的。
問(wèn):你會(huì)下國(guó)際象棋嗎?
答:是的,我不是已經(jīng)說(shuō)過(guò)了嗎?
問(wèn):請(qǐng)?jiān)俅位卮?,你?huì)下國(guó)際象棋嗎?
答:你煩不煩,干嘛老提同樣的問(wèn)題。
那么,你面前的這位,大概是人而不是機(jī)器。上述兩種對(duì)話的區(qū)別在于,第一種可明顯地感到回答者是從知識(shí)庫(kù)里提取簡(jiǎn)單的答案,第二種則具有分析綜合的能力,回答者知道觀察者在反復(fù)提出同樣的問(wèn)題?!皥D靈測(cè)試”沒(méi)有規(guī)定問(wèn)題的范圍和提問(wèn)的標(biāo)準(zhǔn),如果想要制造出能通過(guò)試驗(yàn)的機(jī)器,以我們的技術(shù)水平,必須在電腦中儲(chǔ)存人類(lèi)所有可以想到的問(wèn)題,儲(chǔ)存對(duì)這些問(wèn)題的所有合乎常理的回答,并且還需要理智地做出選擇。
社會(huì)評(píng)價(jià)
現(xiàn)代計(jì)算機(jī)之父馮·諾依曼生前曾多次謙虛地說(shuō),如果不考慮查爾斯·巴貝奇等人早先提出的有關(guān)思想,現(xiàn)代計(jì)算機(jī)的概念當(dāng)屬于艾倫·圖靈。馮·諾依曼能把“計(jì)算機(jī)之父”的桂冠戴在比自己小10歲的圖靈頭上,足見(jiàn)圖靈對(duì)計(jì)算機(jī)科學(xué)影響之巨大。5
測(cè)試變體
反向圖靈測(cè)試
反向圖靈測(cè)試是由于一個(gè)或多個(gè)角色之間的模擬已經(jīng)在機(jī)器和人之間逆轉(zhuǎn),因此對(duì)圖靈測(cè)試進(jìn)行一定程度的修改,以增強(qiáng)其適用性。R. D. Hinshelwood將“反圖靈測(cè)試”的思維描述為“認(rèn)知識(shí)別裝置”。挑戰(zhàn)在于讓計(jì)算機(jī)確定它是否正在與人類(lèi)或其他計(jì)算機(jī)互動(dòng),這是圖靈試圖回答的原始問(wèn)題的延伸,但能夠提供足夠高的標(biāo)準(zhǔn)以通常所認(rèn)為人類(lèi)特有的方式來(lái)定義一臺(tái)可以“思考”的機(jī)器24。
完全圖靈測(cè)試
普通的圖靈測(cè)試一般避免審問(wèn)者與被測(cè)試計(jì)算機(jī)發(fā)生物理上的互動(dòng),因?yàn)槲锢砩夏M人(比如像模擬人的外表)并不是人工智能的研究范疇。然而一些人工智能可能涉及一些人機(jī)在物理上的交互,所以人們又拓展出了“完全圖靈測(cè)試”25。在完全圖靈測(cè)試中,可以包含必要的人機(jī)在物理層面上的交互。但是為了通過(guò)完全圖靈測(cè)試,還需要在普通圖靈測(cè)試之外另外兩項(xiàng)額外技術(shù)課題。詢(xún)問(wèn)者還可以測(cè)試受試者的感知能力(需要電腦視覺(jué)),和受試者操縱物體的能力(需要機(jī)器人學(xué))。
相關(guān)爭(zhēng)論
1950年,圖靈預(yù)測(cè)“至少需要100年”,機(jī)器才有機(jī)會(huì)通過(guò)圖靈測(cè)試1。這是一個(gè)明智且謹(jǐn)慎的預(yù)測(cè),清楚地表明圖靈意識(shí)到創(chuàng)造一臺(tái)可以通過(guò)圖靈測(cè)試的機(jī)器多么困難。事實(shí)上,圖靈測(cè)試探索了機(jī)器模仿人腦的能力,但僅限于大腦的公開(kāi)語(yǔ)言行為(通過(guò)鍵盤(pán)表達(dá))。雖然語(yǔ)言行為只是人類(lèi)大腦產(chǎn)生的全部行為的一小部分,但圖靈指出,語(yǔ)言問(wèn)答仍然使判斷者能夠在人類(lèi)的幾乎所有領(lǐng)域中探索大腦(或機(jī)器)的能力。他舉的例子包括數(shù)學(xué)、國(guó)際象棋、詩(shī)歌和交流。圖靈認(rèn)為,“機(jī)器能通過(guò)測(cè)試嗎”這個(gè)問(wèn)題與“機(jī)器是否會(huì)思考”不同,但對(duì)于人類(lèi)目前對(duì)機(jī)器的期望來(lái)說(shuō)似乎已經(jīng)足夠接近了14。但不是每個(gè)人都同意圖靈上述兩個(gè)問(wèn)題“足夠接近”的觀點(diǎn),而且在他首次提出測(cè)試60多年后,關(guān)于測(cè)試有效性的爭(zhēng)論至今仍在激烈進(jìn)行15。
倫敦帝國(guó)理工學(xué)院教授默里-沙納漢(Murray Shanahan)對(duì)該測(cè)試的有效性和科學(xué)依據(jù)提出質(zhì)疑,認(rèn)為它“完全放錯(cuò)了地方,貶低了真正的人工智能研究的價(jià)值。它讓人覺(jué)得科幻小說(shuō)中的人工智能就快實(shí)現(xiàn)了,而事實(shí)上并沒(méi)有,而且難度大得驚人”6。博客 Techdirt 的編輯邁克-馬斯尼克(Mike Masnick)也持懷疑態(tài)度,他認(rèn)為 “創(chuàng)造一個(gè)能愚弄人類(lèi)的聊天機(jī)器人與創(chuàng)造人工智能其實(shí)不是一回事”7。
衡量標(biāo)準(zhǔn)
圖靈測(cè)試并沒(méi)有明確規(guī)定其能夠作為衡量智能的標(biāo)準(zhǔn)。該測(cè)試旨在檢驗(yàn)計(jì)算機(jī)是否能模仿人類(lèi)行為,而非直接評(píng)估其智能水平16。一些專(zhuān)家認(rèn)為,圖靈測(cè)試只是展示了欺騙人類(lèi)的容易程度,并非衡量機(jī)器智能的準(zhǔn)確指標(biāo)17。圖靈本人在對(duì)“思考機(jī)器”的可能性進(jìn)行回應(yīng)時(shí),明確指出該測(cè)試只是為了討論研究前進(jìn)的方向,而非直接衡量智能。17
盡管如此,圖靈測(cè)試仍被提出作為衡量機(jī)器“思考能力”或“智能”的方法18。然而,這一提議受到哲學(xué)家和計(jì)算機(jī)科學(xué)家的質(zhì)疑。他們對(duì)于如何判斷提問(wèn)人的可靠性、僅比較行為的價(jià)值以及將機(jī)器與人類(lèi)進(jìn)行比較的意義等提出了質(zhì)疑。
判斷依據(jù)
圖靈測(cè)試的結(jié)果常常受計(jì)算機(jī)模仿人類(lèi)的能力主導(dǎo),而不完全依賴(lài)于提問(wèn)者的技能或態(tài)度。圖靈在描述測(cè)試時(shí),并未具體說(shuō)明測(cè)試人需要的技能,只提到了“普通測(cè)試人”1。例如,ELIZA這類(lèi)聊天機(jī)器人曾使沒(méi)有戒備的人誤以為自己在與人交談,沒(méi)有意識(shí)到他們可能正在與計(jì)算機(jī)互動(dòng)。有效通過(guò)圖靈測(cè)試的關(guān)鍵在于,機(jī)器需要通過(guò)對(duì)話暗示自己的機(jī)器身份,而測(cè)試人需要識(shí)別出這些線索。19如果機(jī)器保持沉默,測(cè)試人難以準(zhǔn)確判斷。20
應(yīng)用價(jià)值
持肯定性觀點(diǎn)的學(xué)者都認(rèn)為,圖靈測(cè)試在人工智能研究和發(fā)展中具有重要的應(yīng)用價(jià)值。弗倫奇(Robert M.French)、庫(kù)伯(Kevin L.Copple)等認(rèn)為,圖靈測(cè)試有助于科學(xué)家們深入研究人類(lèi)的行為表現(xiàn)和人類(lèi)的互動(dòng)行為,從而逐步實(shí)現(xiàn)“更好的人工智能”21。作為一種具體的評(píng)價(jià)方法,圖靈測(cè)試為人工智能領(lǐng)域的研究者提供了一個(gè)具體的檢驗(yàn)智能的途徑,不僅考察了計(jì)算機(jī)在自然語(yǔ)言理解和生成方面的能力,還鼓勵(lì)了研究者探索推理、邏輯等更高級(jí)的智能表現(xiàn)。圖靈測(cè)試也引發(fā)了關(guān)于智能本質(zhì)、意識(shí)是否可以通過(guò)模擬實(shí)現(xiàn)等哲學(xué)問(wèn)題的討論,不僅促進(jìn)了人工智能領(lǐng)域的發(fā)展,也影響了認(rèn)知科學(xué)和哲學(xué)領(lǐng)域的發(fā)展。22
部分人工智能研究人員認(rèn)為,圖靈測(cè)試只會(huì)分散有益的研究注意力。約翰·麥卡錫(John McCarthy)觀察到人工智能的哲學(xué)“不太可能對(duì)人工智能研究的實(shí)踐應(yīng)用產(chǎn)生更多影響,就像哲學(xué)對(duì)科學(xué)實(shí)踐的影響一樣微弱?!?3斯圖爾特·拉塞爾和彼得·諾維格認(rèn)為圖靈測(cè)試并不是許多學(xué)術(shù)或商業(yè)努力的主要焦點(diǎn):首先,有更簡(jiǎn)單的方法來(lái)測(cè)試他們的程序。當(dāng)前與人工智能相關(guān)領(lǐng)域的大部分研究都是針對(duì)特定的目標(biāo),人工智能研究人員只需直接給予它們?nèi)蝿?wù);其次,創(chuàng)造出類(lèi)似真人的模擬是一個(gè)獨(dú)立的復(fù)雜問(wèn)題,不需要為實(shí)現(xiàn)人工智能研究的基本目標(biāo)而解決,在藝術(shù)作品、游戲或復(fù)雜的用戶(hù)界面中,可信的人物角色可能會(huì)引人入勝,但它們并不是創(chuàng)造智能機(jī)器的科學(xué)的一部分,也就是說(shuō),不是用智能來(lái)解決問(wèn)題的機(jī)器。16
相關(guān)獎(jiǎng)項(xiàng)
勒布納獎(jiǎng)(Loebner Prize)每年提供一個(gè)實(shí)際的圖靈測(cè)試平臺(tái),首次比賽于1991年11月舉行。這個(gè)獎(jiǎng)項(xiàng)的發(fā)起人是休·勒布納(Hugh Loebner)。位于美國(guó)馬薩諸塞州的劍橋行為研究中心(Cambridge Center for Behavioral Studies)組織了2003年以前的比賽。勒布納表示,創(chuàng)辦這項(xiàng)競(jìng)賽的一個(gè)原因是推進(jìn)人工智能研究的狀態(tài),至少在某種程度上,因?yàn)樵?0年的討論中,沒(méi)有人采取措施來(lái)實(shí)施圖靈測(cè)試26。勒布納獎(jiǎng)測(cè)試對(duì)話智能,獲獎(jiǎng)?wù)咄ǔJ橇奶鞕C(jī)器人程序或人工對(duì)話實(shí)體(ACE)。早期的勒布納獎(jiǎng)規(guī)則限制了對(duì)話:每個(gè)參賽作品和隱藏的人類(lèi)只能就一個(gè)主題進(jìn)行對(duì)話,因此質(zhì)詢(xún)者在每次實(shí)體交互中只能進(jìn)行一行問(wèn)題的提問(wèn)。這個(gè)限制性的對(duì)話規(guī)則在1995年的勒布納獎(jiǎng)中被取消。在勒布納2003年比賽中,薩里大學(xué)允許每個(gè)質(zhì)詢(xún)者與實(shí)體、機(jī)器或隱藏的人類(lèi)互動(dòng)五分鐘。在2004年到2007年之間的勒布納獎(jiǎng)中,質(zhì)詢(xún)者和實(shí)體之間允許的交互時(shí)間超過(guò)了20分鐘27。
應(yīng)用程序
ELIZA
1966年,美國(guó)麻省理工學(xué)院教授約瑟夫維茲豪曼(Joseph Weizenbaum)編寫(xiě)了聊天機(jī)器人ELIZA程序(Eliza program),它通過(guò)檢查用戶(hù)輸入的評(píng)論中的關(guān)鍵詞來(lái)工作。如果找到關(guān)鍵詞,就會(huì)應(yīng)用一個(gè)轉(zhuǎn)換用戶(hù)評(píng)論的規(guī)則,然后返回結(jié)果句子。如果沒(méi)有找到關(guān)鍵詞,ELIZA要么用一個(gè)通用的應(yīng)答回應(yīng),要么重復(fù)之前的評(píng)論之一。此外,魏岑鮑姆開(kāi)發(fā)了ELIZA,旨在模擬羅杰斯式心理治療師的行為。ELIZA通過(guò)這種方式“假裝幾乎不了解真實(shí)世界”,使其能夠欺騙人們以為他們正在與真人交談。有些人對(duì)ELIZA的表現(xiàn)“很難相信它不是人類(lèi)”。因此,一些人認(rèn)為ELIZA可能是第一款能夠通過(guò)圖靈測(cè)試的程序之一。然而,對(duì)于這種觀點(diǎn),存在很大的爭(zhēng)議。28
尤金·古斯特曼
2014年英國(guó)《每日電訊報(bào)》報(bào)道,一臺(tái)由俄羅斯人弗拉基米爾·維西羅夫(Vladimir Veselov)創(chuàng)立的模擬13歲小男孩的人工智能軟件尤金·古斯特曼(Eugene Goostman)通過(guò)了“標(biāo)志性的”圖靈測(cè)試。29在2014年舉行的共有5臺(tái)超級(jí)計(jì)算機(jī)參賽的圖靈測(cè)試競(jìng)賽上,尤金·古斯特曼設(shè)法讓測(cè)試人相信被測(cè)試者33%的答復(fù)為人類(lèi)所為。這一測(cè)試成功正逢圖靈去世60周年紀(jì)念,被認(rèn)為是人工智能領(lǐng)域里程碑式的突破。雷丁大學(xué)的客座教授Kevin Warwick說(shuō),盡管此前曾有人聲稱(chēng)圖靈測(cè)試已經(jīng)得到通過(guò),但是相比之下,這次活動(dòng)的標(biāo)準(zhǔn)是最為嚴(yán)格的,沒(méi)有對(duì)問(wèn)題做任何預(yù)設(shè)。因此,他們自豪地宣布圖靈測(cè)試首次獲得通過(guò)。