出品:科普中國
作者:王琛 (中國科學(xué)院計算技術(shù)研究所)
監(jiān)制:中國科普博覽
編者按:為展現(xiàn)智能科技動態(tài),科普中國前沿科技項目推出“人工智能”系列文章,一窺人工智能前沿進(jìn)展,回應(yīng)種種關(guān)切與好奇。讓我們共同探究,迎接智能時代。
現(xiàn)在“AI for Science(人工智能驅(qū)動的科學(xué)研究)”已成為全球人工智能新前沿。什么是AI for Science?是如何發(fā)揮作用的?有哪些關(guān)鍵問題?我們來一起探索一下。
什么是AI for Science?
近年來,人工智能(AI)技術(shù)發(fā)展迅猛。20世紀(jì)末,人工智能在手寫數(shù)字識別方面取得了較高的準(zhǔn)確率,并在國際象棋中擊敗了人類。2017年,圍棋人工智能超過了人類職業(yè)頂尖水平。
過去五年間,人工智能在圖像生成、自動駕駛、聊天機(jī)器人、視頻生成、音樂生成等領(lǐng)域取得了重大突破。人工智能技術(shù)的發(fā)展達(dá)到了前所未有的高度。
AI機(jī)器人棋手和選手下棋
(圖片來源:南方日報)
自動駕駛(蘿卜快跑)
(圖片來源:新華網(wǎng))
當(dāng)今世界,科學(xué)技術(shù)是第一生產(chǎn)力。除了上述領(lǐng)域之外,人們希望能夠使用人工智能來驅(qū)動科學(xué)研究,為科技發(fā)展提供幫助,這被稱為AI for Science(人工智能驅(qū)動的科學(xué)研究)。
科學(xué)研究是一個多方面的過程,一般包括假說的提出、實驗的設(shè)計、數(shù)據(jù)的收集與分析。AI for Science的目標(biāo)是使用人工智能來增強(qiáng)和加速這其中的每一個階段,使科學(xué)研究變得更加高效。
AI for Science在科學(xué)研究中的作用
(圖片來源:參考文獻(xiàn)1)
早在20世紀(jì)50年代人工智能誕生初期,科學(xué)家們就試圖使用計算機(jī)來解決科學(xué)問題,這個時期的研究主要集中在數(shù)學(xué)和物理學(xué)領(lǐng)域,利用計算機(jī)進(jìn)行數(shù)值模擬和復(fù)雜計算,這也推動了計算機(jī)技術(shù)的進(jìn)步。
20世紀(jì)80年代,專家系統(tǒng)開始興起,專家系統(tǒng)內(nèi)含有特定領(lǐng)域的專家知識和經(jīng)驗,它可以使用這些知識和經(jīng)驗通過邏輯學(xué)進(jìn)行推理與判斷,模擬人類專家去解決特定領(lǐng)域的問題。
隨著近20年來機(jī)器學(xué)習(xí)技術(shù)的成熟,人工智能不再局限于傳統(tǒng)的邏輯推斷,而是能夠從大量的數(shù)據(jù)之中挖掘出數(shù)據(jù)的內(nèi)在聯(lián)系,在數(shù)學(xué)、物理、化學(xué)、天文、生物等學(xué)科中取得了重要成果?,F(xiàn)在AI for Science已經(jīng)成為全球人工智能新前沿。
人工智能在各個領(lǐng)域的應(yīng)用
(圖片來源:參考文獻(xiàn)1)
AI for Science是如何發(fā)揮作用的?
人類科學(xué)歷史的發(fā)展經(jīng)歷了四個階段,經(jīng)驗科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)科學(xué)。
在經(jīng)驗科學(xué)階段,科學(xué)發(fā)展依賴于對自然現(xiàn)象的觀察與總結(jié)。例如,16世紀(jì)哥白尼通過觀察行星運(yùn)動提出了日心說。
在理論科學(xué)階段,人們不僅總結(jié)自然現(xiàn)象的規(guī)律,還探討其背后的科學(xué)理論,17世紀(jì)牛頓總結(jié)出的物體運(yùn)動的三個基本定律是這一階段的代表之一。
20世紀(jì),隨著計算機(jī)的發(fā)展,人們進(jìn)入了計算科學(xué)階段,借助計算機(jī)的強(qiáng)大計算能力,人們可以根據(jù)物理定律進(jìn)行建模和模擬,如流體運(yùn)動仿真和氣象預(yù)測。
21世紀(jì),大數(shù)據(jù)技術(shù)的興起推動了數(shù)據(jù)科學(xué)的發(fā)展,科學(xué)家通過處理與分析海量的實驗數(shù)據(jù),從中發(fā)現(xiàn)新的科學(xué)規(guī)律。
AI for Science是一個新興的科學(xué)研究手段,是這四個發(fā)展階段科學(xué)研究方法的有機(jī)結(jié)合。它使用已知的科學(xué)規(guī)律進(jìn)行建模,同時又挖掘海量數(shù)據(jù)的規(guī)律,在計算機(jī)的強(qiáng)大算力的加持下,進(jìn)行科學(xué)問題的研究。
人工智能(AI)作為計算機(jī)學(xué)科的一個新興分支,它在科研領(lǐng)域發(fā)揮的作用與傳統(tǒng)的計算機(jī)科學(xué)不同。計算機(jī)最早是為了輔助人類計算而發(fā)明的,它計算速度快、準(zhǔn)確度高、可以自動化執(zhí)行,在科研領(lǐng)域產(chǎn)生了重要的影響。
但傳統(tǒng)計算機(jī)只是代替人類完成復(fù)雜繁瑣的計算,而人工智能更加追求“智能”,希望計算機(jī)能夠代替人類的智能,像人類一樣學(xué)習(xí)、推理與決策。
下面,我們通過一個例子來介紹 AI for Science 的具體應(yīng)用。
AI for Science的應(yīng)用-機(jī)器化學(xué)家
最近,中國科學(xué)技術(shù)大學(xué)的研究人員開發(fā)了全球首個集閱讀文獻(xiàn)、設(shè)計實驗、自主優(yōu)化等功能于一體,覆蓋化學(xué)品開發(fā)全流程的機(jī)器化學(xué)家平臺,它被科研人員形象地稱為“機(jī)器化學(xué)家”。
“機(jī)器化學(xué)家”在做實驗
(圖片來源:中國科學(xué)技術(shù)大學(xué))
在“高熵非貴金屬產(chǎn)氧催化劑”材料研究中,機(jī)器化學(xué)家展現(xiàn)出了AI for Science的極大潛力。為了尋找合適的材料,按照以往的方法,科研人員要從29種非貴金屬元素中選出5種進(jìn)行超過55萬種配比組合,“試錯”研究可能需要1400年。而有了機(jī)器化學(xué)家的幫助,只需要幾周時間就可以完成。
機(jī)器化學(xué)家首先從文獻(xiàn)數(shù)據(jù)庫中閱讀1.6萬篇相關(guān)論文,總結(jié)規(guī)律然后挑選出可能滿足要求的材料組合,使用計算機(jī)進(jìn)行模擬計算。它將模擬計算進(jìn)一步挑選出的材料組合進(jìn)行自動化實驗以驗證材料的真實性能。它可以根據(jù)預(yù)先設(shè)定好的流程利用自動化技術(shù)自動完成從材料合成到性能測試的全流程實驗,并對實驗數(shù)據(jù)進(jìn)行處理與分析,最終挑選出合適的材料。
機(jī)器化學(xué)家的優(yōu)勢在于它將大數(shù)據(jù)與人工智能相結(jié)合,利用人工智能進(jìn)行人類難以完成的海量文獻(xiàn)閱讀,并從中獲取經(jīng)驗。在獲取經(jīng)驗的基礎(chǔ)上,機(jī)器化學(xué)家自主提出可能的方案并進(jìn)行實驗驗證,從而代替了先前需要大量人工的試錯過程,加速了科學(xué)研究的進(jìn)展。
AI for Science有哪些關(guān)鍵問題?
在AI for Science發(fā)展的過程中,它仍然面臨著以下幾個關(guān)鍵問題:數(shù)據(jù)、算法、算力、人才。
數(shù)據(jù)問題:為了讓人工智能能夠自主決策,科學(xué)家需要提供數(shù)據(jù)以供學(xué)習(xí),如何獲取高質(zhì)量的數(shù)據(jù)已經(jīng)成為了提高人工智能能力的瓶頸。特別是在科研領(lǐng)域,科學(xué)家面臨的問題都是人類知識的邊界,人工智能所能利用的數(shù)據(jù)比其它領(lǐng)域更為稀少。
在機(jī)器化學(xué)家的研發(fā)中,為了獲得足夠的數(shù)據(jù),研究人員用了3年時間收集教科書、論文、專利中“沉淀”的化學(xué)經(jīng)驗和知識。但這些數(shù)據(jù)來源繁雜,質(zhì)量參差不齊,仍然需要進(jìn)一步豐富和優(yōu)化。
算法問題:在人工智能應(yīng)用于具體的科學(xué)領(lǐng)域時,人工智能并不能從零開始依據(jù)數(shù)據(jù)學(xué)習(xí)到所有的規(guī)律,這就需要相應(yīng)領(lǐng)域的專家依據(jù)當(dāng)前領(lǐng)域已有的規(guī)律或經(jīng)驗為人工智能設(shè)計對應(yīng)的算法。不僅需要AI for Science,有時也需要Science for AI,如何進(jìn)行計算機(jī)科學(xué)與其它各領(lǐng)域的交叉融合也是一個重要的問題。
算力問題:人工智能模型的訓(xùn)練以及應(yīng)用需要大量的算力作為支撐,歸根到底人工智能仍然是計算機(jī)技術(shù),計算機(jī)的性能會制約人工智能的能力。在機(jī)器化學(xué)家的訓(xùn)練迭代和應(yīng)用過程中,需要消耗大量算力。因此,為了讓人工智能取得廣泛應(yīng)用,高性能計算機(jī)的研發(fā)是不可或缺的。
人才問題:在AI for Science中,人工智能始終是輔助科研人員進(jìn)行研究的技術(shù),它尚未發(fā)展至可以完全不依賴于人的控制自行解決所有問題的程度,因此我們需要更多的科研人員參與進(jìn)來,推動AI for Science的發(fā)展。機(jī)器化學(xué)家正是在一批多學(xué)科背景的科研人員的通力合作、協(xié)同攻關(guān)下取得了成功。
期待在未來,隨著人工智能的發(fā)展,AI for Science可以在科學(xué)領(lǐng)域產(chǎn)出更多的成果,促進(jìn)人類的科技進(jìn)步。
參考文獻(xiàn):
1.Wang, H., Fu, T., Du, Y. et al. Scientific discovery in the age of artificial intelligence. Nature 620, 47–60 (2023).