作為推動人工智能(AI)行業(yè)快速發(fā)展的三大要素之一,算力是 AI 發(fā)展的重要基礎(chǔ)。如果算力跟不上算法、數(shù)據(jù)的發(fā)展,AI 行業(yè)也很難有新的顛覆性突破出現(xiàn)。
而芯片,是算力的核心,決定了平臺的基礎(chǔ)設(shè)施和發(fā)展生態(tài)。
近日,包括 OpenAI 人員在內(nèi)的 19 位業(yè)內(nèi)專家在一篇最新報告中將硬件作為 AI 安全治理的重點。這在一定程度上表明,芯片在 AI 行業(yè)的發(fā)展中正起著越來越重要的作用。
然而,當(dāng)前用于 ChatGPT、Sora 等模型訓(xùn)練的 AI 芯片大多依賴電力供能,巨大的使用需求讓其成為了龐大的耗能體。
例如,作為最熱門的 AI 處理器之一,英偉達的 AI 芯片 H100 的峰值功耗高達 700 瓦,超過了普通美國家庭的平均功耗。專家預(yù)測,隨著大量 H100 芯片被部署,其總功耗將與一座美國大城市不相上下,甚至超過一些歐洲的小國家。
圖|英偉達AI處理器 DGX H100。
因此,研發(fā)節(jié)能高效的 AI 芯片已成為學(xué)界、業(yè)界高度關(guān)注的研究方向之一,對 AI 行業(yè)的可持續(xù)發(fā)展至關(guān)重要。
如今,來自美國賓夕法尼亞大學(xué)、諾基亞貝爾實驗的研究團隊提出了一種新型 AI 芯片——利用光波進行復(fù)雜數(shù)學(xué)運算,從而提升計算機處理速度并降低能耗。這一研究成果有望為解決當(dāng)前芯片能耗問題帶來新的可能。
相關(guān)研究論文以“Inverse-designed low-index-contrast structures on silicon photonics platform for vector-matrix multiplication”為題,已發(fā)表在 Nature 子刊 Nature Photonics 上。
該論文的通訊作者、本杰明·富蘭克林獎?wù)芦@得者、賓夕法尼亞大學(xué) H. Nedwill Ramsey 教授 Nader Engheta 表示,由于生產(chǎn)芯片的商業(yè)代工廠的限制,這種設(shè)計已經(jīng)可以用于商業(yè)應(yīng)用,并有可能被改裝用于圖形處理器(GPU)?!八鼈兛梢圆捎霉韫庾庸镜钠脚_作為附加組件,這樣就可以加快訓(xùn)練和分類的速度?!?/p>
此外,Engheta 教授也表示,除了速度更快、能耗更低之外,這種硅光子芯片還具有隱私方面的優(yōu)勢:由于許多計算可以同時進行,因此無需在計算機的工作內(nèi)存中存儲敏感信息,這使得未來采用這種技術(shù)的計算機幾乎無法被黑客攻擊。
提速、節(jié)能,硅光子芯片是如何做到的?
目前,AI 算法呈現(xiàn)出復(fù)雜化和高度并行化的趨勢,需要進行大量的數(shù)學(xué)運算,如矩陣乘法、向量運算等。而傳統(tǒng)的計算設(shè)備往往無法滿足這種高速、高效的計算需求。
在進行復(fù)雜數(shù)學(xué)運算時,傳統(tǒng)計算設(shè)備往往消耗大量能源,能耗已成為制約 AI 技術(shù)發(fā)展的重要因素之一。而利用光波進行計算的新型芯片具有能耗低、高效等優(yōu)點,可以有效解決能耗問題,推動 AI 技術(shù)的可持續(xù)發(fā)展。
光子學(xué)作為一門新興的技術(shù)領(lǐng)域,在 AI 領(lǐng)域的應(yīng)用前景廣闊。利用光波進行復(fù)雜數(shù)學(xué)運算,不僅可以提高計算速度、降低能耗,還可以在硅光子平臺等基礎(chǔ)上實現(xiàn)更多功能,如量子計算、光學(xué)神經(jīng)網(wǎng)絡(luò)等,為 AI 技術(shù)的發(fā)展開辟新的技術(shù)可能性。
研究團隊通過使用將納米材料與硅光子平臺相結(jié)合的方法,成功實現(xiàn)光波與物質(zhì)的相互作用,從而得到高效的數(shù)學(xué)運算。這項技術(shù)的實現(xiàn)主要有 3 個關(guān)鍵點:
首先是光波計算。光波是一種電磁波,具有高速傳輸、高頻率和低能耗的特點。通過利用光波的這些特性,可以實現(xiàn)高效的數(shù)學(xué)計算。
其次是納米材料。納米材料尺寸微小,可以在納米尺度上進行精確控制。通過在納米材料上施加電場或光場等外界作用,可以實現(xiàn)對光波的精確調(diào)控和控制。
此外,新型芯片還利用了硅光子平臺。硅光子學(xué)是利用硅基材料制造光電子器件的技術(shù),具有集成度高、成本低廉、光電轉(zhuǎn)換效率高等優(yōu)點。在新型芯片中,硅光子平臺用于實現(xiàn)光波的傳輸、調(diào)制和探測。
圖|基于硅光子學(xué)的逆向設(shè)計元結(jié)構(gòu),用于執(zhí)行 2 × 2 和 3 × 3 矢量矩陣乘法。
硅光子平臺為光波傳輸提供通道,經(jīng)過調(diào)制的光波可以在芯片內(nèi)部進行自由傳輸,完成各種數(shù)學(xué)運算操作。在完成數(shù)學(xué)運算后,通過在芯片中添加光波探測器,可以實現(xiàn)對光波的快速檢測和信號讀取,完成對光波的探測和檢測,從而得到最終的計算結(jié)果。
圖|模擬與實驗結(jié)果比較。a)實驗的顯微照片,顯示了幾個 2 × 2 和 3 × 3 內(nèi)核和各種校準(zhǔn)結(jié)構(gòu),3 × 3 內(nèi)核已放大顯示;b、c)測量的透射率值的比較;d、e)分別是 2 × 2 和 3 × 3 元結(jié)構(gòu)的測量透射率值(細(xì)實線)和 3D 模擬結(jié)果(粗實線)與波長的關(guān)系。垂直灰線為 λ0 = 1.525 μm 處的設(shè)計波長。盡管 p2DEIA(parametric 2D electromagnetic inverse algorithm)模型存在限制且測量存在缺陷,但目標(biāo)、p2DEIA、3D 和 λ0 = 1.525 μm 處的測量透射值之間的良好一致性表明 p2DEIA 作為計算工具可成功用于 3D 平面結(jié)構(gòu)的逆向設(shè)計。
需要注意的是,盡管該項研究取得了一些重要的進展,并為 AI 行業(yè)提供了新的解決方案,但仍然存在一些局限性,如下:
1. 界面誤差影響:該論文提到,p2DEIA 模型在處理大型結(jié)構(gòu)時可能引入一些界面誤差。這些誤差可能源于接口處的模型不完全匹配或未考慮到的出射散射。對于更大的結(jié)構(gòu),這種誤差可能會進一步增加,因此可能需要更復(fù)雜的接口模型來準(zhǔn)確描述出射散射和非傳播模式的存儲能量。
2. 計算資源需求:雖然 p2DEIA 模型能夠在處理大型結(jié)構(gòu)時顯著減少計算資源的需求,但對于更大的結(jié)構(gòu),仍可能需要更多的計算資源來進行模擬和優(yōu)化。特別是在進行大規(guī)模逆向設(shè)計時,需要進行數(shù)百次迭代的模擬,這可能需要更強大的計算設(shè)施。
3. 光子集成技術(shù)限制:雖然論文中提到了將納米材料與硅光子平臺相結(jié)合的方法,但該方法仍然受到光子集成技術(shù)的一些限制。例如,可能存在制造納米結(jié)構(gòu)的復(fù)雜性,以及與硅光子平臺的集成可能會受到材料兼容性和工藝兼容性的影響。
4. 應(yīng)用場景適用性:雖然該項研究展示了在處理大規(guī)模數(shù)據(jù)時的潛在優(yōu)勢,但是在實際應(yīng)用中,這些芯片的性能和適用性可能會受到特定應(yīng)用場景的限制。不同的應(yīng)用場景可能在能耗、速度、精度等方面有不同的要求,需要對芯片進行進一步的優(yōu)化和定制化。
低功耗已成新型芯片必備特點
近年來,為應(yīng)對 AI 算法的快速發(fā)展和應(yīng)用需求,學(xué)界、業(yè)界在 AI 芯片領(lǐng)域已經(jīng)取得了一些重要進展,主要集中在提升計算性能、降低能耗、增強硬件智能等方面。
1. 基于 GPU 的加速器:GPU 加速器已成為 AI 計算的主流選擇之一。通過利用 GPU 的并行計算能力,可以大幅提升 AI 算法的運行速度。近年來,為滿足人工智能應(yīng)用的需求,NVIDIA 等公司不斷推出性能更強大、功耗更低的 GPU 產(chǎn)品。
2. ASIC 芯片的發(fā)展:ASIC(專用集成電路)芯片是針對特定應(yīng)用場景進行定制設(shè)計的芯片,具有性能高、功耗低的特點。近年來,一些公司推出了針對 AI 算法優(yōu)化的 ASIC 芯片,如 Google 的 TPU(Tensor Processing Unit)和 NVIDIA 的 Tesla 系列。這些芯片在深度學(xué)習(xí)算法的訓(xùn)練和推理等方面表現(xiàn)出色,在性能上取得了顯著的提升。
3. FPGA 芯片的應(yīng)用:FPGA(現(xiàn)場可編程門陣列)芯片具有靈活性高、功耗低的特點,適合用于加速 AI 算法的運行。一些研究團隊正在探索如何利用 FPGA 芯片實現(xiàn)深度學(xué)習(xí)算法的加速。通過對算法進行硬件優(yōu)化和并行化設(shè)計,可以在 FPGA 芯片上實現(xiàn)較高的性能和能效比。
4. 神經(jīng)形態(tài)芯片的研究:神經(jīng)形態(tài)芯片是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和工作原理的新型芯片。它具有并行性強、能耗低的特點,適合用于實現(xiàn)智能感知和學(xué)習(xí)功能。一些研究機構(gòu)和公司正在開展神經(jīng)形態(tài)芯片的研究,試圖實現(xiàn)更加智能化的 AI 計算設(shè)備。
然而,新型芯片從誕生到成熟應(yīng)用,還有很長的路要走。
未來,新型芯片仍需要進一步提升其計算性能和能耗效率,實現(xiàn)更高效的數(shù)據(jù)處理和智能計算。此外,加強新型芯片與現(xiàn)有計算平臺和設(shè)備的兼容性,實現(xiàn)系統(tǒng)級集成。而且,新型芯片也需要與各個領(lǐng)域融合,包括自動駕駛、醫(yī)療健康、智能制造等。
參考鏈接:
https://www.nature.com/articles/s41566-024-01394-2
https://ieeexplore.ieee.org/document/8945797
https://pubs.rsc.org/en/content/articlehtml/2020/lc/d0lc00521e