版權歸原作者所有,如有侵權,請聯(lián)系我們

全國科技工作者日 | 仰望星空的“AI巨腦”:中國科研者在路上

重慶市科學技術協(xié)會
原創(chuàng)
重慶市科學技術協(xié)會傾力打造的科普資源共享平臺。
收藏

“你好,我是你的智能助手,請問有什么可以幫您?”

也許你早已習慣了和智能手機、客服機器人“對話”的場景;也許你用過ChatGPT、文心一言這樣的AI生成文字、翻譯、寫代碼。它們背后的核心技術,叫做大語言模型。這是當今人工智能最前沿的代表之一——能讀、能寫、能答題,甚至能“講故事”,像一個永不疲倦的智慧圖書館。

圖片來源:百度文心一言首頁

而你或許不知道,在它們順暢回應你的那一刻,藏著成千上萬名中國科研工作者夜以繼日的努力。他們在沒有頂級算力、沒有完整生態(tài)的條件下,從零構建出屬于中國自己的“AI語言大腦”,用技術和汗水書寫下這個時代的科技答卷。

1、超級“語言大腦”是如何煉成的?

所謂“大語言模型”,指的是一種通過學習大量文本數(shù)據(jù),從而具備語言理解與生成能力的人工智能系統(tǒng)。它不是真正“懂”語言,而是通過龐大的參數(shù)和復雜的訓練機制,讓機器學會了“預測下一個詞”。這個過程,需要成百上千億級的模型參數(shù)、千萬本書的總信息量、數(shù)周甚至數(shù)月的訓練時間。

比如ChatGPT,背后是OpenAI花費數(shù)億美元、使用幾千張高端GPU顯卡和超大語料訓練出的成果。而在中國,自主研發(fā)出擁有數(shù)百億甚至千億參數(shù)的語言模型,是科研者面對的一場“硬仗”。

2、國產大模型,破局之路走得很難

研發(fā)大語言模型,最難的不是“寫代碼”,而是“通盤突破”:

01語料難

中文的語言結構更復雜、歧義性更強,公開高質量中文語料少??蒲姓卟坏貌粡木W(wǎng)頁、書籍、論文、論壇中手動清洗出語料,還要過濾“低質文本”和“敏感內容”。一個模型的訓練語料,往往需要上百人投入數(shù)月篩選處理。

02算力緊

大模型訓練是資源密集型工程。以千億參數(shù)模型為例,動輒需要數(shù)千張GPU服務器支持,而在芯片領域,我國受制于供應鏈“卡脖子”。于是科研者用“模型壓縮”“并行調度”等方式做減法,用最少的資源跑出最好的效果。

03對標高

ChatGPT帶來的震撼讓世界意識到:誰掌握了大模型,誰就能在人工智能時代的中占據(jù)重要地位。中國必須有自己的AI底座,自己的語言理解系統(tǒng)。為此,“悟道”“ChatGLM”“文心一言”“天書”“百川”“DeepSeek”等國產大模型接連問世。

根據(jù)國家互聯(lián)網(wǎng)信息辦公室最新披露的數(shù)據(jù)顯示,截至2025年4月,已成功通過備案的人工智能大模型數(shù)量達到了346家——從通用模型,到金融、醫(yī)療、教育等行業(yè)專用模型,這背后,是無數(shù)科研團隊晝夜鏖戰(zhàn)的成果。

3、那些讓人動容的科研者故事

2023年,天數(shù)智芯的天垓100國產GPU加速卡迎來了一場硬仗——為北京智源研究院訓練70億參數(shù)的Aquila語言模型提供算力支持。面對國產GPU與國際頂尖產品的性能差距,天數(shù)智芯產品線總裁鄒翾帶領團隊展開了一場技術攻堅戰(zhàn)。他們日夜兼程,重構IXCCL通信庫,優(yōu)化混合精度訓練方案,硬是將多卡通信效率提升至98%,最終實現(xiàn)了連續(xù)19天的穩(wěn)定訓練。當Aquila語言模型如期完成訓練并達到預期效果時,這支團隊用行動證明:在算力自主化的道路上,中國人的創(chuàng)新精神永遠不會被硬件條件所限制。

圖源:pexels

在高校、研究所、企業(yè)、實驗室,從“算法調優(yōu)”到“數(shù)據(jù)治理”,從“推理優(yōu)化”到“模型壓縮”,每一個細節(jié)都凝聚著無數(shù)人沉默卻堅定的努力。他們或許不在鏡頭前,不在熱門話題里,卻正是AI革命的無名英雄。

4、把AI寫進中國語言和文化

“我們希望讓AI用中文思考。”這是很多國產大模型團隊的共同目標。

不僅僅是翻譯得通順,更要理解中國語言的語境,理解我們的典故、成語、對聯(lián)、詩詞,甚至是“一個眼神”的情感含義。科研者正在將這些“文化基因”注入AI中。

有人用模型進行古文翻譯,有人訓練AI生成中醫(yī)問診語言,還有人嘗試用AI保護瀕危方言。AI不是替代人類,而是服務社會、傳承文明的新工具。大語言模型正逐漸從科研實驗室走進醫(yī)療、教育、司法、工業(yè)、文旅等多個領域,為人類解決實際問題,也為中國講好自己的故事提供了新的載體。

5、寫在“全國科技工作者

2025年5月30日,是第九個“全國科技工作者日”。我們將目光投向那些或許無名卻做著意義非凡的事情的科技工作者,他們在國產AI道路上,仰望星空,腳踏實地。

在大模型這場沒有硝煙的科技競賽中,他們不僅是工程師,更是文化守望者,是時代的記錄者。他們用代碼構筑語言的秩序,用數(shù)據(jù)打造理解的基石,用算法塑造思維的邏輯。

他們是這個時代最可敬的人之一。

致敬中國每一位科技工作者,向你們說一聲:節(jié)日快樂,未來可期。

供稿單位:重慶理工大學計算機科學與工程學院

作者:重慶理工大學 張佳雯

審核專家:倪偉

聲明:除原創(chuàng)內容及特別說明之外,部分圖片來源網(wǎng)絡,非商業(yè)用途,僅作為科普傳播素材,版權歸原作者所有,若有侵權,請聯(lián)系刪除。

內容資源由項目單位提供

評論
、? !
太師級
2025-05-30
黃家湖玉蘭
庶吉士級
面對語料、算力等挑戰(zhàn),他們通過技術創(chuàng)新和優(yōu)化,成功研發(fā)出擁有數(shù)百億甚至千億參數(shù)的語言模型。這些模型不僅在醫(yī)療、教育、司法等領域得到應用,也在傳承中國文化、服務社會等方面發(fā)揮了重要作用。
2025-05-30
001-科普-001
庶吉士級
而你或許不知道,在它們順暢回應你的那一刻,藏著成千上萬名中國科研工作者夜以繼日的努力。
2025-05-30