近幾個月來,著名數(shù)學(xué)家陶哲軒一直嘗試用 ChatGPT 等大模型 AI 工具來輔助解決數(shù)學(xué)問題,并與大家分享結(jié)果、交流心得,比如用 ChatGPT 寫代碼、證明數(shù)學(xué)定理、生成 LaTeX 表達式程序代碼等。
對于自己的研究以及人們來說,GPT 等 AI 工具的作用究竟大不大呢?近兩天,陶哲軒似乎得出了他的結(jié)論。
陶哲軒發(fā)現(xiàn),雖然 AI 工具對自己研究中的核心數(shù)學(xué)部分并不是那么有用(或者可能只是因為不想在自認為可以熟練完成的任務(wù)上嘗試),但是在生成代碼和創(chuàng)建論文中的流程圖初稿(他使用了自己過去很少用的 LaTeX 包 (tikz))等任務(wù)中都非常有用。
總的來說,他發(fā)現(xiàn) GPT 允許自己為一項計算任務(wù)抽象出特定語言,比如 Python、SAGE、正則表達式、LaTeX 等。他可以用自然語言向 GPT 表達自己的請求,然后 GPT 會以合適的語言提供適當?shù)拇a。盡管在沒有完全集成的情況下,他依然必須將 GPT 輸出內(nèi)容復(fù)制粘貼到可以編譯的文檔中。
陶哲軒承認 GPT 開始改變他的工作流程,過去會避免使用代碼密集型解決方案來解決任務(wù),但現(xiàn)在這種狀況正在消失。他發(fā)現(xiàn)自己更愿意將編碼作為日常工作的一部分了。
?就拿 GitHub Copilot 而言,陶哲軒驚喜地發(fā)現(xiàn),在使用 VSCode+LaTeXworkshop 設(shè)置后,它可以自動完成標準信函了。僅給出開頭段落和接下來的句子,Copilot 提供的其余段落與他實際要寫的內(nèi)容非常接近。并且通過對 Copilotshuchu 內(nèi)容的小修小改,他可以將完成標準信函的時間省掉一大半。
陶哲軒分享了自己在論文中使用自動完成功能的一張截圖。在嘗試自動完成證明大綱時,Copilot 確實引用了論文其余部分的相關(guān)結(jié)果,但隨后給出了一些隨機分析數(shù)論的廢話。
到目前為止,除了一些非常短的自動完成工作或編寫重復(fù)的文本模式之外,他發(fā)現(xiàn) Copilot 在寫數(shù)學(xué)論文時更有趣而不是有用,但未來可能會有令他驚訝的效果。
事實證明,GPT 提供的正則表達式雖然沒有按照陶哲軒想要的方式來處理嵌套分隔符,但足夠接近。他可以在自己閱讀正則表達式文檔后調(diào)整成想要的。在他看來,需要一定的正則表達式技能才能完成類似的任務(wù),但要比沒有 GPT 輔助時所需要的技能少。
一般來說,GPT 似乎允許人們在基于文本的任務(wù)中提升自己的技能,但隨著技能水平的提高,「收益」遞減。完全不熟悉任務(wù)的人可能會通過 GPT 成為高級初學(xué)者,初學(xué)者可以達到中級技能水平,中級水平的人可能會成為專家,至少在某些方面是這樣。但對于專家而言,使用 GPT 進一步提供的收益相對不大。
因此,陶哲軒不建議初學(xué)者使用 AI 工具來完成專家級的任務(wù),因為無法正確地對輸出進行檢查。不過他也認為,人們可以用 AI 工具來完成比正常水平高出一個技能水平的任務(wù),這樣有足夠的能力來檢查輸出的結(jié)果,并決定是否接受或者額外調(diào)整。
有人問了,萬一人們沒有清楚意識到這種技能水平上的差距呢?陶哲軒表示,他相信隨著 AI 工具變得越來越熟悉,大多數(shù)人會對這些工具能做什么、不能做什么有更準確的心理模型,并進行相應(yīng)的校準。
當然陶哲軒也同意對公眾展開 AI 教育以及進行獨立的輸出驗證,這些都會成為現(xiàn)代世界越來越重要的技能。