版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

一本期刊被逼撤稿467篇!他是出版商最不待見的人

返樸
原創(chuàng)
溯源守拙·問學求新。《返樸》,科學家領(lǐng)航的好科普。
收藏

隨著AI工具的出現(xiàn),可疑的論文或引文可能很難與真實的論文或引文區(qū)分開來。再加上編輯、同行評審和出版過程高度依賴信任的復雜關(guān)系,導致學術(shù)造假頻發(fā)。目睹著AI在學術(shù)界使用日益泛濫,法國圖盧茲大學計算機科學家Guillaume Cabanac決定要做點什么。于是在2015年,他和同事發(fā)起了一項專項“打假行動”,專門針對那些使用了AI技術(shù)卻未做出聲明的問題論文。

一開始,他只是出于好奇而志愿做這件事;如今,他創(chuàng)造的工具幫助學術(shù)偵探們持續(xù)不斷地揭露論文造假行為。

撰文 | 路飛

今年4月,全球獨立學術(shù)出版商Sage忍痛清理門戶,從一本名為Journal of Intelligent & Fuzzy Systems(《智能與模糊系統(tǒng)雜志》,簡稱JIFS)的期刊上,一口氣撤回了467篇論文。

Sage發(fā)言人表示,自從科睿唯安(Clarivate)“向我們通報了對該期刊部分內(nèi)容存在質(zhì)量擔憂”之后,“我們展開了徹底的調(diào)查”,且自調(diào)查日起該刊停止收錄文章。至于撤稿的原因,Sage對外聲稱是“同行評議程序不合理”。

目前在科睿唯安網(wǎng)站上,該期刊仍然能夠正常檢索。如果科睿唯安將該期刊從科學引文索引數(shù)據(jù)庫(SCI)中剔除,后續(xù)將不再對其論文進行索引及統(tǒng)計論文的引文數(shù)目,也不再給該期刊賦予影響因子。這個懲罰對涉事期刊或許不冤,但對此前發(fā)表在該期刊上的作者來說,多米諾效應(yīng)將帶來一系列嚴重后果。

在這件事上,Sage也是個輸家。因為在2023年11月,Sage才收購了IOS Press,由此獲得近100本期刊,涵蓋神經(jīng)科學、醫(yī)學信息學、癌癥研究、人工智能(AI)、數(shù)據(jù)科學和語義網(wǎng)等相關(guān)領(lǐng)域。出事的JIFS正是IOS Press旗下的期刊。

對于Sage收購后的大幅撤稿,JIFS主編Reza Langari頗有微詞。他自詡編輯部對投稿進行了嚴格把控。他表示,該期刊近年來在AI相關(guān)領(lǐng)域的投稿量突飛猛進,去年更是飆升至10000篇,期刊內(nèi)部為此制定預審機制,拒掉了80%以上的投稿,尤其是一眼看上去是論文工廠生產(chǎn)的或者明顯使用AI工具的論文。

撤稿并非空穴來風。其實早在Sage收購IOS Press之前,JIFS期刊就被曝出諸多問題。一方面是PubPeer上的匿名志愿者多次在問題論文評論區(qū)指出錯誤,如PubPeer用戶“Rhipiduraalbiventris”對幾篇現(xiàn)已撤回的論文發(fā)表了評論,指出了計算中的缺陷并質(zhì)疑引用文獻的相關(guān)性。另一方面是有人利用“問題論文篩選器”(Problematic Paper Screener,PPS)發(fā)現(xiàn)該期刊11篇文章中使用“費解的短語”(Tortured Phrases)——即論文中出現(xiàn)的奇怪術(shù)語或令人困惑的替代短語,可能是使用自動翻譯軟件或AI工具躲避查重而導致的結(jié)果。例如,將論文從英語翻譯成其他語言,然后再翻譯回英語時,常常會發(fā)生這樣的情況。

另外,通過PPS的插件Feet of Clay Detector來檢索期刊中引用了撤稿論文的文章時,發(fā)現(xiàn)該期刊有674篇文章被標記。

問題論文的克星

給JIFS雜志“找麻煩”的,是法國圖盧茲大學計算機科學家Guillaume Cabanac。他是著名的學術(shù)偵探,自從2015年起,他和同事就發(fā)起了一項專項“打假行動”,專門針對那些使用了AI工具卻未做出聲明的問題論文。PPS便是其開發(fā)的一款監(jiān)測軟件。

一開始,他只是出于好奇而志愿做這件事,然而,隨著AI在學術(shù)界使用日益泛濫,污染了學術(shù)環(huán)境,他便持續(xù)不斷地揭露論文造假行為。

2021年2月,Cabanac推出了PPS,它可以在論文中標記“AI生成的文本”,梳理文獻中荒謬的“費解的短語”。

當讀者第一次遇到“費解的短語”時,可以打上標簽,將其作為“指紋”添加到檢索文獻的數(shù)據(jù)庫Dimensions中,該數(shù)據(jù)庫囊括了1.3億份科學文獻,提供極大的分析樣本。如果數(shù)據(jù)庫中有其他論文也使用了“費解的短語”,就可以被標記出來。截至目前,數(shù)據(jù)平臺已經(jīng)梳理了5800個“指紋”。必要時,讀者還需要進行把關(guān),以檢查是否存在誤報。


圖一:PPS主頁截圖

PPS并不能保證檢測出來的問題論文會被撤稿。即使是充斥著數(shù)十個“費解的短語”的已發(fā)表論文,也很難被調(diào)查、糾正或撤回。截至9月13日,PPS已經(jīng)標記了16654篇論文。這里需要說明,為了避免假陽性,PPS只對使用了5次及以上“費解的短語”的論文打上標記——其中只有18%被撤回。


圖二:費解的短語示例

為了促進對文獻的持續(xù)檢查和持續(xù)清理,Cabanac為PPS設(shè)計了兩個插件。一個是Annulled Detector,它可以跟蹤撤稿、撤回或刪除的論文——這些是出版商用來標記失效論文的各種標簽。該檢測器從各個出版商、Crossref數(shù)據(jù)庫(包括撤稿觀察數(shù)據(jù)庫)和生物醫(yī)學數(shù)據(jù)庫Pub Med收集數(shù)據(jù),以跟蹤全球論文撤稿、撤回和刪除的情況。截至目前,大約62000篇問題論文已被引用了超過836000次。

另一個是Feet of Clay Detector,它可用于快速發(fā)現(xiàn)那些在參考文獻中引用了撤稿論文的文章。Cabanac為1700多篇此類文章添加了PubPeer評論,以提示讀者評估參考文獻的可靠性。

學術(shù)打假路漫漫

PPS確實對出版商起到了一定的震懾作用。自從Cabanac和同事報告指出,“費解的短語”污染了學術(shù)環(huán)境,一些出版商——不僅僅是那些被認為是掠奪性的出版商——已經(jīng)撤回了數(shù)百篇論文。例如,僅施普林格·自然(Springer Nature)就撤回了300多篇充斥著荒謬文字的論文。

但是學術(shù)打假路漫漫,從“發(fā)現(xiàn)”到“撤稿”,這中間免不了蹉跎。

在Cabanac和同事Alexander Magazinov首次對Environmental Science and Pollution Research(《環(huán)境科學與污染研究》,ESPR)發(fā)表的文章中存在可疑引文、費解的短語表示“關(guān)切”之后,大規(guī)模撤稿行動開展了一年多。

Cabanac利用PPS在ESPR上標注了1850篇文章,大多數(shù)被標注的文章是因為引用了已撤稿的論文。另有超過100篇論文使用了“費解的短語”,考慮到僅統(tǒng)計使用五次及以上“費解的短語”的論文,這意味著很多有嫌疑的論文可能沒有顯示。

例如,一篇2019年3月的論文《影響道路交通事故頻率的環(huán)境因素:巴基斯坦郊區(qū)個案研究》,Cabanac在PubPeer上指出,論文作者使用了“monetary misfortunes”而不是“financial damages”,用“creating nations”來代替“developing countries”,該論文顯示今年3月已被撤回。

還有一些論文使用了AI工具但是并未在文章中說明,例如2023年9月的論文《復興我們的地球:在土壤修復中釋放綠色能源的力量,實現(xiàn)可持續(xù)的未來》。論文的第3節(jié)以短語“Regenerate response”(重新生成回復)結(jié)束,這顯然是ChatGPT中生成文本的按鈕,作者忘記刪除了。Cabanac在PubPeer的評論中指出了這個錯誤。該論文于今年7月被撤回。

2022年11月,Magazinov聯(lián)系了ESPR雜志的主編Philippe Garrigues,后者是法國國家科學研究中心(CNRS)的研究員。他在另一家雜志上發(fā)表了一篇論文,其中“超過四分之一”的文獻引用來源于自家期刊ESPR?!拔覀冇欣碛蓱岩蒃SPR的審稿人或編輯在進行引文操縱,請予以核實。毫無疑問,ESPR需要進行大掃除,”Magazinov在郵件中寫道。

Cabanac隔天再次給Garrigues發(fā)了郵件。后者表示,正在采取行動。

但是直到2023年4月,Garrigues和ESPR沒有任何動靜。于是,Cabanac向COPE(出版?zhèn)惱砦瘑T會)通報了該期刊中存在的問題。COPE的一名人員接著向施普林格·自然發(fā)了郵件,詢問該期刊是否在進行調(diào)查。施普林格·自然集團研究誠信顧問Tim Kersjes回復稱,該雜志和出版商正在展開調(diào)查,如有進展會通知Cabanac。

但據(jù)郵件顯示,Cabanac后續(xù)并沒有得到關(guān)于該雜志的信息,盡管COPE在2023年6月多次進行跟進。不過據(jù)統(tǒng)計顯示,ESPR自2024年2月以來確實開展了大規(guī)模的撤稿,撤回了136篇論文,最近的一篇撤稿是在8月2日。Cabanac對此很不滿,“當你無償付出了這么多努力,卻連出版商的反饋都沒有,這有點讓人沮喪。”

施普林格·自然集團研究誠信主管Chris Graf表示,“撤稿是我們研究誠信部門調(diào)查的結(jié)果,也受到了學術(shù)偵探指出問題的影響。”他補充說明,撤稿的原因有很多,如“作者對人工智能LLMs(大語言模型)的使用在某些論文中并沒有明確說明?!?/p>

諸多被撤回的論文在通知上顯示:根據(jù)出版商的調(diào)查發(fā)現(xiàn),包括本文在內(nèi)的一些文章存在若干問題,包括但不限于同行評審程序受損,引用不相關(guān)的文獻,使用不標準措辭,引用根本不存在的期刊。

科睿唯安今年沒有提供ESPR的影響因子,施普林格·自然集團的一名代表表示,他們對該決定感到“失望”。該期刊目前在科睿唯安網(wǎng)站上被標記為“擱置”,檢索結(jié)果顯示,該期刊正在“重新評估”,并可能被從web of Science的索引中刪除。

Graf表示,施普林格·自然正在“更新”ESPR的編輯和編輯委員會,以確保稿件處理的質(zhì)量。

Cabanac認為接受調(diào)查的期刊至少應(yīng)該發(fā)布一份披露聲明,警告打算向期刊投稿的研究人員。如果沒有這樣的聲明,“潛在作者將不知道期刊的歷史,他們事后會覺得被欺騙?!?/p>

如何提高文獻可靠性

出版物和引文是學術(shù)界的“硬通貨”。然而,隨著AI工具的出現(xiàn),可疑的論文或引文可能很難與真實的論文或引文區(qū)分開來。再加上編輯、同行評審和出版過程高度依賴信任的復雜關(guān)系,導致學術(shù)造假頻發(fā)。那么,在引文時如何提高文獻可靠性?Cabanac提供了一些思路。

學會使用科研工具,只需要一些簡單的步驟,便可以顯著提高科學文獻的可靠性。作者在引用文獻時,應(yīng)檢查是否有人提出質(zhì)疑或撤稿情況。PubPeer兩個擴展程序插件是檢查文獻可靠性的得力助手,當作者瀏覽期刊網(wǎng)站時,一個插件會自動標記PubPeer上收到評論的任何論文,其中可能包括正在更正的文獻和已經(jīng)撤稿的文獻。另一個插件是在文獻管理器Zotero中工作,可以識別用戶數(shù)據(jù)庫中存在的相似度較高的文章。對于下載的PDF文件,出版行業(yè)使用Crossmark:讀者可以單擊Crossmark按鈕,在出版商網(wǎng)站的登錄頁面上查看文獻的狀態(tài)。有一些工具可以檢查參考文獻列表,例如RetractoBot,當學者引用的論文被撤回時,它會提醒他們。Feet of Clay Detector,可以免費用于檢查已發(fā)表文章的參考文獻列表是否有任何危險信號。

除了作者要小心謹慎,Cabanac認為出版商最應(yīng)該對其實踐和審稿流程做出改變,他們應(yīng)該定期檢查存在剽竊、篡改圖像、費解的短語、引用撤稿文獻,以及由AI工具等生成的論文,并及時作出處理。


特 別 提 示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

版權(quán)說明:歡迎個人轉(zhuǎn)發(fā),任何形式的媒體或機構(gòu)未經(jīng)授權(quán),不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。

內(nèi)容資源由項目單位提供

評論
中寨鎮(zhèn)塔溝村后
學士級
??
2024-09-19
淬劍??
太傅級
2024-09-19
泰順惠友社工
大學士級
一本期刊被逼撤稿467篇!他是出版商最不待見的人
2024-09-19