作者:加零
編輯:李寶珠、三羊
MIT利用圖神經(jīng)網(wǎng)絡(luò) Chemprop 識別潛在抗生素,特異性殺死鮑曼不動桿菌。
自然界中充滿了各種各樣的微生物,例如結(jié)核桿菌(導(dǎo)致肺結(jié)核)、霍亂弧菌(導(dǎo)致霍亂)等嚴(yán)重危害了人們的健康。而在人類歷史上,感染這些致病細(xì)菌,除了依賴人體自身的免疫系統(tǒng),幾乎無解。直到 1928 年,青霉素的發(fā)現(xiàn),讓人類第一次擁有了戰(zhàn)勝致病細(xì)菌的有力武器。
然而,抗生素的廣泛應(yīng)用也帶來了一個巨大的危機 —— 抗生素耐藥性 (AMR),據(jù)世界衛(wèi)生組織 (WHO) 統(tǒng)計, 2019 年全球約有 120 萬人死于抗生素耐藥性 (AMR) 所加劇的細(xì)菌感染,這已經(jīng)高于艾滋病導(dǎo)致的死亡人數(shù)。濫用抗生素催生某些「超級細(xì)菌」的出現(xiàn),成為了 21 世紀(jì)臨床重要致病因。要解決這一難題,迫切需要開發(fā)全新的抗生素。
針對特異細(xì)菌,深度學(xué)習(xí)模型可以提高對化合物藥效和安全性的預(yù)測準(zhǔn)確性,有效減少實驗室實驗和臨床試驗的時間和資源消耗,對有效且安全的抗生素發(fā)現(xiàn)至關(guān)重要。
為此,來自 MIT 的研究者們開發(fā)了一種深度學(xué)習(xí)方法來發(fā)現(xiàn)抗生素,利用圖神經(jīng)網(wǎng)絡(luò) Chemprop 從大型化學(xué)庫中識別潛在的抗生素,并發(fā)現(xiàn)了一類新型抗生素。他們能夠特異性殺死重要的耐藥菌 —— 鮑曼不動桿菌 (Acinetobacter baumannii),相關(guān)論文已發(fā)表于 Nature。
論文已發(fā)表于 Nature
論文地址:
https://www.nature.com/articles/s41586-023-06887-8
關(guān)注公眾號,回復(fù)「發(fā)現(xiàn)抗生素」下載完整論文
實驗方法:利用圖神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)
數(shù)據(jù)集:多種化合物
初步篩選:該研究初步篩選了 39,312 種化合物,對其抗生素活性和人類細(xì)胞毒性特征進(jìn)行分析。
擴大預(yù)測:為進(jìn)一步擴大預(yù)測范圍,這些模型對 12,076,365 種化合物進(jìn)行測試,其中 11,277,225 種來自 Mcule 數(shù)據(jù)庫,799,140 種來自 Broad Institute 數(shù)據(jù)庫。
39,312 個化合物的分子量分布
算法訓(xùn)練:利用圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練
使用圖神經(jīng)網(wǎng)絡(luò) Chemprop 對篩選出的 39,312 種化合物進(jìn)行訓(xùn)練,預(yù)測其抗生素活性和人類細(xì)胞毒性,訓(xùn)練過程如下。
分子表示:使用 RDKit 從每個化合物的 SMILES(Simplified Molecular Input Line Entry Specification,簡化分子輸入線性入口系統(tǒng))字符串生成基于圖的分子表示。
特征向量生成:為每個原子和鍵生成特征向量,包括原子特征(如原子序數(shù)、鍵數(shù)、正電荷等)和鍵特征(如鍵類型、共軛、環(huán)成員資格等)。
信息傳遞:實現(xiàn)基于鍵的信息傳遞卷積神經(jīng)網(wǎng)絡(luò),更新鍵的消息,通過神經(jīng)網(wǎng)絡(luò)層并應(yīng)用非線性激活函數(shù)。
模型輸出:模型在固定的信息傳遞步驟后,對整個分子的消息進(jìn)行匯總,通過前饋神經(jīng)網(wǎng)絡(luò)預(yù)測化合物的活性,如抗生素活性、細(xì)胞毒性或改變質(zhì)子動力勢的活性。
優(yōu)化措施:包括添加額外的分子級特征、使用超參數(shù)優(yōu)化選擇最佳性能參數(shù),以及通過集成學(xué)習(xí)增強模型的魯棒性。
模型架構(gòu):保證化合物的有效性和安全性
抗生素活性模型
研究人員在化合物濃度 50 μM 的培養(yǎng)基中預(yù)測其對金黃色葡萄球菌 (S. aureus) 的抗生素活性,以 80% 標(biāo)準(zhǔn)化生長抑制截止值 (normalized growth inhibition cut-off) 區(qū)分為活性或無活性。共 10 個圖神經(jīng)網(wǎng)絡(luò)模型在同一 80% - 20% 的訓(xùn)練數(shù)據(jù)集上進(jìn)行了訓(xùn)練、驗證和測試。
結(jié)果顯示,具有 RDKit 特征的 Chemprop 模型表現(xiàn)出更優(yōu)越的預(yù)測能力,在 39,312 種化合物中識別出 512 種活性化合物。
預(yù)測抗生素活性的深度學(xué)習(xí)模型比較
人類細(xì)胞毒性模型
研究人員利用 39,312 種化合物對人類肝癌細(xì)胞 (HepG2)、人類初級骨骼肌細(xì)胞 (HSkMCs) 和人類肺成纖維細(xì)胞 (IMR-90) 進(jìn)行毒性篩選。在用每種化合物 10 μM 濃度處理 2-3 天后,評估細(xì)胞活力,以 90% 細(xì)胞活力截止值 (cell viability cut-off) 將化合物活性分類。
同樣對 10 個 Chemprop 模型集合進(jìn)行了訓(xùn)練、驗證和測試,對比結(jié)果如下圖:
預(yù)測人類細(xì)胞毒性的深度學(xué)習(xí)模型比較
結(jié)果顯示,分別有 3,341 (8.5%)、1,490 (3.8%) 和 3,447 (8.8%) 的化合物對 HepG2 細(xì)胞、HSkMCs 和 IMR-90 細(xì)胞具有毒性。在上步篩選出的 512 種活性抗菌化合物中,306 種對這三種細(xì)胞類型均無毒性。
總結(jié)來看,盡管與抗生素活性模型相比存在一定局限性,這一模型平衡了藥物的有效性和對人體的無害性,展示了在藥物發(fā)現(xiàn)中使用先進(jìn)計算方法的潛力。
實驗結(jié)果:抗生素的篩選識別
精煉和大范圍應(yīng)用模型:全化學(xué)空間的篩選和可視化
在這一研究階段中,重點在于精煉和應(yīng)用模型,以便在龐大的化學(xué)空間中識別潛在的抗生素化合物,并評估它們的細(xì)胞毒性。研究人員重新訓(xùn)練了 20 個 Chemprop 模型用于預(yù)測抗生素活性和 HepG2、HSkMC、IMR-90 細(xì)胞的細(xì)胞毒性,改進(jìn)后的模型被應(yīng)用于 12,076,365 種化合物預(yù)測上。
化合物篩選
抗生素活性篩選:從 Mcule 數(shù)據(jù)庫中篩選出抗生素預(yù)測得分超過 0.4 的 3,004 種化合物;從 Broad Institute 數(shù)據(jù)庫中篩選出得分超過 0.2 的 7,306 種化合物。
人類細(xì)胞毒性篩選:
保留細(xì)胞毒性預(yù)測得分低于 0.2 的化合物,最終篩選出 3,646 種化合物(1,210 種來自Mcule 數(shù)據(jù)庫,2,436 種來自 Broad Institute 數(shù)據(jù)庫)——占所有評估化合物的 0.03%。
化合物篩選
a:計算機模擬過濾程序b-e:抗生素活性和 HepG2、HSkMC、IMR-90 細(xì)胞的細(xì)胞毒性預(yù)測
化學(xué)空間的可視化
以摩根指紋 (Morgan fingerprints) 為分子表示,采用 t 分布隨機相鄰嵌入 (t-SNE, t-distributed stochastic neighbour embedding) 方法對化學(xué)空間進(jìn)行可視化。
如下圖所示,t-SNE 的可視化揭示了 hits(通過篩選的化合物)和 non-hits(抗生素預(yù)測得分低的化合物)之間的明顯差異。
對化合物的 t-SNE 分析
進(jìn)一步篩選:識別兩個有效化合物
在 3,646 個化合物中篩選出 2 個對金黃色葡萄球菌表現(xiàn)出高活性且對人類細(xì)胞具有良好選擇性的化合物(1 號和 2 號),這兩種化合物在各種測試條件下的表現(xiàn)、特別是在含血清的培養(yǎng)基中的生長抑制能力很優(yōu)越,值得進(jìn)一步研究。
這些化合物的研究表明,深度學(xué)習(xí)模型預(yù)測的結(jié)構(gòu)類別可以有效地指導(dǎo)實驗篩選,從而發(fā)現(xiàn)新的抗生素候選物。
篩選過程
化合物篩選:從最初的 3,646 個 hits 化合物中去除了含有可能反應(yīng)活性、致突變或藥代動力學(xué)不利的 PAINS 和 Brenk 警報的化合物,篩選至 2,209 個。
結(jié)構(gòu)篩選:進(jìn)一步篩選與訓(xùn)練集中化合物結(jié)構(gòu)不同的化合物,使用最大 Tanimoto 相似性得分 ≤0.5 作為初步切斷點,并排除含 β-內(nèi)酰胺環(huán)或喹諾酮雙環(huán)核心的化合物,最終得到 1,261 個化合物。
有效化合物的識別
生長抑制測試:在 9 個與理性組 G1-G5 相關(guān)的 hits 化合物中,發(fā)現(xiàn) 4 個化合物 (44%) 對金黃色葡萄球菌 (S. aureus) 有活性,最小抑制濃度 (MIC) ≤32 μg/ml。
結(jié)構(gòu)類別和有效性:這些有效化合物與理性組 G1、G2 和 G5 相關(guān),其中 G2 組的兩個化合物(1號和2號)被證實為活性。這兩個化合物同時符合 Lipinski 的規(guī)則和 Ghose 標(biāo)準(zhǔn),表明它們具有良好的口服生物利用度和藥物樣特性,值得進(jìn)一步研究。
篩選出的兩個化合物
進(jìn)一步研究:兩個化合物的特性
通過深入的機制研究和體內(nèi)外實驗,化合物 1 和 2 顯示出作為新型抗生素候選物的潛力。它們不僅針對多重耐藥菌株有效,而且具有較低的耐藥性發(fā)展趨勢和良好的安全性。
這些發(fā)現(xiàn)表明,這兩種化合物可作為抗生素藥物發(fā)展的有希望的化學(xué)系列。
作用機制和耐藥性
共同結(jié)構(gòu):化合物 1 和 2 共享 N-[2-(2-chlorophenoxy)ethyl]aniline core 這一結(jié)構(gòu),預(yù)測表明這可能是抗生素活性的基本結(jié)構(gòu)。
生長抑制實驗:在對金黃色葡萄球菌和枯草桿菌的時間殺菌實驗中,這兩種化合物顯示出了抗生素活性,與范科霉素類似但殺菌力較低。
耐藥性研究:在對抗生素耐藥的金黃色葡萄球菌株進(jìn)行的實驗中,這兩種化合物的最小抑制濃度 (MIC) 只略有增加,表明它們可能具有與常見抗生素不同的作用機制。
耐藥性的發(fā)展:經(jīng)過 30 天的連續(xù)培養(yǎng),這兩種化合物的 MIC 幾乎沒有變化,顯示出較低的耐藥性發(fā)展趨勢。
抗多重耐藥菌效果
廣泛抗性:這兩種化合物對包括萬古霉素耐藥性腸球菌在內(nèi)的 40 種不同細(xì)菌種類表現(xiàn)出活性,其中 MIC 的中位數(shù)分別為 4 和 3 μg/ml。
對靜止期細(xì)菌的有效性:這兩種化合物對枯草桿菌的靜止期細(xì)胞也顯示出活性。
毒理學(xué)、化學(xué)特性及功效
安全性研究:這兩種化合物在體外實驗中表現(xiàn)出良好的安全性,包括非溶血性、不結(jié)合金屬離子、無基因毒性、化學(xué)穩(wěn)定性以及在小鼠體內(nèi)的安全性。
體內(nèi)功效實驗:在小鼠金黃色葡萄球菌皮膚感染和大腿感染模型中,化合物 1 表現(xiàn)出顯著的抗菌活性。
化合物的體內(nèi)療效
深度學(xué)習(xí):應(yīng)對抗生素耐藥性的利器
研究人員多年來一直在探索應(yīng)對抗生素耐藥性的有效、易推廣的方法,在這一過程中,深度學(xué)習(xí)的出現(xiàn)為研究人員提供了新的解題思路,深度學(xué)習(xí)在應(yīng)對抗生素耐藥性方面的應(yīng)用價值在于:
超越傳統(tǒng)抗生素發(fā)現(xiàn)方法:傳統(tǒng)的抗生素發(fā)現(xiàn)方法往往依賴于已知的活性結(jié)構(gòu),這限制了新藥發(fā)現(xiàn)的范圍。深度學(xué)習(xí)方法可以識別與傳統(tǒng)抗生素結(jié)構(gòu)不同的新化合物,可能對當(dāng)前耐藥的菌株有效。
個性化和精準(zhǔn)醫(yī)療:深度學(xué)習(xí)可以用于分析特定病原體的遺傳和表型特征,從而有助于開發(fā)針對特定病原體或感染類型的個性化抗生素。
道阻且長,行之將至。深度學(xué)習(xí)在藥物研發(fā)中的應(yīng)用仍處于相對早期階段,可能會面臨數(shù)據(jù)質(zhì)量和可解釋性等挑戰(zhàn),但作為人類對抗細(xì)菌的重要防線,相關(guān)研究意義重大,相信勢必會在技術(shù)迭代的加持下持續(xù)向前。
參考文獻(xiàn):
https://www.nature.com/articles/s41586-023-06887-8