版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-定量構(gòu)效關(guān)系

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

定量構(gòu)效關(guān)系(QSAR)是一種借助分子的理化性質(zhì)參數(shù)或結(jié)構(gòu)參數(shù),以數(shù)學(xué)和統(tǒng)計(jì)學(xué)手段定量研究有機(jī)小分子與生物大分子相互作用、有機(jī)小分子在生物體內(nèi)吸收、分布、代謝、排泄等生理相關(guān)性質(zhì)的方法。這種方法廣泛應(yīng)用于藥物、農(nóng)藥、化學(xué)毒劑等生物活性分子的合理設(shè)計(jì),在早期的藥物設(shè)計(jì)中,定量構(gòu)效關(guān)系方法占據(jù)主導(dǎo)地位,1990年代以來(lái)隨著計(jì)算機(jī)計(jì)算能力的提高和眾多生物大分子三維結(jié)構(gòu)的準(zhǔn)確測(cè)定,基于結(jié)構(gòu)的藥物設(shè)計(jì)逐漸取代了定量構(gòu)效關(guān)系在藥物設(shè)計(jì)領(lǐng)域的主導(dǎo)地位,但是QSAR在藥學(xué)研究中仍然發(fā)揮著非常重要的作用。

中英文名稱英文縮寫(xiě) (Acronym):

QSAR

中文全稱 (Chinese):

定量構(gòu)效關(guān)系

英文全稱(English):

Quantitative Structure - Activity Relationship

中文意思 (Chinese Introduction):

無(wú)

英文介紹 (English Explanation):

None

發(fā)展歷史

定量構(gòu)效關(guān)系是在傳統(tǒng)構(gòu)效關(guān)系的基礎(chǔ)上,結(jié)合物理化學(xué)中常用的經(jīng)驗(yàn)方程的數(shù)學(xué)方法出現(xiàn)的,其理論歷史可以追溯到1868年提出的Crum-Brown方程,該方程認(rèn)為化合物的生理活性可以用化學(xué)結(jié)構(gòu)的函數(shù)來(lái)表示,但是并未建立明確的函數(shù)模型。最早的可以實(shí)施的定量構(gòu)效關(guān)系方法是美國(guó)波蒙拿學(xué)院的Hansch在1962年提出的Hansch方程。Hansch方程脫胎于1935年英國(guó)物理化學(xué)家哈密頓提出的哈密頓方程以及改進(jìn)的塔夫托方程。哈密頓方程是一個(gè)計(jì)算取代苯甲酸解離常數(shù)的經(jīng)驗(yàn)方程,這個(gè)方程將取代苯甲酸解離常數(shù)的對(duì)數(shù)值與取代基團(tuán)的電性參數(shù)建立了線性關(guān)系,塔夫托方程是在哈密頓方程的基礎(chǔ)上改進(jìn)形成的計(jì)算脂肪族酯類化合物水解反應(yīng)速率常數(shù)的經(jīng)驗(yàn)方程,它將速率常數(shù)的對(duì)數(shù)與電性參數(shù)和立體參數(shù)建立了線性關(guān)系。

Hansch方程在形式上與哈密頓方程和塔夫托方程非常接近,以生理活性物質(zhì)的半數(shù)有效量作為活性參數(shù),以分子的電性參數(shù)、立體參數(shù)和疏水參數(shù)作為線性回歸分析的變量,隨后,Hansch和日本訪問(wèn)學(xué)者藤田稔夫等人一道改進(jìn)了Hansch方程的數(shù)學(xué)模型,引入了指示變量、拋物線模型和雙線性模型等修正,使得方程的預(yù)測(cè)能力有所提高。

Hansch方法幾乎在Hansch方法發(fā)表的同時(shí),F(xiàn)ree等人發(fā)表了Free-Wilson方法,這種方法直接以分子結(jié)構(gòu)作為變量對(duì)生理活性進(jìn)行回歸分析。其在藥物化學(xué)中的應(yīng)用范圍遠(yuǎn)不如Hansch方法廣泛。Hansch方法、Free-Wilson方法等方法均是將分子作為一個(gè)整體考慮其性質(zhì),并不能細(xì)致地反應(yīng)分子的三維結(jié)構(gòu)與生理活性之間的關(guān)系,因而又被稱作二維定量構(gòu)效關(guān)系

二維定量構(gòu)效關(guān)系出現(xiàn)之后,在藥物化學(xué)領(lǐng)域產(chǎn)生了很大影響,人們對(duì)構(gòu)效關(guān)系的認(rèn)識(shí)從傳統(tǒng)的定性水平上升到定量水平。定量的結(jié)構(gòu)活性關(guān)系也在一定程度上揭示了藥物分子與生物大分子結(jié)合的模式。在Hansch方法的指導(dǎo)下,人們成功地設(shè)計(jì)了諾氟沙星等喹諾酮類抗菌藥。

由于二維定量不能精確描述分子三維結(jié)構(gòu)與生理活性之間的關(guān)系,1980年代前后人們開(kāi)始探討基于分子構(gòu)象的三維定量構(gòu)效關(guān)系的可行性。1979年,Crippen提出“距離幾何學(xué)的3D-QSAR”;1980年Hopfinger等人提出“分子形狀分析方法”;1988年Cramer等人提出了“比較分子場(chǎng)方法”(CoMFA)。比較分子場(chǎng)方法一經(jīng)提出便席卷藥物設(shè)計(jì)領(lǐng)域,成為應(yīng)用最廣泛的基于定量構(gòu)效關(guān)系的藥物設(shè)計(jì)方法;1990年代,又出現(xiàn)了在比較分子場(chǎng)方法基礎(chǔ)上改進(jìn)的“比較分子相似性方法”以及在“距離幾何學(xué)的3D-QSAR”基礎(chǔ)上發(fā)展的“虛擬受體方法”等新的三維定量構(gòu)效關(guān)系方法,但是老牌的CoMFA依然是使用最廣泛的定量構(gòu)效關(guān)系方法。

二維定量構(gòu)效關(guān)系二維定量構(gòu)效關(guān)系方法是將分子整體的結(jié)構(gòu)性質(zhì)作為參數(shù),對(duì)分子生理活性進(jìn)行回歸分析,建立化學(xué)結(jié)構(gòu)與生理活性相關(guān)性模型的一種藥物設(shè)計(jì)方法,常見(jiàn)的二維定量構(gòu)效關(guān)系方法有Hansch方法、Free-wilson方法、分子連接性方法等,最為著名和應(yīng)用最廣泛的是Hansch方法

活性參數(shù)活性參數(shù)是構(gòu)成二維定量構(gòu)效關(guān)系的要素之一,人們根據(jù)研究的體系選擇不同的活性參數(shù),常見(jiàn)的活性參數(shù)有:半數(shù)有效量、半數(shù)有效濃度、半數(shù)抑菌濃度、半數(shù)致死量、最小抑菌濃度等,所有活性參數(shù)均必須采用物質(zhì)的量作為計(jì)量單位,以便消除分子量的影響,從而真實(shí)地反應(yīng)分子水平的生理活性。為了獲得較好的數(shù)學(xué)模型,活性參數(shù)在二維定量構(gòu)效關(guān)系中一般取負(fù)對(duì)數(shù)后進(jìn)行統(tǒng)計(jì)分析。

結(jié)構(gòu)參數(shù)結(jié)構(gòu)參數(shù)是構(gòu)成定量構(gòu)效關(guān)系的另一大要素,常見(jiàn)的結(jié)構(gòu)參數(shù)有:疏水參數(shù)、電性參數(shù)、立體參數(shù)、幾何參數(shù)、拓?fù)鋮?shù)、理化性質(zhì)參數(shù)以及純粹的結(jié)構(gòu)參數(shù)等

* 疏水參數(shù):藥物在體內(nèi)吸收和分布的過(guò)程與其疏水性密切相關(guān),因而疏水性是影響藥物生理活性的一個(gè)重要性質(zhì),在二維定量構(gòu)效關(guān)系中采用的疏水參數(shù)最常見(jiàn)的是脂水分配系數(shù),其定義為分子在正辛醇與水中分配的比例,對(duì)于分子母環(huán)上的取代基,脂水分配系數(shù)的對(duì)數(shù)值具有加和性,可以通過(guò)簡(jiǎn)單的代數(shù)計(jì)算獲得某一取代結(jié)構(gòu)的疏水參數(shù)。

* 電性參數(shù):二維定量構(gòu)效關(guān)系中的電性參數(shù)直接繼承了哈密頓公式和塔夫托公式中的電性參數(shù)的定義,用以表征取代基團(tuán)對(duì)分子整體電子分配的影響,其數(shù)值對(duì)于取代基也具有加和性。

* 立體參數(shù):立體參數(shù)可以表征分子內(nèi)部由于各個(gè)基團(tuán)相互作用對(duì)藥效構(gòu)象產(chǎn)生的影響以及對(duì)藥物和生物大分子結(jié)合模式產(chǎn)生的影響,常用的立體參數(shù)有塔夫托立體參數(shù)、摩爾折射率、范德華半徑等。

* 幾何參數(shù):幾何參數(shù)是與分子構(gòu)象相關(guān)的立體參數(shù),因?yàn)檫@類參數(shù)常常在定量構(gòu)效關(guān)系中占據(jù)一定地位,故而將其與立體參數(shù)分割考慮,常見(jiàn)的幾何參數(shù)有分子表面積、溶劑可及化表面積、分子體積、多維立體參數(shù)等

* 拓?fù)鋮?shù):在分子連接性方法中使用的結(jié)構(gòu)參數(shù),拓?fù)鋮?shù)根據(jù)分子的拓?fù)浣Y(jié)構(gòu)將各個(gè)原子編碼,用形成的代碼來(lái)表征分子結(jié)構(gòu)。

* 理化性質(zhì)參數(shù):偶極矩、分子光譜數(shù)據(jù)、前線軌道能級(jí)、酸堿解離常數(shù)等理化性質(zhì)參數(shù)有時(shí)也用做結(jié)構(gòu)參數(shù)參予定量構(gòu)效關(guān)系研究

* 純粹的結(jié)構(gòu)參數(shù):在Free-Wilson方法中,使用純粹的結(jié)構(gòu)參數(shù),這種參數(shù)以某一特定結(jié)構(gòu)的分子為參考標(biāo)準(zhǔn),依照結(jié)構(gòu)母環(huán)上功能基團(tuán)的有無(wú)對(duì)分子結(jié)構(gòu)進(jìn)行編碼,進(jìn)行回歸分析,為每一個(gè)功能基團(tuán)計(jì)算出回歸系數(shù),從而獲得定量構(gòu)效關(guān)系模型。

數(shù)學(xué)模型二維定量構(gòu)效關(guān)系中最常見(jiàn)的數(shù)學(xué)模型是線性回歸分析,Hansch方程和Free-Wilson方法均采用回歸分析。

Hansch方程形式lg \left(\frac{1}{C}\right)=a\pi+b\sigma+cE_s+k 其中π為分子的疏水參數(shù),其與分子脂水分配系數(shù)PX的關(guān)系為:\pi=lg\left(\frac{P_x}{P_H}\right),σ為哈密頓電性參數(shù),Es為塔夫托立體參數(shù),其中a,b,c,k均為回歸系數(shù)。

日本學(xué)者藤田稔夫?qū)?jīng)典的Hansch方程作出一定改進(jìn),用拋物線模型描述疏水性與活性的關(guān)系:

lg \left(\frac{1}{C}\right)=a\pi+b{\pi}^2+c\sigma+dE_s+k這一模型擬合效果更好。

Hansch方程進(jìn)一步,以雙直線模型描述疏水性與活性的關(guān)系:

lg \left(\frac{1}{C}\right)=algP-blg(\beta P+1)+D其中的P為分子的脂水分配系數(shù),a,b,β為回歸系數(shù),D代表方程的其他部分。雙直線模型的預(yù)測(cè)能力比拋物線模型進(jìn)一步加強(qiáng)。

Free-Wilson方法的方程形式為:

lg \left(\frac{1}{C}\right)=\sum_i\sum_jG_{ij}X_{ij}+\mu其中Xij為結(jié)構(gòu)參數(shù),若結(jié)構(gòu)母環(huán)中第i個(gè)位置有第j類取代基則結(jié)構(gòu)參數(shù)取值為1否則為0,μ為參照分子的活性參數(shù),Gij為回歸系數(shù)。

除了回歸分析,遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、偏最小二乘分析、模式識(shí)別、單純形方法等統(tǒng)計(jì)分析方法也會(huì)應(yīng)用于二維定量構(gòu)效關(guān)系數(shù)學(xué)模型的建立

發(fā)展目前,二維定量構(gòu)效關(guān)系的研究集中在兩個(gè)方向:結(jié)構(gòu)數(shù)據(jù)的改良和統(tǒng)計(jì)方法的優(yōu)化。

傳統(tǒng)的二維定量構(gòu)效關(guān)系使用的結(jié)構(gòu)數(shù)據(jù)常僅能反應(yīng)分子整體的性質(zhì),通過(guò)改良結(jié)構(gòu)參數(shù),使得二維結(jié)構(gòu)參數(shù)能夠在一定程度上反應(yīng)分子在三維空間內(nèi)的伸展?fàn)顩r,成為二維定量構(gòu)效關(guān)系的一個(gè)發(fā)展方向。

引入新的統(tǒng)計(jì)方法,如遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、偏最小二乘回歸等,擴(kuò)展二維定量構(gòu)效關(guān)系能夠模擬的數(shù)據(jù)結(jié)構(gòu)的范圍,提高QSAR模型的預(yù)測(cè)能力是2D-QSAR的主要發(fā)展方向。

三維定量構(gòu)效關(guān)系三維定量構(gòu)效關(guān)系是引入了藥物分子三維結(jié)構(gòu)信息進(jìn)行定量構(gòu)效關(guān)系研究的方法,這種方法間接地反映了藥物分子與大分子相互作用過(guò)程中兩者之間的非鍵相互作用特征,相對(duì)于二維定量構(gòu)效關(guān)系有更加明確的物理意義和更豐富的信息量,因而1980年代以來(lái),三維定量構(gòu)效關(guān)系逐漸取代了二維定量構(gòu)效關(guān)系的地位,成為基于機(jī)理的合理藥物設(shè)計(jì)的主要方法之一。目前應(yīng)用最廣泛的三維定量構(gòu)效關(guān)系方法是CoMFA 和CoMSIA即比較分子場(chǎng)方法和比較分子相似性方法,除了上述兩種方法,3D-QSAR還有DG 3D-QSAR、MSA、GERM等眾多方法。

CoMFA&CoMSIACoMFA和CoMSIA是應(yīng)用最廣泛的合理藥物設(shè)計(jì)方法之一,這種方法認(rèn)為,藥物分子與受體間的相互作用取決于化合物周圍分子場(chǎng)的差別,以定量化的分子場(chǎng)參數(shù)作為變量,對(duì)藥物活性進(jìn)行回歸分析便可以反應(yīng)藥物與生物大分子之間的相互作用模式進(jìn)而有選擇地設(shè)計(jì)新藥。

分子定位在一個(gè)方格中,作為探針的粒子在盒子中游走

比較分子場(chǎng)方法將具有相同結(jié)構(gòu)母環(huán)的分子在空間中疊合,使其空間取向盡量一致,然后用一個(gè)探針粒子在分子周圍的空間中游走,計(jì)算探針粒子與分子之間的相互作用,并記錄下空間不同坐標(biāo)中相互作用的能量值,從而獲得分子場(chǎng)數(shù)據(jù)。不同的探針粒子可以探測(cè)分子周圍不同性質(zhì)的分子場(chǎng),甲烷分子作為探針可以探測(cè)立體場(chǎng),水分子作為探針可以探測(cè)疏水場(chǎng),氫離子作為探針可以探測(cè)靜電場(chǎng)等等,一些成熟的比較分子場(chǎng)程序可以提供數(shù)十種探針粒子供用戶選擇。

探針粒子探測(cè)得到的大量分子場(chǎng)信息作為自變量參與對(duì)分子生理活性數(shù)據(jù)的回歸分析,由于分子場(chǎng)信息數(shù)據(jù)量很大,屬于高維化學(xué)數(shù)據(jù),因而在回歸分析過(guò)程中必須采取數(shù)據(jù)降維措施,最常用的方式是偏最小二乘回歸,此外主成分分析也用于數(shù)據(jù)的分析。

CoMFA結(jié)果輸出統(tǒng)計(jì)分析的結(jié)果可以圖形化地輸出在分子表面,用以提示研究者如何有選擇地對(duì)先導(dǎo)化合物進(jìn)行結(jié)構(gòu)改造。右圖為一CoMFIA計(jì)算的結(jié)果輸出,圖中藍(lán)色區(qū)域若以負(fù)電性基團(tuán)取代則會(huì)提高藥物的活性,紅色區(qū)域則提示正電性基團(tuán)更有利于活性。除了直觀的圖形化結(jié)果,CoMFA還能獲得回歸方程,以定量描述分子場(chǎng)與活性的關(guān)系。

CoMSIA是對(duì)CoMFA方法的改進(jìn),他改變了探針粒子與藥物分子相互作用能量的計(jì)算公式,從而獲得更好的分子場(chǎng)參數(shù)。

三維定量構(gòu)效除了比較分子場(chǎng)方法,三維定量構(gòu)效關(guān)系還有距離幾何學(xué)三位定量構(gòu)效關(guān)系(DG 3D-QSAR)、分子形狀分析(MSA)、虛擬受體等方法(FR)等

距離幾何學(xué)三維定量構(gòu)效關(guān)系嚴(yán)格來(lái)講是一種介于二維和三維之間的QSAR方法。這種方法將藥物分子劃分為若干功能區(qū)塊定義藥物分子活性位點(diǎn),計(jì)算低能構(gòu)象時(shí)各個(gè)活性位點(diǎn)之間的距離,形成距離矩陣;同時(shí)定義受體分子的結(jié)合位點(diǎn),獲得結(jié)合位點(diǎn)的距離矩陣,通過(guò)活性位點(diǎn)和結(jié)合位點(diǎn)的匹配為每個(gè)分子生成結(jié)構(gòu)參數(shù),對(duì)生理活性數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。

分子形狀分析認(rèn)為藥物分子的藥效構(gòu)象是決定藥物活性的關(guān)鍵,比較作用機(jī)理相同的藥物分子的形狀,以各分子間重疊體積等數(shù)據(jù)作為結(jié)構(gòu)參數(shù)進(jìn)行統(tǒng)計(jì)分析獲得構(gòu)效關(guān)系模型。

虛擬受體方法是DG 3D-QSAR和CoMFA方法的延伸與發(fā)展,其基本思路是采用多種探針粒子在藥物分子周圍建立一個(gè)虛擬的受體環(huán)境,以此研究不同藥物分子之間活性與結(jié)構(gòu)的相關(guān)性。其原理較之CoMFA方法更加合理,是目前定量構(gòu)效關(guān)系研究的熱點(diǎn)之一。

方法評(píng)價(jià)定量構(gòu)效關(guān)系研究是人類最早的合理藥物設(shè)計(jì)方法之一,具有計(jì)算量小,預(yù)測(cè)能力好等優(yōu)點(diǎn)。在受體結(jié)構(gòu)未知的情況下,定量構(gòu)效關(guān)系方法是最準(zhǔn)確和有效地進(jìn)行藥物設(shè)計(jì)的方法,根據(jù)QSAR計(jì)算結(jié)果的指導(dǎo)藥物化學(xué)家可以更有目的性地對(duì)生理活性物質(zhì)進(jìn)行結(jié)構(gòu)改造。在1980年代計(jì)算機(jī)技術(shù)爆炸式發(fā)展之前,QSAR是應(yīng)用最廣泛也幾乎是唯一的合理藥物設(shè)計(jì)手段。

但是QSAR方法不能明確給出回歸方程的物理意義以及藥物-受體間的作用模式,物理意義模糊是對(duì)QSAR方法最主要的置疑之一。另外在定量構(gòu)效關(guān)系研究中大量使用了實(shí)驗(yàn)數(shù)據(jù)和統(tǒng)計(jì)分析方法,因而QSAR方法的預(yù)測(cè)能力很大程度上受到試驗(yàn)數(shù)據(jù)精度的限制,同時(shí)時(shí)常要面對(duì)“統(tǒng)計(jì)方法欺詐”的置疑。