技術(shù)的建立
大多數(shù)生物體進(jìn)化都來(lái)自于自然選擇和性繁殖,其中在真核生物性重組便是生物進(jìn)化的一種主要方式。早在1990年, Marton和Meyerhans等人就已經(jīng)發(fā)現(xiàn)在體外PCR中存在的DNA重組現(xiàn)象,并指出該重組現(xiàn)象是由DN A斷裂或出現(xiàn)切口引起的。1994年美國(guó)的Stemmer 等以LacZα基因?yàn)閷?shí)驗(yàn)材料,用DNase I進(jìn)行消化,得到10~ 70 bp大小的隨機(jī)片段集合, 在不加入引物的情況下, 利用PCR得到了全長(zhǎng)的LacZα產(chǎn)物,從而以巧妙的設(shè)計(jì)驗(yàn)證了體外PCR中存在的DNA重組現(xiàn)象。Stemmer 將該技術(shù)稱(chēng)為體外DN A shuffling 技術(shù),并于1998年申請(qǐng)了專(zhuān)利。由于該方法一定程度上模擬了生物體自然進(jìn)化過(guò)程中減數(shù)分裂期等位基因間的DNA片段互換(有性交換, sexual exchange) ,故DNA shuffling 又被稱(chēng)為有性PCR(sexual PCR)1。
技術(shù)的原理DNA shuffling 技術(shù)是一種利用多次、反復(fù)選擇和重組以獲得具有預(yù)期性狀的多聚核苷酸的方法。其原理大致如下: 先將由多種同源核苷酸序列組成的模板(初級(jí)文庫(kù))進(jìn)行隨機(jī)片斷化,所產(chǎn)生的隨機(jī)片段集合包含了至少1000種以上寡核苷酸,這些寡核苷酸來(lái)自不同的同源序列,具有不同的3′末端,這一點(diǎn)是下一步隨機(jī)重排的前提條件。利用PCR技術(shù)在不加入引物的情況下對(duì)這些隨機(jī)化片段進(jìn)行重新排布: 在起初的幾輪循環(huán)中, 具有互補(bǔ)3′末端的來(lái)自不同模板序列的寡核苷酸互為引物,擴(kuò)增出一段較長(zhǎng)的核苷酸產(chǎn)物; 接著下一輪循環(huán)時(shí),以上輪產(chǎn)物為模板,又將產(chǎn)生一段更長(zhǎng)的核苷酸產(chǎn)物,隨著擴(kuò)增數(shù)遞增,模板的不斷變化,產(chǎn)物長(zhǎng)度亦在不斷遞增,如此,經(jīng)過(guò)多輪擴(kuò)增,最終將獲得多種低拷貝的全長(zhǎng)的重排產(chǎn)物,這些集合的重排產(chǎn)物又被稱(chēng)為嵌合文庫(kù)(突變文庫(kù))。對(duì)嵌合文庫(kù)進(jìn)行篩選,選擇改良的突變體組成下一輪shuffling 的模板(次級(jí)文庫(kù)) ,重復(fù)上述步驟進(jìn)行多次重排和篩選,直到最終獲得性狀比較理想的突變體。
利用隨機(jī)化片段的重新排列組合產(chǎn)生多樣化的突變文庫(kù)是DNA shuf fling 技術(shù)的精髓所在,這一點(diǎn)有點(diǎn)類(lèi)似assembly PCR。其優(yōu)點(diǎn)是: 可以在體外實(shí)現(xiàn)同源序列間的重組,并可能實(shí)現(xiàn)那些對(duì)進(jìn)化有利的點(diǎn)突變的優(yōu)化組合,最終獲得性狀改良比較理想的突變體1。
具體方法目的性狀的確立和模板的來(lái)源目的蛋白的改造必須針對(duì)一定的表型特征,即要針對(duì)特定的目的性狀,包括結(jié)構(gòu)和功能方面的特性。如熒光蛋白的熒光強(qiáng)度、最大波長(zhǎng)及酶的催化能力、熱穩(wěn)定性、底物的專(zhuān)一性等。此外,一些DNA調(diào)控序列,如啟動(dòng)子、5′UTR、3′UTR等也可以作為靶序列進(jìn)行改造以改善其調(diào)控功能。模板可以由多個(gè)同源序列或同源基因(如家族基因)組成初級(jí)文庫(kù)( primary libiary ) ,也可以單個(gè)基因組成。后者在DNA shuffling 之前要先利用其它突變方法對(duì)單個(gè)基因進(jìn)行突變, 或在DNA shuffling 的同時(shí)借助聚合酶產(chǎn)生的點(diǎn)突變以產(chǎn)生多樣性的突變產(chǎn)物。同源靶序列的長(zhǎng)度在50 bp~ 50 kb之間,一般通過(guò)PCR獲得,反應(yīng)后應(yīng)除去多余的引物, 以提高重組效率。
隨機(jī)片斷化處理初級(jí)文庫(kù)(模板)用DNase I或多種內(nèi)切酶處理后,獲得隨機(jī)片段集合。隨機(jī)片段大小應(yīng)在20~ 500bp之間為宜。并對(duì)片段集合進(jìn)行純化,除去未消化的模板,以避免原序列的污染。
無(wú)引物的PCR擴(kuò)增在不加引物的情況下,將以上片段集合置于適當(dāng)?shù)腜CR系統(tǒng)中進(jìn)行PCR擴(kuò)增。該步要求片段集合有較高的總量和濃度,同時(shí)還要求PCR反應(yīng)有較高的循環(huán)數(shù),以保證產(chǎn)生多樣性足夠好的嵌合文庫(kù)(突變文庫(kù))。
加入引物的PCR擴(kuò)增上一步的PCR產(chǎn)物按一定比例稀釋,同時(shí)加入兩外側(cè)引物, 選用較少的循環(huán)數(shù), 如15輪, 進(jìn)行PCR擴(kuò)增,便可獲得大量的全長(zhǎng)目的基因,即放大的嵌合文庫(kù)(突變文庫(kù))。有時(shí)PCR產(chǎn)物中還可能存在全長(zhǎng)目的基因的線形多拷貝聚合體,如Stemmer等對(duì)全長(zhǎng)2. 7 kb的pUC19質(zhì)粒進(jìn)行DN A shuffling 時(shí),得到的產(chǎn)物大多在20 kb以上,但用適當(dāng)?shù)膬?nèi)切酶消化后,即得到均一的全長(zhǎng)目的基因。
克隆、篩選、分析及多輪篩選PCR產(chǎn)物用適當(dāng)?shù)膬?nèi)切酶處理,克隆到表達(dá)載體中并轉(zhuǎn)入宿主細(xì)胞(如大腸桿菌,噬菌體等)中進(jìn)行表達(dá),在特定的選擇壓力下,選擇目的性狀改良的突變體; 將選擇到的突變體混合在一起,作為下一次DNA shuffling 的模板(次級(jí)文庫(kù)) ,選擇壓力不斷提高,重復(fù)1~ 5步驟進(jìn)行多次選擇和重組,直到最終得到性狀改良明顯的理想的突變體為止。在進(jìn)行DNA shuf fling 時(shí),最重要的是選擇合適的篩選模型,只有選擇的模型恰當(dāng),才會(huì)減少工作量,快速地實(shí)現(xiàn)預(yù)期目標(biāo)。如欲提高酶的熱穩(wěn)定性,應(yīng)以不斷遞增的溫度為選擇壓力,通過(guò)突變產(chǎn)物(酶)對(duì)底物的活性變化來(lái)篩選熱穩(wěn)定性改良的酶;如果改造對(duì)象是細(xì)菌的酶,還可以選擇該酶缺陷的細(xì)菌為宿主細(xì)胞進(jìn)行篩選。
改進(jìn)自Stemmer提出DNA shuffling 以來(lái), 這種體外DNA 重組的方式引起了各國(guó)學(xué)者濃厚的興趣, 包括Stemmer本人在內(nèi)的許多學(xué)者提出各種改進(jìn)方法, 使DNA shuffling 技術(shù)更加多樣化, 在不同需求的引導(dǎo)下發(fā)展出了一些各具特色的新方法2。
DNA-family -shufflingDNA-family -shuffling 技術(shù)是根據(jù)自然界中存在許多物種來(lái)源不同、基因序列有所差異但功能相似的基因家族建立的, 用于改組的基因家族中的一組基因, 可以是來(lái)源于同一物種的某一基因家族, 也可以是來(lái)源于不同物種、屬間有一定程度同源性的基因, 該技術(shù)在體外模擬達(dá)爾文進(jìn)化的過(guò)程, 大大提高了基因體外定向進(jìn)化的速度和效率。
DNA-family -shuffling 技術(shù)與單基因shuffling 相比, 具有兩個(gè)明顯的優(yōu)勢(shì):首先, 改良效率高。Crameri A 等[2] 在實(shí)驗(yàn)中選用了4 種同源性為58 ~ 82%的來(lái)自不同菌屬的頭孢菌素C酶基因作為親本, 改組后使酶活性增加了270 ~ 540 倍, 而單基因shuffling 只增加了8 倍。其次, 提高了突變機(jī)率。由于基因家族改組的塊交換特性(block -exchange nature), 使得突變的幾率大大提高了, 前例中β 內(nèi)酰胺酶基因在3 次單基因改組循環(huán)后, 只得到了一株4 個(gè)突變氨基酸的突變株, 而四個(gè)頭孢菌素C 酶基因在一次DNA-family -shuffling 后就產(chǎn)生了102 ~196 個(gè)突變氨基酸的突變株。
StEPStEP(Staggered extension process, 交錯(cuò)延伸程序)是指在一個(gè)反應(yīng)體系中以?xún)蓚€(gè)以上相關(guān)的DNA 片段為模板, 進(jìn)行類(lèi)似PCR 反應(yīng), 合成在目的基因兩側(cè)的引物, 引物先在一個(gè)模板鏈上延伸, 隨之進(jìn)行多輪變性和短暫的復(fù)性-延伸循環(huán)。每次循環(huán)被延伸的片段在復(fù)性時(shí)與不同的模板配對(duì), 并延伸一段非常短的距離。由于模板的改變, 所合成的DNA 片段中包含了不同模板DNA 的信息。這種交錯(cuò)延伸過(guò)程繼續(xù)進(jìn)行, 直到獲得全長(zhǎng)的基因。
StEP 在效果上與DNA shuffling 技術(shù)是類(lèi)似的, 但與之相比省去了用DNA 酶切割成片段的過(guò)程, 因而更為簡(jiǎn)便。StEP 技術(shù)的關(guān)鍵在于找到一個(gè)可以使引物退火(T退火>Tm -25 ℃)但又降低聚合酶反應(yīng)速率或降低延伸溫度的反應(yīng)條件, 使得片段可以隨機(jī)雜交到包含不同突變的模板上。
無(wú)PCR的shuffling該方法利用一些限制性?xún)?nèi)切酶(如Fok 和Bbv 等), 其識(shí)別位點(diǎn)位于切割位點(diǎn)上游或者下游若干堿基處, 對(duì)親本序列切割后生成的黏端通常是各不相同且非回文序列的黏端, 酶切后用連接酶連接, 得到順序正確的重組裝基因文庫(kù)。該方法由王強(qiáng)等于2004 年提出, 他們構(gòu)建了一個(gè)微型shuffling 文庫(kù), 其親本分別為人組織型纖溶酶原激活劑(tissueplasminogen activator , tPA)基因以及含有7 個(gè)突變位點(diǎn)的tPA 基因。此方法操作相對(duì)簡(jiǎn)便, 然而, 因?yàn)橹挥心墚a(chǎn)生彼此不同且非回文序列黏端的內(nèi)切酶可以使用, 此方法受到內(nèi)切酶酶切位點(diǎn)特異性的限制, 使得DNA 片段化的隨機(jī)性較低, 還需要進(jìn)一步完善。
SCRATCHSCRATCH 技術(shù)是DNA shuffling 與ITCHY (Incremental truncationfor the creation of hybrid enzymes, 產(chǎn)生雜交酶的增加平截技術(shù))相結(jié)合而產(chǎn)生的技術(shù), 先將兩個(gè)相關(guān)酶基間經(jīng)單酶切打開(kāi)一個(gè)切口, 為外切酶Exo Ⅲ 提供作用位點(diǎn), Exo Ⅲ 每隔一定時(shí)間(如30s)取一次樣、滅活。然后將兩基因的酶解產(chǎn)物混合,平端連接, 生成ITCHY 庫(kù), 再以ITCHY 庫(kù)作為親本進(jìn)行DNAshuffling 。
一般來(lái)說(shuō), DNA shuffling 不能用于改組同源性低于70% ~80%的基因, 而SCRATCH 具有不依賴(lài)基因序列的同源性而產(chǎn)生多個(gè)DNA 雜交位點(diǎn)的特點(diǎn)。
RACHITTRACHITY(Random Chimeragenesis on Transient Templates , 過(guò)渡模板隨機(jī)嵌合技術(shù))將某一親本基因作為臨時(shí)DNA 模板, 將另一親本基因(不同種或?qū)?進(jìn)行酶切與臨時(shí)模板進(jìn)行雜交,然后退火延伸連接成新鏈, 此時(shí)由于錯(cuò)配或疊交將產(chǎn)生突變,形成突變基因庫(kù)。較目前報(bào)道的體外重組而言, RACHITT 是雜交次數(shù)最多的方法, 可以減少重排片斷的大小, 并增加每個(gè)基因的重組機(jī)率。
體外exon shuffling體外exon shuffling是模擬自然界外顯子洗牌的過(guò)程, 在建立好的同源基因文庫(kù)中, 設(shè)計(jì)與各作為模板的同源基因的內(nèi)含子有同源性的嵌合寡核苷酸, 以此作為引物進(jìn)行擴(kuò)增, 得到內(nèi)含子-外顯子嵌合的片段, 此后再以擴(kuò)增產(chǎn)物自身作為引物和模板進(jìn)行PCR 反應(yīng), 獲得全長(zhǎng)突變基因庫(kù)。該技術(shù)不局限于某單個(gè)基因的范疇, 而是將每個(gè)外顯子編碼的折疊結(jié)構(gòu)域作為單位, 因此, 體外exon shuffling 可以將多個(gè)不同功能的蛋白作為親本, 產(chǎn)生不同特性的突變基因庫(kù),引入更多的理性設(shè)計(jì)。
應(yīng)用生物制藥抗生素是生物醫(yī)藥的主要產(chǎn)品之一。但大量使用的結(jié)果導(dǎo)致病菌耐藥性的增強(qiáng)。1998年,Crameri等選用四個(gè)編碼頭胞霉素的基因進(jìn)行DNAfamilyshuffling的改造提高的表達(dá)量比野生型的高34-68倍。Yano等在改造大腸桿菌對(duì)青霉素的抗性時(shí)也獲得了對(duì)其他抑制細(xì)胞壁形成的藥物的抗性。在疫苗和抗體;細(xì)胞因子;生長(zhǎng)因子等方面也得到了應(yīng)用。
工業(yè)工業(yè)用酶常需表達(dá)量高,活性強(qiáng),能耐酸堿等極端環(huán)境。枯草菌素來(lái)自枯草桿菌是一種具有商業(yè)價(jià)值的絲氨酸水解酶。在改造后在對(duì)底物的活性、溫度敏感性、溶劑穩(wěn)定性和pH值的依賴(lài)性都優(yōu)于最佳親本。提高工業(yè)上的其他酶類(lèi)如脂肪酶、蛋白酶、淀粉酶、植酸酶、漆酶、纖維素酶等在非生物環(huán)境下的穩(wěn)定性,特異性。
育種反轉(zhuǎn)錄病毒是人類(lèi)基因治療的一種載體,但用常規(guī)培養(yǎng)工藝需將濃度提高100倍,因此常用超速離心等物理方法。但反轉(zhuǎn)錄病毒在這些方法中極不穩(wěn)定,而喪失活性,這可能與病毒外殼蛋白組分有關(guān)。小鼠C型反轉(zhuǎn)錄病毒外殼蛋白由兩個(gè)亞基SU(gP70)和TM(PISE)組成,它們負(fù)責(zé)與細(xì)胞受體結(jié)合并與質(zhì)膜融合。SU和TM是由不穩(wěn)定的二硫鍵結(jié)合在一起的,反轉(zhuǎn)錄病毒的不穩(wěn)定性是因?yàn)镾U結(jié)構(gòu)域的喪失。用DNAshuming的方法得到一批含復(fù)雜成分的重組外殼蛋白,并對(duì)超速離心具有抗性、穩(wěn)定性高于親本30-100倍的新病毒系。同樣使用該方法得到了新的牛痘疫苗。
農(nóng)業(yè)Cigan等改造了從Pentadethra這種植物中獲得殺蟲(chóng)基因獲得了新的pentin-l殺蟲(chóng)基因,并申請(qǐng)了專(zhuān)利。Mepherson等則用DNA shuffiing等技術(shù)改善蛋白酶抑制劑的性質(zhì)從而對(duì)廣泛的線蟲(chóng)種群有很好的抗性。
環(huán)境工程將一個(gè)可以把除草劑“勞去凈”脫氯的蛋白質(zhì)經(jīng)過(guò)多輪DNA shuffiing和篩選得到一個(gè)有n個(gè)氨基酸突變的新基因,用于城市污水處理系統(tǒng)。Kumamaru等在1998年和Fumkawa等在1995年通過(guò)改造降解PCB(多氯聯(lián)苯)的代謝途徑中的一些酶類(lèi)來(lái)提高降解能力和范圍3。