版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-并不精確的“中心法則”,RNA偏差會(huì)對人們產(chǎn)生什么影響?

我是科學(xué)家
原創(chuàng)

作者:Ed Yong

編輯:月月

在我們體內(nèi),超大容量的信息一次又一次地被復(fù)制,這個(gè)過程不但可靠,還可以被預(yù)測。我們的生命正是依賴于此。 只是復(fù)制過程中偶爾有出錯(cuò)的時(shí)候,但問題不大,很快就能自動(dòng)更正。

一切是從DNA開始的。

DNA結(jié)構(gòu)圖。圖片來源:pixabay

這個(gè)赫赫有名的分子是由四個(gè)堿基組成的長鏈,這四個(gè)堿基分別是腺嘌呤A,胞嘧啶C,鳥嘌呤G和胸腺嘧啶T。它們通過不同的組合方式,形成指導(dǎo)數(shù)千種蛋白合成的信息。但要合成蛋白,DNA首先要復(fù)制(或“轉(zhuǎn)錄”)出一個(gè)叫做RNA的分子。

RNA也由四種堿基構(gòu)成,其中依然有A,C,G,但是T被尿嘧啶U取代。RNA鏈上每三個(gè)連續(xù)的堿基代表一種氨基酸,它是組成蛋白質(zhì)的基本單位 。細(xì)胞內(nèi)的核糖體能沿著RNA鏈讀取上面的密碼子,然后將氨基酸按照正確的序列串接起來。

DNA指導(dǎo)RNA合成,RNA又指導(dǎo)蛋白質(zhì)合成,這就是 “生命的中心法則” 。 人們通常認(rèn)為這一信息傳遞的過程是非常精確的,每一個(gè)RNA序列都和它的模板DNA鏈完全匹配。 給出一個(gè)DNA片段,我們就能預(yù)測出它對應(yīng)的RNA鏈上堿基確切的排列方式,以及翻譯出來的蛋白質(zhì)的氨基酸序列。

圖片來源:www.pexels.com

但事實(shí)并非總是如此。

在轉(zhuǎn)錄過程中還是會(huì)有錯(cuò)誤出現(xiàn)。 有些錯(cuò)誤是由插入了錯(cuò)誤的堿基引起的,這類錯(cuò)誤通常能由校正蛋白修正。 而其他的錯(cuò)誤則是有意的編輯,例如,脫氨基酶常將A轉(zhuǎn)變成G,或?qū)轉(zhuǎn)變成U(這一類不太常見)。

來自賓夕法尼亞大學(xué)醫(yī)學(xué)院的李銘堯(Mingyao Li)和亞莎貝爾?王(Isabel Wang)發(fā)現(xiàn),上述的第二種錯(cuò)誤遠(yuǎn)比我們所了解的有意編輯復(fù)雜得多。

李和王從27個(gè)不相關(guān)的人身上提取了白細(xì)胞,觀察其DNA和RNA序列。他們發(fā)現(xiàn)在整個(gè)基因組中, RNA和DNA的序列中不相匹配的地方超過一萬個(gè),涉及到了我們身上多于三分之一的基因 。 其中有些是科學(xué)家已經(jīng)知道的,但有半數(shù)左右從未被發(fā)現(xiàn)。李和王將此稱為“RNA-DNA差異”,簡稱為RDD。

他們?yōu)榱舜_定這樣的結(jié)果并不是因?yàn)樗麄兊臏y序方法出現(xiàn)了錯(cuò)誤,特地請了不同的實(shí)驗(yàn)室來準(zhǔn)備這些樣本并進(jìn)行測序。他們將測序重點(diǎn)放在他們已掃描了好幾遍的那部分基因組,以及不同人之間DNA序列相同的那些位點(diǎn)上。他們還使用了從特定人身上提取的細(xì)胞,這些人的DNA已經(jīng)由兩大遺傳學(xué)計(jì)劃進(jìn)行了測序。它們分別是國際人類基因組單體型圖計(jì)劃和千人基因組計(jì)劃。李和王測出的序列與兩大計(jì)劃得出的結(jié)果一致。

圖片來源:www.pexels.com

RDD并不是隨機(jī)出現(xiàn)的錯(cuò)誤。 每個(gè)RDD至少在兩個(gè)人中出現(xiàn),有80%在半數(shù)樣品中出現(xiàn),而且在嬰兒和成人中都有發(fā)現(xiàn),在27個(gè)實(shí)驗(yàn)對象以外的人群內(nèi)也存在。 RDD還存在于其他類型的細(xì)胞,如神經(jīng)元、皮膚細(xì)胞、胚胎干細(xì)胞及癌細(xì)胞中。在每個(gè)給定的位點(diǎn),即便是在不同的人體內(nèi),RDD都是相同的。也就是說,若DNA中的一個(gè)T堿基在轉(zhuǎn)錄成RNA后變成了G堿基,那它總是變成G,而非A或C。這其中必遵循一個(gè)原則來確定那個(gè)位置的堿基被編輯成了什么。

這些受錯(cuò)誤支配的分子與那些正確轉(zhuǎn)錄的分子共同存在。在任何RDD中,大約20%的RNA序列與它們的模板DNA不同,而其他的都能精確匹配。但這個(gè)數(shù)字只是個(gè)平均值,李和王發(fā)現(xiàn),在有些位點(diǎn),幾乎每個(gè)RNA序列都有RDD存在。

這些錯(cuò)誤延續(xù)到了蛋白質(zhì) 。李和王發(fā)現(xiàn)幾種蛋白質(zhì)上的氨基酸序列是按照已改變過的RNA序列排列的,而非原始的DNA序列。大約三分之一的RDD會(huì)導(dǎo)致氨基酸序列的改變,但是只有約百分之一完全影響到了蛋白質(zhì)的大小。 例如,在RPL28基因上的一個(gè)RDD導(dǎo)致翻譯出的蛋白質(zhì)多出了55個(gè)氨基酸。

就目前來說,李和王 尚不清楚RDD是如何產(chǎn)生的。堿 基的改變是在合成RNA鏈時(shí)發(fā)生的,還是此后在RNA鏈上被編輯的?在某個(gè)位點(diǎn)上由什么來決定哪個(gè)堿基被取代?最重要的是,這一現(xiàn)象有什么意義?它們是否會(huì)影響我們的行為、我們的發(fā)育和我們的身體特征?是否會(huì)引發(fā)某種疾?。?/p>

他們認(rèn)為,要回答這些問題, 人們在研究基因組的同時(shí),也要把同樣的精力放在轉(zhuǎn)錄組上。 到目前為止,有關(guān)DNA的研究方興未艾,例如, 人們已花費(fèi)了數(shù)百萬美元來研究如何將基因組里那些提高患病風(fēng)險(xiǎn)的變異除去。 但是,DNA僅是冰山一角。同樣的DNA片段能夠轉(zhuǎn)錄并編輯成不同的RNA鏈,從而產(chǎn)生不同的蛋白。

基因組測序的元老級(jí)人物喬治?丘奇(George Church)認(rèn)為,下一代測序技術(shù)的大潮肯定有助于解決這些問題。我們的工具越來越強(qiáng)大,我們所掌握的知識(shí)也越來越深入。

排版:昕旸

題圖來源:pixabay