Science 等了 57 天,就爲給這篇文章配一個封面

來源:進化隨想

2024 年 10 月 4 日,最新一期的 Science 雜誌以逆轉錄酶和核酸序列爲封面。這篇封面文章早在 2024 年 8 月 8 日,就已經在 Science 雜誌官網提前在線了,熟悉 Science 雜誌的朋友都知道,Science 雜誌一般會隨新一期的雜誌隨同發表最新的文章,一般不會提前在線未排期的文章,而這篇題爲 De novo gene synthesis by an antiviral reverse transcriptase 的文章,竟 57 天都未排期,原來就是爲了給他一個封面,當然這篇封面也指向 8 月 29 日在線的一篇題爲 Phage-triggered reverse transcription assembles a toxic repetitive gene from a noncoding RNA 來自張鋒團隊的文章。

這種通過 RNA 滾環逆轉錄形成的新基因,在表現形式上爲串聯重複,這無疑爲基因組註釋工作帶來了挑戰,目前的大多數註釋工具都無法正確識別這些隱秘的基因。同時這也是對遺傳信息流動(中心法則)的補充,從 RNA 處,也可以從頭產生可表達有功能,編碼新蛋白的基因。同時,這對於我們開發和改造生物體,認識生物的免疫防禦機制,複雜生物的演化,基因治療等領域也具有啓發意義。

聚焦於來自克雷伯氏肺炎菌的防禦相關逆轉錄酶系統,兩個研究團隊揭示了一種滾環逆轉錄機制。該機制生成的串聯 cDNA 在噬菌體感染時被轉化爲雙鏈 DNA,進而導致幾乎無止境開放閱讀框(neo)mRNA 的轉錄,該 mRNA 編碼一種 Neo 多肽。這些研究強調了通過 RNA 模板基因創造擴展基因組編碼潛力的重要性。詳見第 25 頁,eadq0876 和 eadq3977。

Illustration: A. Mastin/Science

Stephen Tang et al. ,De novo gene synthesis by an antiviral reverse transcriptase.Science386,eadq0876(2024).DOI:10.1126/science.adq0876

編輯總結

分子生物學的中心法則指出,遺傳信息從 DNA 和 RNA 流向蛋白質,而逆轉錄則將 RNA 轉化爲 DNA。在探索細菌如何抵禦病毒感染的過程中,兩個研究團隊發現了從 RNA 產成新基因的替代途徑,而這些 RNA 之前並不編碼蛋白質(參見 Osterman 和 Sorek 的評論文章)。Tang 等人發現了一種機制,其中一種逆轉錄酶利用 RNA 模板合成全新基因,從而表達出重複且幾乎無止境的開放閱讀框(Neo)蛋白,這些蛋白能夠阻止細胞生長並限制病毒傳播。Neo 的隱秘編碼顛覆了傳統的遺傳信息流動模式,強調了其他生物學背景下可能存在隱藏基因的潛力。Wilkinson 等人發現,某些細菌通過逆轉錄將 RNA 複製爲端到端的 DNA 重複序列。重複的 DNA 重新構建了一個基因,並可轉錄爲編碼有毒蛋白的重複 RNA。細菌利用這種基因合成能力生成超毒性蛋白質,以抵禦病毒感染。——Di Jiang

結構化摘要

引言

細菌病毒,或稱噬菌體,是地球上最豐富的生命形式,它們長期寄生於細菌宿主,導致多種抗病毒防禦系統的出現。令人好奇的是,這些抵禦入侵者的防禦途徑所依賴的酶機制,往往源自移動遺傳元件。例如,CRISPR-Cas 系統就是通過對轉座子編碼核酸酶的反覆適應進化,用於 RNA 引導的病毒 DNA 切割。最近的研究也表明,逆轉錄酶(RT)源自反轉座子,參與噬菌體的防禦。然而,與 CRISPR-Cas 核酸酶降解外源 DNA 不同,這些與防禦相關的逆轉錄酶(DRT)系統通過合成互補 DNA(cDNA)提供保護。迄今爲止,cDNA 生成與抗病毒免疫之間的分子通路仍不清楚。

研究動機

在本研究中,我們着手調查 DRT2 免疫系統的噬菌體防禦的分子機制。雖然噬菌體防禦操縱子通常表現出模塊化結構,編碼不同的傳感器和效應蛋白結構域,DRT2 系統僅包含 RT 基因及其上游的非編碼 RNA(ncRNA)。免疫過程需要 ncRNA 和完整的 RT 催化結構域,但它們各自在防禦活動中的作用尚不明確。鑑於 DRT2 中缺乏其他可識別的功能結構域,我們推測 RT 會生成具有效應功能的 cDNA,識別此 cDNA 及其功能可能揭示核酸的新生物學作用。

研究結果

我們開發了一種系統的實驗方法來識別由特定 RT 合成的 cDNA,並將該方法應用於異源表達在大腸桿菌中的克雷伯氏肺炎菌 DRT2 系統(KpnDRT2),以確定其 「 逆轉錄組 」。數據表明,KpnDRT2 逆轉錄的唯一底物是上游的 ncRNA。生物信息學分析發現,ncRNA 兩側具有保守的結構元件,包圍一個可變的模板區域,對這些元件的干擾揭示了對 RT 結合和 cDNA 合成至關重要的區域。出乎意料的是,實驗還揭示了 RT 從模板區末端精確跳轉回起點的模板跳躍現象。通過反覆的 cDNA 合成和模板跳躍生成了串聯重複的 cDNA(ccDNA),這一過程我們稱之爲滾環逆轉錄。儘管表達 KpnDRT2 的細胞持續生成單鏈 ccDNA,噬菌體的存在會觸發 ccDNA 產量的增加以及互補鏈的合成。雙鏈 ccDNA 在每個重複序列之間形成共識啓動子元件,幷包含一個未被常規終止密碼子限制的開放閱讀框(ORF)。ccDNA 編碼的近乎無止境的 ORF(Neo)基因在轉錄和翻譯後,細胞進入生長停滯狀態,限制病毒的複製和擴散。系統發育分析和同源篩查實驗表明,滾環逆轉錄和 Neo 引發的生長停滯是 DRT2 免疫系統的廣泛保守特徵。

結論

我們的研究揭示了一種由細菌逆轉錄酶家族介導的優雅且前所未有的抗病毒免疫機制,其影響範圍廣泛,涵蓋生物學和生物技術。滾環逆轉錄合成串聯重複的 cDNA 產品是一種獨特的生化活動,如果加以利用,可能能夠在體外或體內實現 RNA 模板的程序化擴增。此外,DRT2 系統中以 RNA 爲模板的基因創造途徑展示了 RNA 作爲遺傳信息載體的多功能性,並挑戰了傳統的基因編碼、遺傳和存儲觀念。通過逆轉錄酶介導的原基因串聯化合成成熟的 Neo 基因,爲普遍認爲基因沿一維 DNA 軸線性編碼的範式提供了強有力的對立論點。標準的基因註釋方法都未能識別 Neo 基因,這引發了一個令人信服的可能性:仍有其他編碼關鍵細胞功能的隱秘基因有待發現。

Max E. Wilkinson et al.Phage-triggered reverse transcription assembles a toxic repetitive gene from a noncoding RNA.Science386, eadq 3977(2024).DOI:10.1126/science.adq3977

編輯總結

分子生物學的中心法則指出,遺傳信息從 DNA 和 RNA 流向蛋白質,逆轉錄過程則將 RNA 轉化爲 DNA。在探索細菌如何抵禦病毒感染的過程中,兩個研究團隊發現了從 RNA 生成基因的替代途徑,而這些 RNA 之前並不編碼蛋白質(參見 Osterman 和 Sorek 的評論文章)。Tang 等人發現了一種機制,其中一種逆轉錄酶利用 RNA 模板合成全新基因,從而表達出重複且幾乎無止境的開放閱讀框(Neo)蛋白,這些蛋白可以阻止細胞生長並限制病毒傳播。Neo 的隱秘編碼顛覆了傳統的遺傳信息流動,強調了在其他生物學背景下可能存在的隱藏基因。Wilkinson 等人發現,某些細菌通過逆轉錄將 RNA 複製爲端到端的 DNA 重複序列。重複的 DNA 重新組成一個基因,並可轉錄爲編碼有毒蛋白的重複 RNA。細菌利用這種基因合成能力生成超毒性蛋白質,以抵禦病毒感染。——Di Jiang

結構化摘要

引言

RNA 到 DNA 的轉化,或逆轉錄,通常與 RNA 爲基礎的移動遺傳元件(如病毒或反轉座子)相關,但也可以被細胞馴化用於細胞功能。在許多真核生物中,逆轉錄通過端粒酶用於在染色體末端合成重複 DNA,以保護基因組的完整性,而逆轉錄酶結構域蛋白是真核剪接體的核心。在細菌中,各類逆轉錄酶可用於抵禦噬菌體感染。這其中有一部分,稱爲 retros,可通過形成具有多種酶活性的 RNA-DNA-蛋白質複合物在噬菌體感染時被激活,但其他與防禦相關的逆轉錄酶如何抑制噬菌體的傳播尚不明確。

研究動機

我們之前發現了一類與防禦相關的逆轉錄酶,它們與一種非編碼 RNA 結合,並可抵禦 T5 噬菌體的感染。在本研究中,我們探討了這些被稱爲 2 型防禦逆轉錄酶(DRT2)系統的具體機制。我們推測,這種非編碼 RNA 是逆轉錄酶的底物,而 RNA 指導合成的 DNA 對於 T5 防禦非常重要

研究結果

我們通過 DNA 測序發現,T5 感染會觸發一種長重複 DNA 分子的生成,該分子以非編碼 RNA 的中心序列爲模板。重複的 DNA 包含一個 120 個鹼基對的頭對頭序列,可以長達數千鹼基對。相鄰的重複序列重新構建了一個啓動子序列,導致類似的長重複 RNA 的轉錄。

我們發現,這種長重複 RNA 包含一個長重複開放閱讀框,編碼一種重複的蛋白質序列。儘管這種蛋白質不含任何已知的酶活性結構域,但其毒性極強,且毒性隨重複次數增加而增強。通過抑制細胞生長,它有效防止了病毒的傳播。

爲了理解重複 DNA 合成的機制,我們純化了一個包含逆轉錄酶和非編碼 RNA 的複合物。即使在沒有任何噬菌體刺激的情況下,純化的複合物在體外仍具有高度活躍的逆轉錄和重複合成功能。在高濃度核苷酸底物存在下,它可以生成長達 6000 個鹼基對的 DNA,包含多達 50 個重複序列。納米孔測序表明,這種重複 DNA 形成了一個延展的髮夾結構,實際上使其成爲雙鏈 DNA,這是其後續轉錄和翻譯的必要特性。

我們通過冷凍電子顯微鏡確定了逆轉錄酶-非編碼 RNA 複合物的結構。非編碼 RNA 呈現複雜摺疊,並圍繞逆轉錄酶蛋白形成假結,這種摺疊將重複模板序列呈現給逆轉錄酶活性位點。純化的複合物中含有一個自合成的五核苷酸 DNA 引物,該引物共價連接到非編碼 RNA 的末端。在覈苷酸添加後,引物延伸形成重複 DNA,這伴隨着非編碼 RNA 結構的變化,形成了一個新生 DNA 的出口通道。

結論

DRT2 逆轉錄酶系統的機制引入了一種在轉錄或翻譯之前的基因調控新層面:通過編碼序列合成進行的調控。對於特別有毒且重複的基因產物來說,這種調控方式可能具有優勢。一個完整的編碼序列可以隱藏在表面上是非編碼的 RNA 中,這對標準的基因組註釋方法提出了挑戰,其他功能基因也可能以類似方式隱藏。原核生物通過馴化逆轉錄酶來合成重複 DNA 並從不連續的基因組片段重組基因序列,其活動類似於遠親的真核生物,如端粒酶和剪接體。這突顯了原核生物可以使用更加緊湊高效的系統來與真核生物的分子生物學複雜性相匹敵。