5萬人一千多種疾病,復旦團隊破譯最全人類健康與疾病蛋白質圖譜
知識分子
The Intellectual
圖源:受訪者供圖
撰文 | 蘇惟楚
編輯 | 李珊珊
01
“血液檢測阿爾茨海默病”展開的宏大構想
最初的想法是從研究阿爾茨海默病開始的。
“大家都知道,阿爾茨海默病(癡呆的主要類型)發病之後,干預已經晚了。我們一直想,有沒有可能像測血糖一樣,抽個血就可以在早期檢測阿爾茨海默。”
鬱金泰這樣回憶,這位42歲的醫生是復旦大學附屬華山醫院神經內科教授,也是國家神經疾病醫學中心(華山)認知障礙方向帶頭人。33歲時,他作爲研究項目的牽頭人,聯合多位國際專家,歷時五年制定了全球首個阿爾茨海默病循證預防國際指南。
今年2月,他帶領團隊和復旦大學類腦智能科學與技術研究院程煒研究員團隊進行合作,發表了一項工作。他們採用大規模蛋白質組學數據和人工智能算法,對近1500種血漿蛋白質進行篩選分析,發現了11種可預測未來癡呆風險的血漿蛋白質,基於這些蛋白質的水平變化可提前15年預測癡呆發病風險。
這項工作被Nature(《自然》)雜誌作爲頭條的新聞進行報道,指出這項大規模篩查研究的結果可能被用於開發血液檢測方法,在症狀出現之前診斷阿爾茨海默病等疾病。
鬱金泰說,“當時也是比較震撼的,後續有一些公司聯繫我們,希望基於這項工作開發試劑盒。”
就在進行這一工作的過程中,鬱金泰萌生了一個大膽的想法,“僅僅一種疾病,我們做了相關的工作就可能產生這麼大的影響,如果我們把蛋白質圖譜繪製出來,分析很多種疾病和蛋白的關係,對新標誌物的識別與新靶點的研發肯定會幫助巨大。”
這是一個非常宏大的構想。在這個構想中,研究者試圖構建迄今爲止最全面的蛋白質組與人類健康與疾病的圖譜,並結合人工智能算法構建疾病診斷預測模型,探究藥物治療新靶點。
歷時近一年,這項工作發表在了11月22日的生命科學頂刊Cell(《細胞》),文章標題爲Atlas of the plasma proteome in health and disease in 53,026 adults(《53,026名成人健康與疾病血漿蛋白質組圖譜》)。[1]
在這項研究中,研究者繪製了一幅健康與疾病蛋白質圖譜,涵蓋了2,920種血漿蛋白質與406種既往患病、660種隨訪新發疾病以及986種健康相關表型,揭示了168,100個蛋白質-疾病關聯和554,488個蛋白質-表型關聯。
此外,研究者發現超過650種蛋白質與至少50種疾病存在聯繫,同時還發現了26個藥物治療新靶點,並建立了一個可開放訪問的蛋白質組-表型組資源數據庫Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。這個數據庫不僅有助於科學家們更好地理解疾病的生物學機制,還將加速疾病生物標誌物、預測診斷模型和治療靶點的有效開發。
可開放訪問的蛋白質組-表型組資源數據庫
最爲重要的是,鬱金泰告訴《知識分子》,他們試圖建立一個新的研究範式。
“過去,我們希望通過基因組圖譜來解析疾病,但今天我們發現,很多問題並沒有之前預想地那樣得到解決。要真正闡釋生命,也許從蛋白質組中能夠尋找到答案。”
誠如他所說,2003年,耗時13年的人類基因組圖譜繪製成功,人們並未因此瞭解疾病的根源。生命科學進入了後基因組時代,人們的關注重點也從基因組的結構解析轉向功能研究:基因變異如何導致疾病?基因與環境相互作用下如何影響生命的過程。
我們身處的這一時期,包括蛋白質組學在內的多組學逐漸成爲了研究重點。
如果說基因是演奏生命交響樂的樂譜,那麼蛋白質更像是演奏者,樂隊會在不同的環境和需求下調整演奏方式。一些演奏者(關鍵蛋白質)可能會出現演奏錯誤(功能異常)、變音(錯誤摺疊)、甚至停奏(喪失表達),導致整場交響樂不再協調。
基因組學中微小的差異,在蛋白質組學中可以被千倍甚至近萬倍地放大。但時至今日,對於人類而言,蛋白質和疾病的關係仍有諸多未知之處。
鬱金泰說,“這次我們採用了5萬多名參與者的血漿高通量測序蛋白質組學數據,程煒老師團隊把臨牀核心科學問題與人工智能大數據分析技術相結合,識別出了具有潛在診斷和預測價值的生物標誌物,幫助我們揭示每一種疾病跟哪些蛋白相關,這些蛋白是否可以預測疾病的發展,這些蛋白是否可以作爲藥物的靶點等等,進行了全面的分析。”
此次研究的四位通訊作者:前排左二復旦大學附屬華山醫院神經內科教授鬱金泰;左三爲復旦類腦院院長馮建峰;前排右三爲華山醫院院長毛穎;右二爲復旦大學類腦智能科學與技術研究院研究員程煒
共同第一作者:二排左三,復旦大學附屬華山醫院博士生鄧悅婷;後排左三,復旦大學類腦智能科學與技術研究院青年研究員尤佳
研究的共同一作、復旦大學類腦智能科學與技術研究院青年研究員尤佳告訴《知識分子》,他們納入了5萬人的近3000種測序蛋白,分析了1000餘種疾病和近1000種健康表型,然而,具體到每一步細節,都面臨挑戰。
與基因相比,蛋白質是一個更爲複雜和多變的研究對象。共同一作、復旦大學附屬華山醫院博士生鄧悅婷提到,與蛋白質相比,基因不會受到人們出生、患病的因素的影響,相對穩定。然而,蛋白受到很多因素影響,如果得到一個比較穩健的疾病或健康相關的蛋白,研究者需要對影響蛋白的變量進行充分質控,驗證,納入關聯分析。
“這項工作可以理解爲一個拼圖的工作,我們找到了一塊塊拼圖,把它們放在空白的地方,”尤佳說,當最後一塊拼圖被按下,完整的圖譜出現在眼前,整個團隊都爲之雀躍歡呼。
02
一場新革命
科學界曾經認爲,只要繪製出人類基因組圖譜,就能瞭解疾病的根源,但事實並非如此。
基因組學爲我們提供了生命的遺傳藍圖,基因作爲人類遺傳信息的載體,是生命奧秘最原始、最根本的物質基礎。但基因組序列本身並不能直接揭示生命的全部秘密。蛋白質是基因表達的產物,是細胞執行生長、發育、衰老和死亡等各種生命活動的基本單位。
生命體的生理、病理過程以及對外界刺激的響應,都依賴於蛋白質的表達、修飾和相互作用。要真正理解生命的運作機制,就必須深入研究蛋白質組。
據瞭解,這次研究揭示了許多新的蛋白質-疾病關聯,其中相關性最強的主要集中在泌尿生殖系統疾病,如NBL1和COLEC12等蛋白和慢性腎病的關聯。(見下圖)
鬱金泰介紹,“我們借鑑了基因組研究的範式,爲疾病的預測和診斷提供了新的模型和蛋白指標。同時,我們採用孟德爾隨機化(一種流行的遺傳流行病學研究設計方法,它通過使用遺傳變異作爲工具變量,可以探究暴露和結局之間的因果關係,編者注)、成藥性、安全性等分析,爲疾病提供新的治療靶點。但目前主要還是在理論層面,還需要進一步動物實驗等驗證。”
“我們對這項工作很有信心,因爲不僅發現了新的靶點,還驗證了一些已在臨牀應用的靶點,”鬱金泰說。
尤佳進一步補充,這次的研究驗證了一些既往研究報道的蛋白質與疾病的關聯,例如:GDF15與多種疾病(如糖尿病、隱性膿毒症、貧血)的風險相關,WFDC2與流感和肺炎等呼吸系統疾病的風險相關。
在這些蛋白質中,GDF15被稱作“明星蛋白”,包括Nature(《自然》)在內,多個頂刊刊發了對其的研究。此次復旦大學的研究發現GDF15與大多數疾病相關,包含205種現患疾病和397種新發疾病,“都是有非常強的關聯,並且對這些疾病裡的診斷預測的效能都比較理想。”
尤佳介紹,當前藥企開展的以GDF15爲全新治療靶點的藥物研究,適應症多集中於肥胖、腫瘤及相關惡病質、厭食症、心力衰竭等。但在成藥性方面還面臨巨大挑戰,比如野生型GDF15的半衰期非常短,在小鼠和食蟹猴的體內爲3小時;以及在幾種類型的疾病狀態下,均發現GDF15濃度增加,這或許意味着GDF15還具有耐藥性,需要高劑量的藥物治療。
值得一提的是,此次研究發現了多個精神障礙相關的蛋白質,展示了蛋白質組學在精神疾病的預測、診斷和藥物開發的巨大潛力。
以精神障礙的診斷爲例,復旦大學類腦智能科學與技術研究院程煒教授介紹,“當前精神障礙比如焦慮症、抑鬱症等,大都是基於量表進行的診斷,不像阿爾茨海默病這類,臨牀上以Aβ PET爲金標準。所以很多精神障礙缺乏客觀診斷手段,這個蛋白組圖譜也涵蓋了大多數精神疾病,發現大量精神疾病關聯的蛋白,這對於精神疾病的發病預測和診斷都有重要價值。”
研究發現了多個精神障礙相關的蛋白質
更重要的是,這次的研究幫助我們重新審視了疾病的類別的分子亞型。
今年9月,Science《科學》雜誌撰文指出當前高通量測序蛋白質的研究具有非凡潛力,尤其是蛋白質組學與人工智能的結合,將掀起一場革命,我們將重新理解疾病基礎。[2]
在鬱金泰看來,這也是這次他們的論文很順利被Cell(《細胞》)雜誌接收發表的原因之一,“現在推進精準醫學有很多理念,比如通過人工智能結合蛋白質組學推動精準醫學發展就是其一,我們的工作讓這個理念落地了。”
鬱金泰告訴《知識分子》,過去傳統對疾病的劃分主要靠相似的臨牀症狀和表型特徵,忽略了共同的分子病因。這次研究利用蛋白質組學特徵對660種疾病進行聚類,能夠根據其共享的生物學特性將這些疾病聯繫起來,從而重新審視疾病的類別和亞型。
例如,各種癡呆亞型被劃分到同一疾病亞羣,該亞羣還包含精神、內分泌、心血管等系統疾病。基於此,這次研究工作進一步揭示了該亞羣的特徵性生物學功能,將生物學上相關的疾病聯繫在一起,有助於解釋爲何患者身上會同時出現看似不相關的症狀,並進一步加深對疾病發病機制的理解和提高治療的有效性。
以腫瘤治療爲例,鬱金泰介紹,”當前對於腫瘤的精準治療,我們會做一些基因的分型,就某種基因型,採用更有針對性的藥物。蛋白和表型的關係更爲密切,未來我們會通過觀察某種蛋白是否存在異常,針對性的給予干預,效果會更好一些。”
“這就是精準醫學的意義,精準預測、精準診斷、精準治療。”
03
問題是跨越學科邊界的鑰匙
貫穿整個研究的,是兩個原本來自不同背景的團隊展現出的高度融合與合作。這也是鬱金泰和程煒認爲,本項研究進展快速的原因之一。
程煒與鬱金泰的相識始於2020年9月。程煒主要關注生物醫學大數據統計方法及在神經精神疾病中的應用研究,他回憶,“我們關注到鬱老師有一些很好的工作,跟我們的興趣點也很相近,我們聊得很好,於是成立了這樣一個醫工交叉的課題組。”
“我們不是某個學科的學生,而是問題的學生,問題可能跨越任何主題或學科的邊界”,這是20世紀最偉大的哲學家之一Karl Popper(卡爾·波普爾)的一句話,作爲聯合團隊成員,尤佳很喜歡這句話。而他也見證着這場合作,雙方最大限度發掘了各自優勢,跨越了原本單一學科的藩籬。
程煒團隊在算法和算力方面具有極大優勢,軟硬件都提供了很大的支持。以本次的工作爲例,蛋白在個體間受年齡、性別、種族等多重因素的複雜調控,且蛋白間也有相互作用。這意味着研究團隊需要從海量且錯綜複雜的數據中提煉出對人類健康與疾病至關重要的蛋白信息,就需要程煒團隊可靠的大數據分析技術方法。
而數據分析所得結論在臨牀上的驗證與應用,其可靠性、解釋力乃至成藥靶點的潛力評估,這些問題又需要鬱金泰教授臨牀團隊的深入驗證與解讀。
回顧早期的合作時,鬱金泰早前接受採訪時曾介紹,爲了避免不同背景帶來的“語言”差異,聯合團隊引入了統一的數據管理和分析平臺,確保數據的標準化和一致性。“在一次跨學科研討會上,華山醫院的同學提供了一些關於樣本特徵和病程進展的數據,對蛋白質組學分析具有重要參考價值。類腦研究院的同學則在此基礎上開發了一套數據轉換和整合工具,將臨牀數據與蛋白質組學數據進行匹配和關聯分析。”
合作進行了四年之久,程煒說,時至今日,兩個團隊已經充分交叉融合,界限不再明顯。“原來做臨牀的同學,現在對算法也有了很多瞭解,而我們做算法的同學,對臨牀也學習到了很多。我們後續一起推動問題會越來越順利和高效。”
“現在說起來都很輕鬆,但沒有隨隨便便的成功,每一步你都要付出時間、精力,還要有天時地利人和。” 對於合作,鬱金泰他有一套自己的方法,“要合作,首先要成爲很好的朋友。”
據他介紹,兩個團隊每週固定組會,鬱金泰和程煒都要出席,團隊成員私下也有很好的交情。近三年以來,聯合團隊從大子刊到主刊都有發表,對於團隊也是極大的激勵。
回到這次研究開花的那一刻,兩個團隊合作建成了數據庫網站,鄧悅婷在其中進行了簡便的搜索查詢,那是她最爲觸動的一刻,“我覺得我們可能真的爲人類健康做了一點貢獻。”
參考文獻:(上下滑動可瀏覽)
[1]Deng Y T, You J, He Y, et al. Atlas of the plasma proteome in health and disease in 53,026 adults[J]. Cell, 2024.
[2]Topol E J. The revolution in high-throughput proteomics and AI[J]. Science, 2024, 385(6716): eads5749.