人工智能正顛覆蛋白質結構的傳統認知
在最近發表於《自然·通訊》的一篇文章中
該團隊成員包括來自弗吉尼亞大學的,比如數據科學學院院長菲爾·伯恩、該學院的資深科學家卡姆·穆拉以及弗吉尼亞大學的應屆校友伊萊·德雷森。
他們的研究對有關蛋白質結構關係(即相似性和差異性的模式)的傳統觀念發起了挑戰,並且通過這種方式,發現了許多被傳統方法遺漏的微弱關係。
具體來說,作者報告了一個計算框架,這個框架能夠以新穎、靈活且細緻入微的方式大規模地(跨越無數蛋白質)檢測和量化此類蛋白質關係,這種方式將基於深度學習的方法與一種被稱爲 Urfold 的新概念模型相結合,讓兩種蛋白質儘管具有不同的拓撲結構或“摺疊”,卻仍能呈現出結構相似性。
伯恩、穆拉和德拉伊森與斯特拉·韋雷特尼克合作開展該項目。所有作者都是伯恩&穆拉計算生物科學實驗室的成員,該實驗室隸屬於數據科學學院以及弗吉尼亞大學的生物醫學工程系。
該出版物是伯恩實驗室多年來開發這種名爲 DeepUrfold 的人工智能驅動框架工作的成果,從而能夠對 Urfold 結構關係理論進行系統且大規模的探索。
通過 DeepUrfold,伯恩實驗室團隊在整個蛋白質領域中檢測到了那些原本在進化或其他方面被視爲毫無關聯的蛋白質之間微弱的結構關係。
在捕捉和描述這些遙遠關係的過程中,DeepUrfold 以“社區”的視角來看待蛋白質關係,摒棄了將蛋白質劃分到單獨且互不重疊的“箱子”裡的傳統做法。
總之,這些新的方法論或許能夠促使研究人員擺脫以靜態、幾何的術語來思考蛋白質的相似性,轉而採用更綜合的方法。
伯恩是數據科學學院的創始院長,他在科學界以其研究而聞名,包括範圍更廣的結構生物信息學和計算生物學。在他職業生涯的早期,他共同領導了 RCSB 蛋白質數據庫的開發,這是一個實實在在的蛋白質結構信息寶庫,幫助推動了該領域的變革,併爲當代像 AlphaFold 這樣的人工智能進步鋪平了道路。
穆拉在弗吉尼亞大學的數據科學學院和生物醫學工程系任職,在結構和計算生物學領域有着廣泛的背景,包括基於 RNA 系統的生化及晶體學研究,還有 DNA 的分子生物物理學。他從分子進化的視角看待生物系統,並探索這些領域與數據科學的交叉點。
在伯恩的指導之下,德拉伊森在弗吉尼亞大學獲得生物醫學工程博士學位,目前在舊金山加利福尼亞大學擔任計算生物學博士後學者。維雷特尼克一直都是弗吉尼亞大學的高級研究科學家,專注於計算生物學,以及蛋白質摺疊的結構、功能和進化情況。