谷歌DeepMind祭出蛋白質設計新AI,有望攻克癌症!蛋白親和力暴增300倍

新智元報道

編輯:編輯部

【新智元導讀】今天,DeepMind又發佈了Alpha模型家族的新成員,堪稱是「專精版」的AlphaFold,專注於設計蛋白質結合劑,將大幅減少所需的實驗室工作,提升開發效率。

DeepMind「阿爾法」家族,再迎新貴。

谷歌開發者負責人Logan昨日的一句話,勾起了全網好奇心。

「如果你認爲AI進展正在放緩,那就說明,你並沒有密切關注它」。谷歌究竟有着什麼大事,等着我們?

剛好今天,谷歌DeepMind祭出了AI設計蛋白的新模型——AlphaProteo,再次在AI圈裡掀起海嘯級地震。

它可以爲不同的目標蛋白,設計新的蛋白結合劑,能夠爲癌症、糖尿病併發症相關的VEGF-A。

這也是,AI工具首次能夠爲VEGF-A,設計出成功的蛋白結合劑。

在7種靶標蛋白測試中,AlphaProteo比現有的方法,實現了3-300倍的蛋白結合親和力。

它還大幅提升了研究效率,將實驗室數年工作,壓縮至幾天甚至是幾周之內。

AlphaProteo的意義在於,可以預防病毒感染,設計抗癌,等各種治癒疾病的藥物。

通過蛋白結合劑緊密附着在「病毒」、「癌細胞」上,阻止它們之間的信號傳遞,擾亂其功能,最終走向死亡。

網友們紛紛感慨道,AI+生物學又一次突破,對於挽救人類生命來說意義重大。真不知道,醫療保健在未來5-10年,會是什麼樣子?

在AI4Science上,谷歌DeepMind只會投入更多。

「阿爾法」家族的進階

AF3的誕生,意味着將會開啓更多變革性的科學研究,比如基因組學研究、加速藥物設計、新材料開發、培育作物等等。

要知道,2020年發佈的AlphaFold 2已經引起了科學界的轟動。

由於在蛋白質結構預測上取得了根本突破,全球目前有數百萬研究人員使用AF2來研製疫苗、治療癌症或設計蛋白酶。

而走出「蛋白質世界」,能夠預測所有生物分子的AF3,預計會給各領域的科學發現帶來更大的變革。

儘管AlphaFold系列模型已經取得了這些成就,團隊領導人John Jumper還是經常被「催更」。

比如,有人希望擴展AlphaFold的預測功能,直接針對能改變蛋白質功能的修飾,讓模型更好地輔助藥物設計、疾病理解等領域。

雖然Jumper在採訪中經常表示「很無奈、做不到」,但DeepMind顯然看到了這一層需求。

最新發布的模型AlphaProteo,就是瞄準了這些領域的實際應用,旨在設計出能成功結合目標分子的蛋白質。

博客地址:https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/

學習蛋白質的相互結合

從細胞生長到免疫反應,人體的每一個生物過程都依賴於蛋白質的之間的相互作用。

蛋白質的結合具有一個重要性質——特異性,就像鑰匙和鎖。「鎖齒」對不上,蛋白質就無法結合併發揮作用。

關於這類過程的原理和機制,AlphaFold等結構預測工具可以爲我們提供很多見解,但還不能創造出新的蛋白質來直接操縱這些相互作用。

想創造出能結合目標分子的蛋白質,這項工作目前還只能交給科學家完成。

這類「蛋白質結合劑」可以加速許多領域研究的進展,包括藥物開發、細胞和組織成像、疾病理解和診斷,甚至是提升作物抗蟲性。

儘管機器學習方法在蛋白質設計方面取得了重大進展,但這一過程仍然繁瑣且複雜,傳統方法耗時費力。

不僅設計過程本身難度很大,需要多輪的廣泛實驗測試;結合劑被成功製造出來之後,還需要進行額外的實驗來優化結合親和力,以便能和目標蛋白結合得足夠緊密、發揮作用。

而今天推出的AlphaProteo就是專門用於設計高強度蛋白質結合劑, 有助於藥物發現、開發生物傳感器等應用

實驗發現,AlphaProteo適用於多種目標蛋白,比如與癌症和糖尿病併發症相關的VEGF-A,這是AI工具首次爲VEGF-A成功設計出蛋白結合劑。

此外,在測試的其他7種目標蛋白上,相比之前的最佳方法,AlphaProteo的實驗成功率更高,且蛋白質的結合親和力有3~300倍的提升。

團隊同時放出了一篇論文,詳細介紹了溼實驗的流程與驗證結果。

論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf

AlphaProteo的訓練數據包括Protein Data Bank(PDB)和AlphaFold生成的超過1億個預測結構。

通過訓練,AlphaProteo學習到了蛋白質分子相互結合的方式。給定目標分子的結構以及優先結合位點,模型就能生成在相應位點結合的候選蛋白質。

預測的蛋白結合劑與目標蛋白質相互作用的示意圖,藍色部分爲AlphaProteo生成的蛋白結合劑結構,黃色部分爲目標蛋白質,即SARS-CoV-2刺突受體結合域

但遺憾的是,博客和文章都沒有提到AlphaProteo的模型架構或具體訓練方法,目前也沒有放出代碼或模型權重。

成功結合關鍵蛋白

爲了測試AlphaProteo,團隊在7種目標蛋白質上進行了測試,包括:

- 2種與感染有關的病毒蛋白:BHRF1和SARS-CoV-2刺突蛋白受體結合域SC2RBD

- 5種與癌症、炎症和自身免疫性疾病有關的蛋白質:IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A

結果顯示,AlphaProteo具有極高的結合成功率和同類最佳的結合強度。

它成功地在計算機模擬中生成了候選蛋白質,並在實驗中實現了與目標蛋白質的緊密結合。

AlphaProteo爲以上7種蛋白質生成了結合劑,藍色是在溼實驗室中測試的結合劑示例,黃色部分是目標蛋白質,深黃色部分突出顯示了預期的結合區域

對於病毒蛋白BHRF1,候選分子成功結合的比例高達88%,比現有的最佳設計方法高出10倍。

候選蛋白的結合成功率提高,意味着需要更少的測試,就能找到成功的結合劑,可以大大縮短實驗週期,降低研發成本。

AlphaProteo對7個目標蛋白質的輸出結果在體外實驗中的成功率

對於另一個目標蛋白TrkA,AlphaProteo設計出的結合劑甚至勝過了先前最佳的、經過多輪實驗優化的結合劑。

在沒有實驗優化的情況下,AlphaProteo對7個目標蛋白質設計結果的最佳親和力,較低的親和力意味着與目標蛋白結合得更緊密

驗證結果

除了自己開展的實驗,DeepMind還邀請了英國王牌研究中心、歐洲最大的生物醫學研究機構——弗朗西斯·克里克研究所(Francis Crick Institute)來進行驗證。

在不同的實驗中,團隊更深入地研究了兩種目標蛋白,SC2RBD和VEGF-A的結合劑。

結果顯示,這些結合劑的結合相互作用確實與AlphaProteo的預測相似,並且具備有效的生物功能。

例如,SC2RBD的蛋白結合劑被證明可以阻止SARS-CoV-2及其部分變種對細胞的感染。

然而,由於AI的侷限性,AlphaProteo對一種目標蛋白無能爲例,即與類風溼性關節炎等自身免疫性疾病相關的TNFɑ。

但值得注意的是,計算分析顯示針對TNFɑ設計結合劑極具挑戰性,而這也是DeepMind用它來進行測試的原因。

通常來說,實現強結合只是設計蛋白質結合劑的第一步,在研究和開發過程中還有許多生物工程障礙需要克服。

而AlphaProteo可以大幅減少初步實驗所需的時間,並適用於廣泛的應用。

蛋白設計是一項快速發展的技術,在多個領域都具有很大的科學潛力,比如理解疾病的致病因素、在病毒爆發中加速診斷測試的開發、支持可持續的製造工藝,甚至清除環境污染物等方面。

DeepMind提出,未來不僅會與學界合作,利用AlphaProteo解決具有影響力的生物學問題並瞭解其侷限性,而且還會和Isomorphic Labs合作,探索藥物設計方面的應用。

同時,團隊還將將繼續提高AlphaProteo算法的成功率和親和力,擴大其可以解決的設計問題範圍,並與機器學習、結構生物學、生物化學和其他學科的研究人員合作,開發出負責任且更全面的蛋白設計方案。

參考資料:

https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/