AWS助科學家發現13萬種RNA病毒 防堵全球傳染病爆發

在AWS的幫助下,UBC CIC團隊和全球計算生物學家發起了The Open Virome(開放病毒專案),並建立Serratus,一個開放性病毒偵測雲端運算平臺。目前該研究成果已經發表在科學雜誌《Science》上,同時也創建了公開病毒資料庫,向全球科學界分享研究成果,幫助加速對RNA病毒的研究。

由RNA病毒引起的疾病包含普通感冒、流行性感冒、嚴重急性呼吸道症候羣(SARS)、新冠肺炎、C型肝炎、伊波拉病毒、狂犬病、脊髓灰質炎(小兒麻痹症)和麻疹等。由於RNA病毒繁殖和進化速度快,因此更容易感染新的宿主物種。如果基因組學研究人員能夠提前辨識新冠病毒,將徹底改變當前全球疫情的狀況。

基於AWS服務所取得的研究成果,徹底改變了生物資訊學的研究方式。在此之前,科學家們經過幾十年的資料分析,只發現了1.5萬種病毒。而在使用AWS的基礎架構和服務後,The Open Virome專案團隊在發現新病毒方面,已爲科學界節省了數百萬美元和長達數年的時間。

病毒的辨識和研究需要分析海量的基因定序數據,其中就包括數十萬種未知病毒的DNA和RNA。基因組學的資料量每天都以倍速增長,造成病毒定序資料庫的總量非常龐大,依靠傳統運算方式根本無法對其進行全面分析或處理。

The Open Virome專案的研究人員僅用8周的時間,順利地運用AWS的雲端科技建構功能強大的超級運算平臺。藉助其優異且彈性的運算能力,快速處理數百萬GB的資料,並獲得顯著成本效益。

該團隊運用Amazon Simple Storage Service(Amazon S3)中鏡像出病毒基因定序資料庫SRA,而後使用AWS彈性運算雲端執行個體Amazon Elastic Compute Cloud(Amazon EC2)來分析資料集。專案團隊的目標是在處理每個定序資料集支付不到1美分,而在專案完成時全面超越此目標,實際上在處理每個定序資料集支付不到半美分。

在短短11天內,該團隊處理高達570萬個定序資料集,僅花費2.4萬美元,並發現了13萬個新型RNA病毒。奠基於AWS雲端科技打造的Serratus平臺,研究人員相信他們既能辨識潛在的有害新病毒,又能提醒科學家注意新冠肺炎病毒SARS-CoV-2 virus的潛在突變成因,幫助改善診斷測試和疫苗開發,爲醫療政策決策者提供更有效的指引。

AWS表示,醫療和生命科學產業是AWS的優勢領域之一,透過在基因組學研究中應用雲端運算,讓客戶能將更多時間和資源應用於科學研究,以更快獲得洞察,並加速進行突破性研究和產品上市。、