鍩崴科技做主題分享 |2021世界人工智能大會WAIC隱私計算學術交流

(原標題:鍩崴科技主題分享 |2021世界人工智能大會WAIC隱私計算學術交流

導讀

2021年世界人工智能大會 (WAIC) 於7月8-10日在上海舉辦,7月8日下午,主題論壇「WAIC 2021 ·隱私計算學術交流會」於上海世博展覽館隆重舉行杭州鍩崴信息科技有限公司(鍩崴科技)應邀出席活動並進行論文分享。

關於大會

2021年世界人工智能大會於7月8日 - 10日在上海舉辦,本屆大會以「智聯世界 衆智成城」爲主題,促進全球人工智能創新思想、技術、應用、人才和資本的集聚和交流,推動全球科技的創新協同,助力打造人工智能世界級產業集羣。

7月8日下午,由世界人工智能大會組委會辦公室指導,螞蟻集團、機器之心和CCF YOCSEF上海學術委員會共同主辦的「WAIC 2021 ·隱私計算學術交流會」於上海世博展覽館隆重舉行。本次交流會內場設置有 Keynote 、思辨、論文分享三個活動模塊,外場還設有開放式論文Poster專區,並邀請多位領域頂級專家、論文作者與現場參會觀衆圍繞安全多方計算、數據安全、聯邦學習等前沿議題展開交流。杭州鍩崴信息科技有限公司(鍩崴科技)董事長兼CTO王爽教授應邀出席論文分享環節

論隱私計算的重要性

當我們由信息時代逐漸邁入智能時代,中國以及全球範圍內數據規模快速擴大,數據流動帶來了巨大的經濟效益和財富,但在將數據要素市場化、資產化的同時,數據安全以及隱私安全問題則更爲突出。

爲了解決數據流轉和共享時隱私安全隱患這一長期瓶頸和行業痛點問題,學術界、產業界提出了多樣化的技術解決方案,其中以聯邦學習、多方安全計算(MPC)爲主的隱私計算技術正發揮着重要作用。隱私計算通過密碼學和軟硬件技術,在保證用戶隱私及數據安全、符合法律法規要求的前提下,鏈接多數據源數據,構建跨機構、跨領域數據網,幫助實現多方協同數據分析、學習建模等,並因此大幅釋放數據價值、提升數據資源使用效率。目前,隱私計算技術已經在金融、醫療場景中實現了落地應用,並向交通、教育、工業等領域延伸。

圖1. 隱私計算各技術路線發展

但如硬件層面如何解決算力和降低成本,軟件層面如何打破數據孤島等挑戰依然存在。在種種新形勢下,WAIC 2021 · 隱私計算學術交流會應運而生,將聯合多方共建、共議關鍵戰略技術及核心發展路徑模式,爲學界專家學者和業界公司高管共同探討隱私計算新技術、新應用場景以及未來發展趨勢提供一個絕佳的平臺

鍩崴科技參與活動

鍩崴科技董事長兼CTO王爽教授應邀出席了此次隱私計算學術交流會的論文分享環節,並介紹了一篇名爲《基於安全聯邦學習的全基因關聯分析框架及其在強直性脊柱炎全國中心研究中的應用》(A novel privacy-preserving federated genome-wide association study framework and its application in identifying potential risk variants in ankylosing spondylitis) 的論文。該篇論文發表在領域內頂級期刊Briefings in Bioinformatics上,其研究團隊由鍩崴科技CEO鄭灝博士帶領。

此次報告中,王爽教授探討了醫學領域的數據隱私風險研究進展,並介紹瞭如何構建基於安全聯邦學習的全基因組關聯分析底層框架,以及全國首例通過安全聯邦學習框架支持的強直性脊柱炎全國多中心研究中的應用。

在報告中,王爽教授提到,已經有多項研究顯示,傳統的隱私保護手段,例如,匿名化或去識別化等,已經無法滿足人工智能時代所需的隱私安全保護需求,尤其對於醫療數據、基因數據這類高敏感度的數據。最常見的如重識別攻擊,通過一些公開信息或數據庫,能夠還原出被隱去的信息,從而重新識別出個人姓名和其他身份信息。一項來自美國的研究顯示,通過結合匿名的醫院出院文件和選舉人數據,一位美國州長的身份被重新識別出來。此外,基於生日、郵編和性別三個字段求交,大約63-87%的美國人可以被唯一確認。還有更多的研究顯示,重識別攻擊不止可以用來識別個體身份信息,還能確定人們的基因數據,而這遠比個人身份的重識別危險,因爲他們的血親和他們擁有相似的基因,這會導致傷害和負面影響進一步蔓延。

上文中提到的研究是全國首例利用聯邦學習 (Federated Learning),在帶有隱私保護的情況下,進行的全國性多中心強直性脊柱炎 (AS) 全基因組關聯分析 (GWAS)。在過程中,研究團隊基於安全聯邦學習技術開發了一個多中心GWAS分佈式技術框架,iPRIVATES。通過應用該框架,實現了全國性跨多家醫院、機構的AS基因組數據共享。超大的樣本量使得該研究結果的可靠性、準確度等大幅提升。同時,該研究結果表明,相比於傳統的中心化計算,這一分佈式框架顯著提升了計算效率,並且其研究結果和中心化計算無異。這意味着,類似的安全聯邦學習技術框架在實際應用中具有高度可行性,也爲未來的進一步研究指明瞭方向

該篇論文也同時展示在交流會的開放式論文Poster專區。

圖2.iPRIVATES論文Poster

王爽博士個人簡歷

鍩崴科技董事長兼CTO,安全聯邦學習開拓學者。華西醫院和同濟大學客座教授。中組部“海外青年高層次人才”。曾任加州大學聖地亞哥分校Tenure-track教授。IEEE高級會員,國際同態加密協會創始委員,四川省生物信息學會數據共享與安全分會副會長,多項國內國際隱私機密計算標準發起人。iDASH全球隱私計算髮起人,被自然雜誌和 GenomeWeb多次報道。主要研究方向包含聯邦學習,可信計算環境,多方安全計算,同態加密,差分隱私。他領導開發的基於TEE的跨國基因數據安全分析系統獲得Intel傑出貢獻獎。在國內外旗艦期刊發表著作100餘篇,累計被引用3381次(2021/07 Google Scholar),2012年在全球首次提出聯邦學習底層框架。擔任領域內的旗艦雜誌Nature Biotechnology, Nature Communication, JAMIA等的審稿人和 PLOS Genetics客座編輯, BMC Medical Genomics 特刊主編。曾主持或者參與數千萬美金的NIH, PCORI, AHRQ項目。

關於鍩崴科技

鍩崴科技是一家國際領先的大數據隱私機密計算平臺型公司。團隊從2011年開始研究隱私機密計算,於2013年發表全球第1篇醫療在線聯邦學習論文,底層安全聯邦學習及隱私計算框架服務於多個國家級的健康網絡中。公司致力於自主、安全、可控的隱私機密計算基礎平臺建設,實現數據“可用不可見”和“數據不動價值動”的新型計算範式,能在不暴露原始數據和模型的情況下進行多方數據協作。團隊創建全球iDASH隱私計算大賽,並作爲主要發起方參與多個國內外隱私計算技術標準制定。