消息稱字節跳動大模型訓練被實習生攻擊

DoNews10月18日消息,據媒體報道,今日多個微信羣流傳一則消息:“字節跳動的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了 8000 多張卡,帶來的損失可能超過千萬美元。”

據知情人士透露,此事發生在今年 6 月,起因是北大的博士在字節跳動商業化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。截至目前,官方未進行迴應。

傳聞顯示,該田姓實習生利用了 HF(huggingface)的漏洞,在公司的共享模型裡寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且 AML 團隊無法覈查原因。但傳聞曝出之後,該實習生還在某微信羣裡闢謠稱,自己發完論文後就從字節跳動離職,這個當口有另一個人鑽漏洞改模型代碼,把鍋扣到自己頭上。

知情人士稱,字節跳動內部已經調查明確此事爲田姓實習生所爲。目前,該實習生已被辭退,字節跳動同時把此事同步給陽光誠信聯盟和企業反舞弊聯盟,以及北大。但這名實習生被辭退後到處“闢謠”甩鍋,稱是其他人所爲。

報道稱,該實習生攻擊的並不是豆包大模型,而是商業化技術團隊的模型訓練任務,影響了該技術團隊的一些業務進展,但整體對公司造成的損失並沒有傳聞中的超過千萬美元那麼大。