網傳“實習生破壞大模型訓練”,字節跳動迴應
據字節跳動今日頭條官方賬號消息,字節跳動10月19日發佈關於“實習生破壞大模型訓練”的事實澄清:
近期有媒體稱“字節跳動大模型訓練被實習生攻擊”,經公司內部覈實,確有商業化技術團隊實習生髮生嚴重違紀行爲,該實習生已被辭退。但相關報道也存在部分誇大及失實信息,特說明如下:
一、涉事實習生惡意干擾商業化技術團隊研究項目的模型訓練任務,但並不影響商業化的正式項目及線上業務,也不涉及字節跳動大模型等其他業務。
二、網傳“涉及8000多卡、損失上千萬美元”嚴重誇大。
三、經覈實,涉事人一直在商業化技術團隊實習,並沒有AI Lab實習經歷。其社交媒體個人簡介及部分媒體報道有誤。
該實習生已在8月被公司辭退。公司也將其行爲同步給行業聯盟和所在學校,交由校方處理。
字節跳動頭條官方賬號截圖
據此前報道,10月18日,多個微信羣流傳消息稱,字節跳動的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。
傳聞顯示,該田姓實習生利用了HF(huggingface)的漏洞,在公司的共享模型裡寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且AML團隊無法覈查原因。但傳聞曝出之後,該實習生還在某微信羣裡闢謠稱,自己發完論文後就從字節跳動離職,這個當口有另一個人鑽漏洞改模型代碼,把鍋扣到自己頭上。
知情人士對媒體表示,字節跳動內部已經調查明確此事爲田姓實習生所爲。目前,該實習生已被辭退,字節跳動同時把此事同步給陽光誠信聯盟和企業反舞弊聯盟,以及該實習生所在的學校。但這名實習生被辭退後到處“闢謠”甩鍋,稱是其他人所爲。