GPT-4o背後的神仙團隊:項目負責人只有本科學歷,北大/清華/交大/中科大校友在列

文|李然

編輯|蘇建勳

封面來源|公開資料

在OpenAI一場20多分鐘的發佈會向世人拋出GPT-4o之後,有不少大佬對於它體現出進步似乎並不買賬。

來源:X

OpenAI聯合創始人,現在已經離開OpenAI的傳奇大神AK對GPT-4o的評價:

“他們發佈了一個文本-音頻-視覺組合模型,該模型可在一個神經網絡中處理所有三種模態,如果用戶要求,它還可以在特殊情況下進行實時語音翻譯。”

馬老闆隨即附和到,這種對GPT-4o祛魅的描述才更加準確(酸了酸了)。

然而,當Sam Altman轉發了開發GPT-4o團隊背後的故事,外界纔看到,要把大模型做出原生多模態的能力,需要一個什麼樣的神仙團隊。

來源:X

18人核心團隊,開創人機交互新歷史

馬斯克曾經在採訪中說到,OpenAI推出ChatGPT最核心的意義其實只是在於,創造了一個人機交互的界面——ChatGPT,讓普通人能夠用文字與AI交流。然後普通人突然之間意識到,現在的AI到底能做多麼不可思議的事情了。因爲其實在ChatGPT出現之前,大語言模型的技術已經在實驗室中存在了很長時間,並且發展出很強的能力,只是普通人沒有機會體驗到它到底多麼強大。

順便,也讓OpenAI成爲了一家估值達到1000億美元的初創公司。

而照着這個思路走下去,GPT-4o如果能讓人類可以通過除了文字以外的媒介和渠道,充分地與AI交流,最終會迸發出多大的影響,也許現在還沒人能夠充分地意識得到。

而承載着這個重任的OpenAI Omni Team,居然只有18個人,其中4名華人,團隊包括項目負責人在內,幾乎都是90後。

團隊領導 Prafulla Dhariwal

來源:X

領導Omni Team的這位印度大佬根據教育背景推測是個90後,團隊成員大部分都是博士畢業生,可他的教育經歷僅僅是本科畢業。

來源:linkedin

他在本科畢業之後就以研究實習生的身份直接加入了OpenAI。一直在OpenAI工作到現在。

來源:Linkedin

在他的整個研究生涯中,參與過強化學習,無監督學習,Scaling Law等幾乎所有的機器學習的前沿研究,也參與了包括DALL·E 2,GPT-3,DALL·E 3等關鍵的項目。

來源:Linkedin

他在上大學前,曾經代表印度拿到過IMO(國際奧數)的金牌,也擔任過奧數代表隊的教練。妥妥的少年天才級別的人物。

從他的經歷看來,雖然一般來說,AI研究科學家的門檻是一個博士學位,而領導AI研究科學家的門檻,可能需要是“只有本科學位的AI研究科學家”。

關鍵研究人員

負責圖像,音頻,數據和後期訓練等各個方面的團隊核心:James Betker

來源:Linkedin

他在團隊名單被列在第一位,團隊負責人對他的評價是:任何任務只要交給他他都能給你搞定!

來源:Linkedin

他在加入OpenAI之前曾經在Garmin和谷歌工作過。

來源:Linkedin

特別是,在他的領英上,有以前一個客戶給他寫過的一封推薦信:

來源:Linkedin

看來,要在OpenAI工作,要麼你是天才本才,要麼你是那種讓天才都折服的人物。

視頻負責人:Rowan Zellers

來源:Linkedin

這位90後博士,對於GPT-4o的貢獻是,讓模型可以像人類一樣看到視頻。

來源:Linkedin

他在博士畢業之後就直接來到OpenAI。

來源:Linkedin

在演示視頻中演示模型視覺識別功能片段直接出鏡的也是他本人。

來源:X

他參與了GPT-4等數個OpenAI的項目,之前的研究方向也集中在多模態上。

來源:Linkedin

音頻方向的負責人:Alexis Conneau

項目主管對他的評價是:他是OpenAI第一個提出把《Her》裡邊的Samantha在現實中復刻,並且無情地執行了自己願景的人。

來源:X

這一點也許從他的X封面就能感受到。

他來自法國,畢業於法國最頂尖的工程師大學,之後加入了Meta,在FAIR獲得了自己的博士學位。

來源:Linkedin

然後在谷歌和Meta AI工作了一段時間之後,加入了OpenAI。

來源:Linkedin

在谷歌和Meta,他參與影響過10億用戶的項目和產品。論文也在EMNLP上拿過最佳論文獎。

來源:Linkedin

5位華人做出關鍵貢獻

就像之前爆火的Sora一樣,OpenAI這些矚目的項目中從來不缺乏華人的身影:

Li JING

來源:Linkedin

這位畢業於北大物理系的華人小哥曾經參與了DALLE-,Sora。

這次GPT-4o的發佈也有他的貢獻。

他本科畢業於北京大學物理系,博士畢業於麻省理工學院。

來源:Linkedin

他自己曾經創過業,也在Meta全職工作過2年半,在2022年加入了OpenAI。

來源:Linkedin

Jiahui Yu

來源:Linkedin

他本科畢業於中科大,博士畢業於UIUC。他現在是OpenAI感知團隊的負責人。

來源:Linkedin

他曾經是谷歌Gemini多模態的負責人之一,2023年被OpenAI挖了過來。

來源:Linkedin

Yu Zhang

來源:Linkedin

他本科畢業於上海交大,博士畢業於MIT。

來源:Linkedin

他在微軟亞研院實習過,之後加入了谷歌DeepMind,從2023年起加入了OpenAI。

來源:Linkedin

HUIWEN Chang

來源:Linkedin

她本科畢業於清華大學,之後在普林斯頓大學獲得了博士學位。

來源:Linkedin

在加入OpenAI之前,一直在谷歌擔任研究科學家。

來源:Linkedin

Qiming Yuan

來源:Linkedin

他在GPT-4o團隊中負責語言的預訓練數據處理,本科畢業於清華大學,碩士畢業於德州奧斯丁。

來源:Linkedin

在2018年加入OpenAI之前,他曾經在Dropbox和微軟工作過。

來源:Linkedin