深扒「全球 10 大頂尖大模型團隊」,167 位華人榜上有名

十個大模型核心成員數量核心成員年齡分佈:中國注重培養新銳力量,青年成員(小於 40 歲)佔比高達 84%核心成員的教育經歷:TOP10 高校主要分佈在美、英、中、印華人影響力不容忽視:國外大模型團隊核心成員華人佔比18.7%最高學歷曾在中國高校就讀的核心成員86 位進入國際市場核心成員學術影響力:成員主要集中在 H-index35 以內

人工智能(AI)大模型正在重塑世界,改變我們身邊的每一個人。

如今,全球範圍內的科技大廠、明星獨角獸,新興大模型初創企業,都在爭先恐後踏入大模型的浪潮。

業內人士也一直在努力回答這樣一個問題:爲什麼是 OpenAI 打造出了震驚世界的頂級模型 ChatGPT(GPT-4)和 Sora?

事實上,除了優質的數據、充足的算力和高效的算法,斷檔式的技術、工程人才儲備,也是 OpenAI 能夠在大模型領域做到始終遙遙領先的資本。古語有云,得人才者得天下,這句凝聚着先人智慧的話語,不無道理。

在未來的某一個時間,人們憧憬的通用人工智能(AGI)、超級智能(Super Intelligence),也將由大模型人才藉助更好的數據、算法、算力和知識來實現。

因此,對於 AI 領域的研究者、從業者和決策者而言,全面瞭解全球大模型發展現狀和人才分佈,意義重大。

那麼,放眼整個大模型行業,最牛的大模型人才(們)都在哪裡?他們都有怎樣的特點?我們能從中學習到什麼?

爲此,AMiner 發佈了《全球十個大模型核心團隊成員分析報告》,旨在爲大模型領域的相關人員在今後的研究交流、人才引進提供參考。

該報告結合當下模型知名度和專家建議選取了全球十個大模型(GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5),從地域分佈、年齡結構、教育背景、華人佔比和學術影響力 5 個維度進行全面分析,揭示了十個大模型核心成員的人才現狀。

其中,以下幾個結論特別值得關注:

有關十個大模型的相關分析如下:

本報告基於 AMiner 開放平臺,結合當下模型知名度和專家建議選取了全球十個大模型,對其團隊進行分析,模型挑選如下 GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5。

本報告選擇 2023 年前(包括 2023 年)十個大模型推出時發佈的技術論文和相關報告(共計 22 篇)。如果該模型沒有技術報告(或技術報告未羅列作者),則挑選該模型所屬機構較爲代表性的對應技術論文。

(所選模型報告,不包含變體衍生模型技術報告)根據報告的作者在 AMiner 平臺查詢出的學者作爲十個大模型的核心成員,共計 968 位。

其中報告覆蓋最多的核心成員是來自 Google 的 Gemini 和來自 OpenAI 的 GPT 團隊,分別爲 417 人和 262 人。

數據來源:AMiner開放平臺

(注:因存在覈心成員同時參與多個模型開發創立,故核心團隊人數加總>968)

全球十個大模型核心成員的年齡分佈呈現鮮明特徵。當下在中國的核心成員中 40 歲及以下佔比高達 84%,相較之下,美國和全球分別爲 67% 和 69%。中國學者在這一年齡段的 TGI 達到顯著的 122.9。

數據表明挑選的十個大模型團隊 986 人中核心成員成年輕化趨勢,中國核心成員更偏好集中於青年成員,表明了中國大模型團隊對新興力量的強烈關注。

在 41~55 歲年齡段中,美國主導,佔比爲 32%,中國佔比爲 16%。在大於 55 歲年齡段中,中國未有核心成員分佈,美國有 9 位成員分佈在這一年齡段。綜合而言,大模型核心力量主要集中在年輕人才(<=40),且相較於美國,中國在大模型領域更注重挖掘和培養新興力量。

數據來源:AMiner 開放平臺(注:中、美成員按照當前所在機構國家統計)

TGI =(當前國家年齡段分佈佔比/全球成員分佈佔比)× 100

從數據來看,全球十個大模型核心成員的教育經歷主要集中在世界著名的高校中。前十個高校分佈在美、英、中、印四個國家,共計爲十個大模型團隊輸送了 573 位人才,佔總人數的 59.2%。

美國的加州大學系統(十院校)和斯坦福大學位列前兩位,就讀於該兩大院校的核心成員共計 207 人,分別佔據了 11.7% 和 9.7%。數據凸顯了這兩大院校在培養人工智能領域頂尖人才方面不容忽視的地位。

此外,清華大學作爲中國高校中唯一躋身前列的人工智能人才智慧搖籃,位列全球第七,968 位核心成員中 48 位就讀於該校,佔比 5%。這顯示出清華大學在人工智能領域的卓越教育質量和影響力。

同時,印度的印度理工學院也有不可忽視的人才貢獻,968 位核心成員中 21 位來自該校,佔比爲 2.2%。這反映了印度在培養人工智能領域專業人才方面的積極努力。其他著名高校如麻省理工學院、卡耐基梅隆大學等也爲十個大模型團隊做出了可觀的人才貢獻。

綜合而言,全球各大高校都在積極爲人工智能領域輸送人才,爲模型的發展提供了堅實的學術基礎。

數據來源:AMiner 開放平臺(注:按核心成員就讀院校及地區統計)

數據來源:AMiner 開放平臺(注:按核心成員就讀院校及地區統計)

報告數據顯示,在挑選的十個大模型團隊成員 968 人中,899 位爲國外大模型(GPT、Gemini、Claude、LLaMA、Falcon、PaLM、BERT、T5)團隊成員,在國外大模型團隊中華人成員共計 167 位佔比達 18.7%。

數據說明,華人在大模型國際市場具有較強競爭力,同時,國際一流科技公司在全球範圍內的影響力和知名度也爲華人提供了更多的選擇機會。

根據報告數據顯示,在挑選的模型團隊成員中,中國頂尖高校培養的華人人才中一部分進入了國際頂尖機構。

968 位核心成員中,有 139 位是華人且最高學歷曾在中國高校就讀。在這 139 位成員中,86 位(62%)流入國際市場。

數據說明,國際市場對中國高校教育水準的高度認可,在未來,中國科技產業的蓬勃發展和高校的不斷提升將有望吸引更多優秀華人迴歸或留在國內,共同推動中國科技創新的發展。

數據來源:AMiner 開放平臺(注:流入機構爲核心成員最近機構所在地區統計)

數據顯示,十個大模型核心成員的學術影響力(H-index)普遍集中在 1-35 間,該區間學者共計 804 位,佔 968 位核心成員的 83.1%。這表明十個大模型團隊大多數核心成員在學術領域的貢獻力量相對較小。

這種趨勢可能受到多種因素的影響。首先,核心成員可能更加集中於技術研發和工程實踐,而相對較少專注於學術出版和學術交流,從而在 H-index 方面分值不高。其次,團隊中以青年成員居多,而 H-index 需要時間的積累,因此較年輕的核心成員在這一指標上表現普遍較低。

數據來源:AMiner 開放平臺(注:中、美成員按照當前所在機構國家統計)

十個大模型團隊中不乏學術貢獻卓越的學者,其中有 86 人被評爲“AI 2000 全球人工智能學者。下表列舉了 H-index 前 15 名核心成員,最高 H-index 達 100,對學術領域做出不可忽視的貢獻。

數據來源:AMiner 開放平臺(注:按照當前所在機構國家統計,部分呈現)

除此之外,AMiner 團隊在《全球十個大模型核心團隊成員分析報告》中,也特別從團隊人才結構、學術背景、團隊穩定性和學術貢獻方面,對當下大模型巔峰團隊 GPT 和第一個原生多模態模型團隊 Gemini 進行了詳細的團隊分析。

詳情請查看完整版報告:

https://open.aminer.cn/open/article?id=6620fea7d9a27592a9337fd5

聲明:

1、本報告僅探討挑選的十個大模型團隊情況分析,不對大模型技術進行深入研究。

2、本報告挑選的模型不代表其在大模型領域技術或知名度的領先地位,僅供讀者參考模型團隊情況。

3、本報告出現的“AI 2000全球人工智能學者”,是通過AMiner學術數據每年在全球範圍內遴選2000名人工智能學科最有影響力、最具活力的學者。(全名單鏈接:https://www.aminer.cn/ai2000)

數據來源:

本報告所用數據均來自 AMiner 開放平臺。AMiner 由清華大學計算機科學與技術系團隊建立,是擁有我國完全自主知識產權、國內最早研發、訪問量最大、以人爲中心的科技情報大數據挖掘和服務平臺。它致力於爲全球學術界提供研究人員、機構、論文、項目等相關信息的數據挖掘、分析和推薦服務。

數據源囊括多個方面:如學者論文、學者信息、研究機構、期刊信息、專利信息等;本報告中所用到十大模型相關論文、作者、機構、地理位置等僅爲AMiner覆蓋數據產出分析結論。