MiniMax閆俊傑對話黃明明:AGI,只有一條最難但唯一的道路

(原標題:MiniMax閆俊傑對話黃明明:AGI,只有一條最難但唯一的道路)

光頭,笑臉,一臉和氣。

6月14日,當MiniMax創始人閆俊傑現身36氪WAVES2024大會時,還是一張令許多人感到陌生的臉。作爲一家備受關注的AI大模型公司創始人,這還是他第一次出席一場線下峰會。

在延宕至今一年半的中國大模型鏖戰中,MiniMax 其實是ChatGPT出現前成立的兩家創業公司之一,也是截至目前中國大模型創業公司中估值最高、在C端商業化探索走得最快的公司之一。但閆俊傑卻顯得尤爲低調。

在這場名爲“非共識和長期最優解”的對話中,和閆俊傑對談的是MiniMax的早期投資人——明勢資本創始合夥人黃明明。其間,閆俊傑罕見地談起了一些他從未透露的話題,比如最初的決定是如何發生的;在模型路線上的艱難抉擇;組織管理方面的心得;以及他如何看待AI應用爆發的拐點,和中國AGI之於世界的位置。

“AGI是中國不能輸掉的一場比賽。”黃明明說。

目前,除了明勢資本外,入局MiniMax的投資方還包括高瓴創投、IDG資本、紅杉中國、雲啓資本、米哈遊、阿里、騰訊、小紅書等機構。WAVES是36氪去年推出的全新峰會IP,今年已是第二屆。

WAVES大會現場,閆俊傑與黃明明。

以下爲我們提取的閆俊傑在本場對話的關鍵要點:

1. 從做人工智能到決定做通用人工智能的一個原因是:我的外公有一天說他說想寫一本書,講自己幾十年的經歷。但他沒有辦法寫出來,因爲這需要非常好的語言組織能力,也至少需要會打字。我認爲只有人工智能可以幫助他實現這件事。

2. AI發展會有三個階段:

第一階段在2021年之前。這時AI不是獨立存在的,更多是業務和產品中的某個環節。

第二階段是AI開始具備一些通用能力,可以解決一些大衆化的問題。這個時候AI可以獨立驅動一些產品存在,我們現在就處在這個階段。

第三個階段是AI的能力穩定的大於普遍的個體,AI驅動的用戶在線時長必然會大於傳統產品。

3. GPT-4這一代的模型在各類的評測和很多真實場景中大概是20-30%的錯誤率。未來的拐點是模型錯誤率再降低一個數量級,應用規模再大兩個數量級。

4. 未來全球AGI只有五家公司的話,至少有兩家中國公司,至少第二名是中國公司。

5. 不管有錢的大廠,還是沒有錢的創業公司,(中國公司)在算力層面的投入可能要比美國公司小1-2個數量級。這是接下來兩三年內非常確定的事情。

6. 從Dense轉型MoE模型,是通向更好模型的必要條件之一。包括合成數據、Attention機制、多模態融合等,更好模型需要的技術棧積累越來越多。

7. 創業中什麼時候感覺選擇做對了呢?當發現沒有選擇,而是隻能找到唯一的路,大概率就是正確的選擇了。

8. 相信AI價值在於服務普通人,因爲整個社會分層大部分人都是普通人。

9. 人才是公司裡最核心資產,因爲人才和人才的組織創造了一切。

10. 我從小在比較落後的地區長大。很明顯的觀察,這些地區的人們可能比城市裡的人更需要人工智能的幫助。

最初的決定

黃明明:IO你好(IO是俊傑在公司內部的稱號)。很多人從來沒有在公衆場合見過你,說你是不是隱藏在背後的AI。非常高興應36氪暗涌之邀,把真人拉到現場直接交流。

我和你是2021年底第一次見面,介紹人是米哈遊的聯合創始人劉偉。當時你剛開始出來創業,是中國第一個提出做通用人工智能的創業公司。第一次見面,我們明勢去了三個人。第一次聊天,坦白說我沒有聽懂你在講什麼,你講到對話、語音、數字人,市場也一度瘋狂說你們是元宇宙轉型到AGI的公司。好在我們三個人裡至少有一個人聽懂了,那就是夏令。他又找你聊一次後跟我說這個項目一定要投,所以我們這麼早參與了 MiniMax,讓我們有了一張通往新世界的門票。

明勢資本也因此定了一個規則,見比較重磅的創始人時,我們至少帶三個人一起去,萬一有一個人聽懂了呢?

時間撥回2021年,因爲上一波AI都遠低於大家的預期,無論社會價值還是商業價值,那是整個世界對AI看法比較黑暗的時刻。ChatGPT是2022年11月30日才發佈。在更早的2021年,你看到了什麼樣巨大的機會,爲什麼那麼早堅信AGI這件事的到來?

閆俊傑:其實也就是兩年多以前,但好像已經過了一個世紀了。

黃明明:天上一日,地下千年。

閆俊傑:我三年前就想到這件事,就是2020年底。爲什麼想到做通用人工智能,其實經歷了兩個非常極端的事,讓我意識到了必須得這麼做。

我之前一直做技術,寫論文,做很多研究。我一個同學是做代數幾何,這是數學最前沿的幾個領域之一。有一天他告訴我,他老師的老師去世了,我意識到這麼重要的前沿領域,可能懂這個領域的人全世界只有20幾個人。這個領域的進步是非常隨機的,能夠進入這個領域也越來越難的。

如果是依賴隨機的單個人,那進步一定會遇到挑戰。怎樣可以讓一個前沿領域持續進步,除了培養更好的人以外,那個時候開始想到如果有更好的AI是否也可以實現這件事?如果技術進步是重要的,那除了培養更好的人才以外,還有可以做研究的方式是就是人工智能,因爲依賴技術的確定性是最高的。

除了前沿領域外,普通人也一樣。

我老家在一個縣城,我經常回縣城觀察縣城人的生活。我的外公七八十歲,有一天,他說想寫一本書,講過去幾十年的經歷,可能這個經歷沒有很多人關心,但我很關心。我發現他沒有辦法把書寫出來,因爲這需要非常強的語言組織能力,需要打字,他都不會,怎樣可以把他的經歷變成一本書呢?我也沒有辦法幫助他,但我認爲人工智能可以。

我意識到不管最前沿的事,還是普通人的事,如果有更通用的人工智能技術,都會有很多的不同。

但是那個時間點人工智能技術是非常依賴根據特殊的需求來定製模型,只能解決特定的問題,比如人臉識別,語音識別這些。長遠這件事很重要,但是那個時間點人工智能實際產生的價值又很侷限,一定是方法不對,或者說路線不對。

我開始意識到,爲解決這個問題,唯一辦法就是把人工智能變的更加通用,變成普通人生活中的一部分。那個時候開始想一定要做通用人工智能,要做AI to C。但是那個時間點還沒有大模型這個詞,用簡化的語言描述就是可交互的智能體,就很容易被當成是在做數字人。

黃明明:作爲這個領域的先行者,是否可以分享一下怎麼看未來五年、十年AGI的發展?

閆俊傑:可以先看一下歷史,我覺得AI發展會有三個階段。

第一階段,2021年之前,更多AI體現在大學實驗室,包括很多大公司都有這種實驗室,通過更好的算法解決特定的業務問題。AI在這一代裡不是獨立存在的,更多是業務和產品的一個環節,把其中的某一個特定功能效率變的更高。這是深度學習出來後,大模型出來前的階段。

比如人臉識別,語音識別,很多美顏拍照等類似的東西。從2020年開始美國有這樣的公司,我們2021年年底開始做。

現在我們處在第二個階段。從2020年開始美國有這樣的公司,我們2021年年底開始做。AI已經可以變成獨立的產品形態存在。核心變量就是AI可以變成通用,通用是不需要定製,就可以服務更多場景,這纔有獨立價值。

比如在AI助手和AIGC的內容社區上都可以有一些AI的原生產品出現。但問題是現在的用戶規模滲透率沒有那麼高,怎樣可以提高這些滲透率,主要就是靠着技術的進步,產品創新。我們發現至少在自己的產品上,基本上就是大的用戶拐點都是來自於模型能力的提升,這是非常顯著的現象。

第三個階段是再經歷一輪模型能力的提升,錯誤率再下降一個數量級,模型的能力穩定的超過普通的個體。這一定會出現用戶交互的頻次超越基於推薦系統的應用。拐點可以定義成模型錯誤率再降低一個數量級,應用規模再大兩個數量級。

黃明明:模型進入下一個時代,錯誤率得降低一個數量級,用戶需要得過億DAU。

中國AGI未來在世界的位置:

至少第二名是一家中國公司

黃明明:作爲一家出身中國的AGI公司,註定我們在能夠獲取的資源上比OpenAI,包括一些世界級大廠,少1-2個數量級。你甚至提過全球對大模型有最重大影響力的前50人都不在中國。作爲中國AGI創業公司,怎樣追趕頂級的像OpenAI這樣的公司,有什麼機會在未來能夠超越這些公司?

閆俊傑:我們可以看一些客觀的數字,除了OpenAI,頭部創業公司有超過10億美金的資金量。但這個領域不是創業公司自己的賽道,是創業公司跟上一代更大型公司在一起的賽道。我們可以看美國的公司,谷歌、微軟、AWS,它們接下來幾年都是千億美金的投入量級。

黃明明:每家都是三年投資一千億美金。

閆俊傑:這是美國幾家大廠的共識。OpenAI也是有類似的體量投入。中國字節跳動有可能,或者說騰訊、阿里有可能有這麼多錢。但再加上這些算力的限制,其實他們這些錢也花不出去。不管有錢的大廠,還是沒有錢的創業公司,在算力層面的投入可能要小1-2個數量級,這是在接下來兩三年內非常確定的事情。

這個東西不能特別報怨,我們就來想爲了把AGI做好該怎麼辦,在限制是客觀存在的情況下。

需要算力、數據和算法,其實還有非常核心的要素被忽略,用戶。

AI不僅體現在一個模型上,還有另外一部分可以體現在用戶的創造上。我們在模型上客觀的說會落後一些,通過我們很多努力把落後的代差進一步的縮小。我們可以更好跟用戶在一起,通過用戶彌補這些差距。這可以簡化成技術上的追趕,然後更多的跟用戶在一起,共同實現AGI這件事。

黃明明:第一,我們得承認這個現實,算力和資源上的差距,但我們也有可以進化的持續迭代優勢,包括用戶的體驗和用戶的基礎,以用戶爲核心的思維。很多工程師的紅利可以起到很大的作用。

依然延伸上面的問題,我們上個時代是投電動車的,也是理想的早期投資人。我記得比亞迪王傳福說過一句話,“在一起,纔是中國汽車”。作爲中國AGI的先行者和領導者,你怎麼看中國的AGI公司在未來全世界格局裡的一個定位?我個人認爲AGI是中國不能輸掉的一場比賽。如果我們輸掉了這場比賽,我認爲就像十八、十九世紀時中國剛剛開始面向世界的時候,用農耕文明對待已經進化到工業時代的世界。

閆俊傑:AI研發投入一定是越來越大的,這是不可否認的事情。短期會有很多的競爭,國內和海外的競爭都會有很多,很多隨機性沒法考慮的很清楚。但是如果長期看,考慮五年、十年以後,假設全世界只有三家公司,或者說只有五家公司。

黃明明:如果有五家AGI公司的話。

閆俊傑:那至少第二名應該是一家中國公司。

首先因爲,在中國有10億的互聯網用戶,至少用戶規模上中國是絕對領先。

其次,從人才上,雖然中國目前整體環境,創新能力,距離美國目前還是有差距的。但也可以看到很多優秀的人會回來或者成長起來,並且我們不一定把AI想成特別神秘的事情,它和別的學科是一樣的,比如跟新能源和生物製藥是類似的。我相信中國雖然目前是有差距的,但中國整體的人才質量和人才生態會越來越好。那個時候中國最好的公司,有可能比美國第一個公司有差距,但是大概率會比美國第二的公司好,因爲在美國也會頭部聚攏。

短期的算力資源,算力,芯片製程上是落後的,但通信互聯我們是領先的。

黃明明:通信互聯是世界級的。

閆俊傑:雖然短期會經歷很多挑戰,各方面都有差距,但長遠看,如果有五家,至少有兩家是中國的,至少第二名是中國的。

黃明明:八年前,我們看智能EV的時候,當我們拆解特斯拉從整車的電子電氣架構到它的電池包的時候,我們第一個感覺是傳統的汽車行業完蛋了。

第二個感覺是中國的汽車行業怎麼追,沒有辦法追,差的是幾個代際的差距。但是我們用了七八年的時間實現了“彎道超車”,中國EV發展有目共睹。

馬斯克講,他認爲未來全球的前十家的汽車公司,應該是有一家特斯拉,剩下的九家都是中國的公司。中國AGI領域,藉助IO講的話,如果未來有五家,至少有2-3家會來自中國。我們承認差距,但依然有很大追趕希望。

關於MoE的抉擇:這是唯一的道路

黃明明:從第一天起,MiniMax做出的很多決策是非常非共識的,我們最早提出做通用人工智能在2021年,去年賭MOE(混合-多專家模型)網絡,到2023年6月時其實在硅谷MoE都不是共識,只有OpenAI全力賭MoE,谷歌全力賭Dense模型ENS。甚至MoE的提出者自己都不太相信MoE這條路徑。

MiniMax內部6月決策也全力賭這件事,幾乎賭上80%可用的算力資源。當時MiniMax正在進行10億美金左右估值的融資,雖然這件事長期有益,但沒有這麼選的國內其他同行可能更容易做出被投資人和用戶看到價值的功能。這樣一個時刻,爲什麼敢做這個決策?

閆俊傑:兩個東西導致的。作爲一個創業者和偏理性的人,會做很多的分析。我們那個時候發現每天處理幾百億token。如果是Dense模型,我們沒有辦法每天出這麼多token。很快會因爲推理成本問題,耗盡所有錢。

黃明明:只是當時的那點用戶量。

閆俊傑:我們那個時候已經明顯知道,雖然外表上是一個C端產品,但給用戶帶來的價值本質上還是模型能力的提升。我們很容易看Dense的天花板就在那。

如果我們追求更高天花板,必須做類似的技術創新。不是有兩條路可以選擇,而是說爲了實現你的目標,這是唯一的一條路。

黃明明:這是通向AGI的必要條件。

閆俊傑:這是通向更好模型的必要條件。不光是選擇 MoE,包括創業裡各種各樣的決策,我發現一開始認爲是一個選擇,實際上都不是選擇,就是什麼時候感覺這個選擇做對了呢?你會發現這不是選擇,而是你能夠想到的唯一一條路,只有那一條路可以通向你的目標。當時只能這樣,如果做不出來就完了。

黃明明:我一直說創業跟我們人生一樣,影響人生最重要的決策可能就是5-6個,創業公司也是一樣。每一個決策決定了你和你的同行失之毫釐,差之萬里。看着有很多選擇,但想清楚了以後可能是唯一的選擇,是不是因爲你看的是更加長期的東西纔得到這樣結論。

閆俊傑:對。我們這次創業知道這件事很難,但優化一個3-6個月的目標意義不大,反正是很長期的事情。

黃明明:短期優化可以讓外界感知,但對長期的目標沒有太大的意義。

閆俊傑:是的。這個東西想起來很簡單,內部說是不走捷徑。我們的內部也走過一些捷徑,但每次走捷徑都會被打臉,最終變成公司價值觀的第一條,不走捷徑。但是儘管這樣有時候還是會不由自主的走捷徑。

黃明明:人性都願意走捷徑,尤其咱們行業裡的聰明人多。我訪談過公司的高管,全球做出MoE的只有OpenAI,而這個技術確實像你說的是很難的。我們失敗過兩次,我知道你的一些高管其實心裡比較慌,他們中間也問過你,但他們給我的反饋,每次找你不知道你是裝的,還是內心真的特別堅定,從來沒有一絲一毫的猶豫。當時心裡有沒有過猶豫,尤其失敗了兩次,賭上了幾乎公司所有的算力資源和人力,心裡有沒有過一絲一毫的猶豫?

閆俊傑:其實還是很慌的。當想不清楚的時候會糾結,但當你想清楚了以後發現就是唯一的一條路。知道別的路走不通,只有這條路可以走。即使着急也沒有用,只能往前走,因爲已經確信就是這樣的。

黃明明:因爲長期目標決定了這是唯一可走的路。他賭MoE的事沒有跟大多數股東溝通,去年市場上的傳聞有的人做出了很好的功能,有人在Dense持續迭代,說MiniMax的大模型停在3月的版本沒有很大進展。

很多人來問,很多人替你們着急也不知道你們在幹什麼,原有模型沒有迭代,產品遇到瓶頸。

今年1月的時候你們的MoE沒有完全的做出來,但那個時候你心裡已經有譜了。有一次碰面,IO很輕描淡寫跟我和夏令說,幾乎押上公司80%的資源,失敗過兩次,但這件事現在差不多了。

他表現的輕描淡寫,我當時臉上也波瀾不驚,但我可以跟大家分享當時內心的真實感受,我感覺對面的這個人要麼是瘋子,要麼是天才,敢把全部的資源押寶在這件事上。每一個投資人都有一個這個公司投少了的想法,這是我上次跟俊傑聊完了,他賭MoE這件事,我走出門以後跟夏令說的第一句話,我說 MiniMax這家公司投少了,俊傑這個人我們投少了。

關於用戶:面向每一個普通人

黃明明:OpenAI同時在做世界上最難的兩件事,一個是AGI,一個是超大規模的殺手級的應用(Killer App)。MiniMax也是中國的AGI最早提出同時做大模型和Killer App應用的公司,爲什麼一定要同時做呢?

閆俊傑:這是來自於創業過程中形成的內部哲學,我們意識到兩件事,AI價值在於服務普通人,因爲整個社會分層大部分人都是普通人。比較大的價值意味着能夠讓更多的普通人來使用你的產品。

如果你要服務普通人,唯一的辦法是以產品的形式輻射到這麼多人。這家公司的價值也在於給用戶創造多大的價值,用戶越多,你的價值會越大。技術的進步需要依賴很多用戶的交互反饋,反饋不一定是直接點贊,有各種各樣的信息。用戶反饋讓模型變的更好,這是核心的要素。

黃明明:讓我想起了幾年前的電動車領域,有一波人就是星辰大海,衝着L4、L5去。但像特斯拉和理想這樣的EV企業,我得有儘可能多的車跑在路上,拿到用戶駕駛行爲的反饋才能更好的做自動駕駛的模型。這和你剛纔講的有異曲同工之處。

閆俊傑:我們跟用戶一起來創造更好的人工智能,而不是說做了一個很好的技術給別人,這就是我們對技術跟產品的理解。用戶或者說用戶的創造是模型和產品的一部分,而不是分散的兩個個體,不是要做一個最好的東西,然後像上帝一樣讓所有人用。

黃明明:用戶和用戶的創造是產品和模型的一部分。我們發現一個很有意思的現象,硅谷的人說通往AGI的道路上註定充滿權力鬥爭。不管是硅谷還是中國所有做AI的人,大多數人是用精英的視角,我做出最牛的東西,你們這些人,你們10億人、60億人用就好了,都在用精英視角俯瞰芸芸衆生。你提過我們不是開發這個技術,而是我們跟用戶一起共創這個技術。

黃明明:除了剛纔講的部分,這跟個人以前的成長經歷有什麼關係嗎?

閆俊傑:我從小在比較落後的地區長大,現在很多的時間生活在城市,但也有機會經常看一下老家人怎麼生活。很明顯的觀察,他們可能比城市裡的人更需要人工智能的幫助。不管是老人還是像我這樣正在工作的人,甚至一些更加年輕的學生。

黃明明:俊傑第一次和我提這個時,我感到非常羞愧。之前內部不管討論AGI,還是從所謂社會道德約束角度,我們更多是從精英的視角。

這讓我想起了最近的段子。今年高考命題好像有一個題目說談AI對人類社會的發展。對一個在雲南大山裡的小孩,他可能連電腦和網絡都沒有摸過,考慮的是怎樣把家裡的莊稼耕完還可以上課,讓這樣的孩子怎樣回答AI對社會發展的影響?所以與用戶共創,給每一個普通人創造價值,這是MiniMax給我非常大的震動。

關於組織管理:溫和外表下的殺伐決斷

黃明明:第一次看到IO,都很容易被外表迷惑,笑咪咪、樂呵呵的。我後來跟你的同事聊,發現他們對你有一個從不信任到信任的過程,我們是否應該賭,每次你都超前國內公司,甚至在世界範圍內都超前。

我們當時最大顧慮是,你溫和外表下能否做管理,畢竟做公司和技術開發是不一樣的。後來聊完發現,你和外表是截然相反的人,做決策時無比高效和果決。當你做決策時,你沒有一絲一毫猶豫,考慮唯一是對達成下個更優模型或者更長期進展有沒有幫助,如果沒有幫助就把所有無用節點砍掉。

你在上家公司也是帶過一千人團隊的管理者,而MiniMax到今天只有三百多人,這樣的組織和管理方式是從創辦這家公司開始就有的思考,還是過程中碰到問題快速迭代?

閆俊傑:這是非常關鍵的問題。假設這家公司沒有員工,剩下的只是一些錢、模型以及用戶,其實沒有辦法變的更好。

人才是公司裡最核心資產,因爲人和組織創造了後面的東西。

做這家公司時就想明白了,因爲你的資源都很有限,競爭激烈,目標又特別難,有各種各樣不確定性,完全無法掌控。唯一辦法就是想最本質的東西,不要被淺層東西迷惑。

如果想底層東西,唯一就是技術進步的效率。技術進步的效率跟效果可以相互轉化,假設你計算資源有限,效率高意味着你的迭代更快從而有更好的效果,這兩個東西在傳統AI上是不等價的,但在這個時代,效率和效果幾乎等價。

如果說你唯一目標是研發效率,自然可以推出來什麼樣研發組織形態是能夠有比較高的效率,這幾乎可以推出來一個好的組織應該長什麼樣,怎麼運轉,找什麼樣人,怎樣可以讓一個組織從優秀變成卓越,可以推出很多東西。

唯一辦法就是找到裡面精簡的幾條核心原理,基於原理推出來應該怎麼做。遇到錯誤時不停調整。底層想的越清楚,犯錯誤概率就越低。

黃明明:包括張一鳴和理想汽車的李想,你們的內心非常純粹。每個人做決策要考慮一百、一萬個點,外界怎麼想、投資人怎麼想,員工怎麼想,媒體怎麼想,但我們大多數人是把那些你剛纔講最底層的,或者是真正最長期的目標都沒有想的足夠清楚和透徹。

事實上,只有內心足夠純粹的人,對這件事真正發自內心有信仰和熱愛的人,才能堅決果斷摒棄噪音,做出長期最優解,這個最優解可能在當時很多人看來是非共識的。