“聯想系”大模型公司「諾諦智能」完成近億元Pre-A輪融資,武嶽峰科創領投 | 36氪首發
文 | 周鑫雨
編輯 | 鄧詠儀
36氪獲悉,近日“AI+製造”行業大模型及應用企業“諾諦智能”完成近億元Pre-A輪融資。該輪融資由武嶽峰科創領投,三葉蟲創投、清智資本、老股東聯想集團跟投。資金主要用於諾諦支點行業大模型的持續迭代與優化,“AI+製造”場景式價值創造解決方案的打磨與市場拓展,以及人才的引進。
成立於2021年10月,諾諦智能爲聯想集團孵化的人工智能企業。創始人胡長建爲聯想研究院人工智能實驗室(AI Lab)高級總監,曾帶領團隊在2017年研發了應用於聯想移動海外服務的AI對話系統MOLI,服務了180多個國家和地區。
聯想AI Lab經歷,讓胡長建看到中國AI行業落地的兩個機會:一是市場大,從2017年至今,智能化轉型爲聯想帶來了近1000億元的營收增長;二是場景多,相較於更崇尚標準化的國外,中國巨量的行業細分場景給AI帶來豐富數據基礎的同時,也爲AI的落地提供了機會。
2018年,谷歌正式發佈了後續成爲GPT等主流模型訓練範式的Transformer架構。彼時,諾諦智能就開始訓練近100億參數規模的大模型,爲後續在工業行業的快速落地提供了基礎。
與此同時,背靠聯想,諾諦智能積累了豐厚的製造業Know-How,以及以TB量級日增的EB級行業數據。胡長建告訴36氪,Scaling Law(規模定律)爲模型沉澱的是跨多任務的能力,但針對特定的工業場景,高質的行業數據顯得尤其重要。
在6年的時間裡,諾諦智能已經積累了全球最大的多語言3C產品製造行業數據庫,包括用戶、設備、零部件、工單等近百億實體的知識圖譜,以及聯想30年來涉及180多個國家/地區研產供銷等全鏈條數據。
2023年,諾諦智能基於Transformer架構和InstructGPT訓練框架,發佈了自研預訓練行業基礎大模型“支點”。經測評,支點在全球20餘種主流語言上,具備本土級/母語級的理解和處理能力,與中高級專業人員能力相當。與此同時,支點具備新語言識別的遷移能力,實現在0語料理解的情況下,對100種語言高於85%的識別能力,可達商用標準。
目前,諾諦智能發佈了三種尺寸的模型,以滿足不同任務的需求:
• 小模型:7000萬參數 壓縮模型,用於邊緣側部署和快速推理;
• 中模型:3億參數 預訓練模型,用於標準任務;
• 大模型:大於300億參數 的大規模預訓練模型,用於生成類任務和形式複雜的AI任務。
隨着中國製造業的轉型升級,胡長建觀察到,企業的核心需求是從傳統的代加工,轉型爲自主進行設計生產。目前,支點大模型已經面向研發、生產、供應鏈、銷售、服務等工業場景,提供了以私有化部署爲主的服務。同時依託於聯想的全球化佈局,諾諦智能的業務可覆蓋全球180多個國家和地區。
據胡長建介紹,諾諦智能已服務近百個製造業客戶,累計爲客戶節省成本數億元。面對最具挑戰的製造業客戶,諾諦智能迄今爲止客戶復購率超過80%。在收費模式上,諾諦智能在主流的收費模式之外,也增加了按效果計費的方式。
諾諦智能創始人胡長建爲國家科技部人工智能專家、北京市科委人工智能專家,研究領域涵蓋NLP、知識圖譜、情景感知及大數據分析,發表近40篇國際學術論文,擁有100多項專利。諾諦智能董事長芮勇目前擔任聯想CTO和高級副總裁,此前,他曾任微軟亞洲研究院常務副院長。
未來,行業模型是否會被足夠強大的通用模型替代?胡長建對36氪表示,理論上而言,由於行業的龐大以及知識的快速迭代,通用模型對所有行業的學習成本(包括算力、能源等)非常巨大,難以由個別廠商獨自完成;通用大模型提供的能力更加豐富和全面,所以其參數一般都比較大,因此通用大模型一般以SaaS的方式輸出服務,並不會單獨部署到企業的內部,因此會造成一定的數據安全隱患。
“目前我覺得通用模型還吞併不了行業模型,兩者會並存。”他總結。
歡迎交流!