「清昴智能」完成數千萬元Pre-A+輪融資,做懂國產芯片的模型工具鏈 | 36氪首發
文 | 周鑫雨
編輯 | 鄧詠儀
36氪獲悉,AI推理部署解決方案廠商“清昴智能”近日完成了數千萬元Pre-A+輪融資,啓賦資本、達晨財智領投,老股東奇績創壇跟投。此前,清昴智能已獲得某世界500強科技巨頭公司的千萬元戰略投資。據瞭解,資金將主要用於人才梯隊組建,產品研發和市場落地。
早在大模型浪潮席捲之前,高推理延遲、高推理成本、高資源佔用這“三高”,以及算力層的硬件適配,一直是困擾模型落地的最後一公里。尤其在AI+消費級硬件成爲行業趨勢的當下,如何讓大模型在有限算力的終端設備上跑起來,也成爲不少終端廠商亟需解決的難題。
然而,痛點的存在對應的是上游解決方案的空白——一方面,市面上推理部署工具鏈的主流玩家,大多集中在北美;另一方面,大多中間層廠商,提供的是英偉達等海外硬件適配服務,當國產替代逐漸成爲國內算力的主要解決方案,大模型與國產芯片適配的痛點一直難以得到解決。
作爲推理部署工具鏈最早的國內玩家之一,“清昴智能”成立於2022年10月,通過提供AI模型的推理和部署優化工具鏈,從而降低下游客戶模型的部署和使用成本和門檻。
早在2022年6月,在Stable Diffusion等AIGC模型爆發的風口,清昴智能團隊就開始着手佈局模型部署和推理優化工具鏈的研發。針對AIoT(AI物聯網)、自動駕駛等智慧場景,清昴智能推出了第一代AI模型推理優化工具鏈MLGuider。除英偉達之外,MLGuider還支持AMD、高通、昇騰等國內外芯片的部署。
基於市場需求,MLGuider的功能和框架也進行了不斷迭代。清昴智能CEO關超宇告訴36氪,早期的MLGuider主要針對邊端芯片和傳統小模型,採取量化、蒸餾、稀疏化等一系列優化方法。
隨着市場對大模型的需求爆發,清昴智能聯合模型優化、分佈式優化和編譯優化等優化技術棧,打造了面向基礎模型和底層算力硬件的全鏈路工具鏈,着重對大模型和底層AI芯片,尤其是國產芯片的適配優化進行了功能迭代。
以國產頭部硬件昇騰爲例,在今年2024昇騰開發者大會上,清昴智能作爲昇騰夥伴代表也首發了基於昇騰原生開發環境的MLGuider-Ascend工具鏈,解決了AIGC模型在落地國產昇騰硬件過程中模型-算力不匹配,技術棧複雜,遷移與優化成本高等問題。
除模型推理部署優化工具鏈外,清昴智能還推出了企業級基礎模型開發部署平臺LLMOps、大模型一體化整機方案、大模型本地化及邊端部署方案等解決方案矩陣。
關超宇認爲,中間層廠商的困境,往往在於如何讓商業化成規模。對此,清昴智能在直接面向企業客戶提供解決方案的同時,還着力與芯片廠商、地方算力中心達成生態合作。“我們能夠通過鏈接芯片、服務器以及模型解決方案商等生態夥伴,爲客戶提供端到端的整體解決方案。”關超宇解釋。
模型推理部署工具鏈,做的是算力層和模型層的軟硬件適配工作,因此也被稱作中間層。關超宇認爲,中間層的任務就是將模型的運行效果能無限趨近於硬件的峰值性能,充分挖掘模型和硬件的潛能。
面對是否會被上下游廠商吞併的問題,關超宇告訴36氪,從模型層和芯片層的角度來說,他們各自有自己的關注點,就是提升模型或芯片本身的性能。與此同時,繁多的模型選擇和碎片化的硬件環境,讓模型-中間層-芯片的生態合作愈加清晰。
在人才組織層面,清昴智能核心成員主要來自清華大學、華爲、阿里等高校和公司。創始人兼CEO關超宇畢業於清華大學計算機系,2021年西爾貝學者獎學金獲得者(全球不到百人),並帶隊研發世界首個自動圖學習項目AutoGL。科學家顧問朱文武爲清華大學計算機科學與技術系教授,曾任微軟亞洲研究院主任、英特爾中國研究院首席科學家。