耐能智慧創辦人暨執行長 劉峻誠 無限延伸AI晶片需求

耐能智慧(Kneron)創辦人暨執行長劉峻誠。圖/李娟萍

AI新創業者耐能智慧(Kneron)創辦人暨執行長劉峻誠最近很火紅,成大電機系92級畢業的他,不只受到母校歡迎,清大及交大也爭相邀約他到學校講座,他將演講的PPT寫成書,成爲熱門的AI教科書。

劉峻誠爲何炙手可熱?因爲他是AI晶片量產先驅。他日前在成電論壇演講時透露,當初宣佈推出AI晶片時,大家都笑他,但現在耐能智慧的晶片,效能卻可以跟世界一級大廠平起平坐。

劉峻誠日前在成電論壇以「個人化GPT:未來在終端」爲題進行分享,他一上臺,就爲現場展示沒有連接網際網路的「私有化GPT」,舉凡搜尋世界名人相關資料、語言翻譯或寫程式等,該GPT的回覆時間都很即時,甚至可以一張他自己的照片,同時化身成年輕人、老年人,流利地口說國、臺語及英、日語,英文如果覺得不夠標準,也可以馬上調整口音。

劉峻誠強調,這些技術透過小型電路,就能實現,而且沒有風扇、可以像積木一樣堆疊,符合各式市場需求,引發現場與會人士諸多好奇。

當有人詢問他,爲何耐能智慧的神經網路處理器(NPU),以小小一個盒子,可以做到需要大型AI伺服器、好幾顆GPU晶片運行的算力?劉峻誠直白地回答說:「因爲我們很厲害。」

耐能智慧自2015年成立,迄今已經獲得了超過1.9億美元融資,並得到了李嘉誠旗下的維港投資、高通、紅杉資本、富士康、和順興基金、光寶、華邦、旺宏、臺達電集團等企業的支持。

耐能智慧自研的高能效輕量級可重構神經網路架構,解決了邊緣AI設備所面臨的三個主要問題,亦即延遲、安全性和成本。

隨着資料 量爆炸性增加,人們面臨着終端和雲端之間的資訊傳遞延遲,迫切需要即時決策,而網絡延遲則需要極力縮小。

而ChapGPT聊天機器人的崛起,證明AI在以前被認爲無法替代的知識型工作中的能力。但基於意識形態的模型訓練結果,需要謹慎校正,以免引發隱私問題。

此外,AI應用的爆發式發展,也產生了巨大的能源消耗,未來 電費將佔據整體運維成本的40%。目前碳中和已是大勢所趨,全球範圍內的多家大型公司已要求其供應鏈實現淨零排放,以促進可持續的綠色發展。

更高算力,更優異的性能及更實惠的成本,都是客戶考慮的因素,也對AI晶片提出了更高的要求。

劉峻誠指出,終端算力NPU可同時解決延遲和隱私揭露問題,通過在邊緣運行AI演算法,實現最小延遲,成本效益顯著。

耐能智慧近期推出最新的超輕量級AI晶片,將Transformer(通常應用於語言處理)應用於圖像處理上,充分發揮了Transformer處理時間序列和整體圖像數據的能力。

通過提高上下文處理和數據處理能力,耐能至少提高了30%的圖像處理應用準確度,這對於實現自動駕駛來說,是一項重大進步。

劉峻誠說,耐能智慧的車規AI晶片,可以跟世界級的晶片廠一起競爭,因爲其測試地點在臺灣,臺灣的摩托車騎士技術高超,可以充分展現自動駕駛方面AI晶片的辨識能力。

雖然GPU晶片目前在市場上佔據主導地位,但耐能智慧正在開發更多適合人工智慧計算的NPU晶片,劉峻誠信心滿滿地認爲,耐能智慧AI晶片與CPU及GPU不同,可以做到私有化及安全性,他相信,未來AI晶片將是由耐能智慧定義。隨着AI需求的爆發,該公司仍有無限延伸的可能性。