自研Oryon CPU,讓高通「進」可攻「退」可降維打擊

2023年高通驍龍峰會自研的Oryon CPU首次亮相時,超越x86陣營裡的最強者,也力壓當時最強的蘋果M2 Max處理器。

即便在x86陣營以及蘋果2024款PC處理器發佈之後,首代Oryon CPU的性能依舊處於領先地位,讓高通CEO安蒙在2024高通驍龍峰會說的:“高通一直是引領無線產業的發展的公司,如今我們將高通轉型爲一家面向新AI處理時代的連接計算公司。”的說法更有說服力。

本週高通驍龍峰會正式發佈的搭載第二代Oryon CPU的驍龍8至尊版,性能的大幅提升,有一些對同行實現了降維打擊的意味。

驍龍8至尊版是唯一在Geekbench單線程測試中超過3,200分的Android SoC,在Speedometer上超越了所有Android競品,也是業界唯一一款在任何操作系統上都能在Geekbench多線程測試中突破10,000大關、在安兔兔測試中突破300萬大關的移動SoC。

一邊是領先手機領域的競爭對手,另一邊大幅增強了汽車市場的競爭力。搭載專爲汽車定製Oryon CPU的驍龍座艙至尊版平臺和Snapdragon Ride至尊版,CPU性能提升高達3倍。

“Oryon是完成我們整個SoC的最後一塊拼圖。”高通技術公司高級副總裁兼手機業務總經理 Christoper Patrick在驍龍峰會上說。

Oryon CPU顯然成爲了高通保持在手機市場領導力,提升在智能汽車市場競爭力,以及突破PC市場的核心之一。

此時再回看2021年高通收購NUVIA,很難不感嘆高通的戰略水平以及技術實力的高超。

當然,“重構”作爲2024年高通驍龍峰會的主題,Oryon CPU並非唯一的主角,驍龍8至尊版全面升級的NPU、GPU以及AI ISP都值得特別關注。

Oryon CPU對高通的戰略價值

即便我們已經進入了AI時代,AI能力是所有計算公司都重點強調的能力,但不要忽略CPU的重要性。

如果把手機SoC比喻成一個交響樂團, CPU是指揮家的角色,指揮每個音符、每個節奏、每個樂器創作出完美的AI交響樂。

CPU對於管理系統層面的處理至關重要,它能執行來自應用程序、操作系統和用戶輸入的指令,確保運行流暢快速,也可以運行高端遊戲、視頻編輯軟件、AR體驗、AI和機器學習以及安全等複雜應用。

過去數代驍龍處理器的CPU是採用Arm的IP,對於當時的高通這是一個非常合適的選擇。

轉變發生在2020年,蘋果發佈的基於Arm架構自研的初代M系列PC處理器強大的性能震撼業界,這對高通是一個啓發。

2021年,高通以14億美元收購了NUVIA,開啓了從頭開始設計一款CPU。

高通技術公司手機、計算和XR事業羣總經理阿力克斯·卡圖贊(Alex Katouzian)表示,“高通之所以收購NUVIA,是希望能夠我們自己設計出適用於手機、PC、汽車等多個領域的CPU架構。”

對於高通,自研CPU必須考量投入產出比,如果只是爲手機和PC從頭開始設計全新的CPU可能還欠缺些許吸引力,那加上汽車市場,自研CPU的投入產出比預期就會十分理想。

“汽車對於算力的需求還在不斷增長。這也是我們收購NUVIA的必要原因之一。”阿力克斯·卡圖贊說。

雖然高通驍龍8155在2021年初高通收購NUVIA的時候還未被衆多消費者熟知,但智能汽車座艙功能的快速迭代,讓高通座艙處理器的CPU面臨挑戰。

有手機、PC這兩個全球出貨量最大的兩個市場作爲支撐,再加上需求不斷增加的汽車市場,讓高通有足夠的動力自研CPU。

2023年讓初代Oryon CPU在PC上亮相是一個絕佳的策略,不僅可以達到讓高通的PC處理器達到一鳴驚人的效果吸引注意,還能用這個對高通營收佔比不大的產品線先驗證性能強大的Oryon CPU。

接着,2024年Oryon CPU推向高通最熟悉的手機市場,經過PC市場驗證的Oryon CPU,用到手機上幾乎就是降維打擊。

2025年Oryon CPU再開始用到對性能和安全性要求更高的汽車市場,高通自研CPU不僅成爲了其業務的重要支撐,也非常好的服務其公司戰略。

阿力克斯·卡圖贊在峰會期間透露,“Oryon CPU是每年都會更新,因爲會應用在手機、汽車、PC等領域,面向PC的驍龍處理器計劃每兩年更新一代。”

“Oryon CPU的迭代和微架構並非嚴格綁定關係,兩者會以各自的節奏迭代,同時也取決於產品線。第二代Oryon CPU就是專爲移動場景打造,在第一代Oryon CPU微架構的基礎上重新設計,兩者有很大的相似性,但第二代更實用且有更出色的能效。”阿力克斯·卡圖贊對雷峰網表示。

全面重構的驍龍8至尊版,性能跨代提升

CPU微架構和內存系統大升級

此時更容易理解驍龍8至尊版性能大幅提升的源頭。

相比第三代驍龍8商用手機,驍龍8至尊版商用機在室溫環境下測試,單線程和多線程基準測試中性能有高達45%的大幅性能提升,能效提升也高達44%。

同樣相比第三代驍龍8,Oryon CPU在Chrome瀏覽器上的性能提升超過62%。

“在整個Android生態系統中處於領先地位,這是一個跨代際的提升。“阿力克斯·卡圖贊表示,“能效也提高了44%,這是驍龍的與衆不同之處。”

“高通Oryon CPU正是拼圖的最後一塊。我們從頭開始打造IP,這種方式賦予了我們對CPU的完全自主權。讓我們能夠直接定義和定製所有處理通道的配置,不需要任何外部依賴。”高通技術公司產品管理總監Manju Varma表示。

第二代Oryon CPU有兩個最高主頻高達4.32GHz的超級內核,適合應對需要更快響應速度的密集型應用,以及6個Oryon性能內核負責運行最密集型的應用程序,同時具有極高能效,沒有任何一個傳統意義上的效率內核。

“多年來,我們已經減少了效率內核的數量,最終用亂序性能內核取而代之,它們能夠提供最佳性能和功耗組合,這是驍龍8至尊版能面向實際用例樹立性能新標杆的原因。”Manju Varma解釋。

值得注意的是,驍龍8至尊版超級內核CPU的最高主頻4.32GHz已經超越了驍龍X Elite最高3.8GHz的主頻,性能也超越了競品的PC CPU性能,這種設計的考量是什麼?

“展示驍龍8至尊版CPU和PC競品CPU的性能對比,更多是爲了展現我們CPU設計的先進性,從第一代到第二代Oryon CPU我們的內核是逐年提升。”阿力克斯·卡圖贊進一步表示,“PC和手機運行多線程任務的方式不同,在手機上是儘可能壓榨頻率,以更少數量的核心支持多線程任務;而在PC上則會降低頻率,同時引入更多數量的核心來支持多線程任務。”

“當我們提高CPU頻率時,總是會有與之相匹配的功耗降低,在延長電池續航的同時,實現性能增強。”阿力克斯·卡圖贊說,“對我們而言,每瓦特性能比單純的性能和頻率更重要。”

擁有高主頻還不是Oryon能夠大放異彩的全部原因,第二代Oryon CPU還大幅改進了內存架構。

驍龍8至尊版Oryon CPU的每個叢集都擁有12MB的二級緩存,總計24MB緊密耦合的專用緩存是移動領域最大的緩存。同時也大幅提升了一級緩存。

提升緩存大小能帶來更強處理能力的同時會帶來時延增加的問題,“經過精心設計並採用先進的緩存一致性協議,可顯著降低時延,提高整體性能並實現更低功耗。”Manju Varma表示。

考慮到生成式AI對內存的高度依賴,驍龍8至尊版也配備目前業界最高速的10.7Gbps的LPDDR5內存。

第二代高通Oryon CPU的微架構和內存系統升級帶來了更快的應用啓動速度、無縫的多任務處理和先進的生成式AI功能,還有視頻渲染速度將大幅提升,這讓遊戲成爲了最大的受益用例。

首創切片架構Adreno GPU

驍龍8至尊版能夠處理高要求遊戲工作負載,包括CPU密集型物理模擬。憑藉Oryon CPU,將能夠體驗到戰鬥對可破壞環境的影響,以及環境中的湍急水流、衣袂飄飄、翠綠花園、微風拂塵。

另外,利用驍龍8至尊版的全部CPU內核, Oryon CPU能在5毫秒時延內處理超過1000個物體破壞和碰撞的情景。

“我們的Adreno GPU也經過完全重新設計,最大限度地提高性能和能效,這對移動遊戲至關重要。”阿力克斯·卡圖贊分享,對比第三代驍龍8商用智能手機,對於圖形密集型遊戲,驍龍8至尊版性能將提升40%,功耗降低40%,光追性能提升35%。

得益於驍龍8至尊版首創的切片架構Adreno GPU,充分考慮了手遊玩家需求,全新高通Adeno GPU能夠提供基於着色處理器的獨立內核,能實現更佳工作分配和併發性能。

通過擴展性能提供更高的時鐘頻率,當渲染複雜場景時,可以直接在GPU上存儲12MB數據,減少向驍龍8至尊版DDR發送的圖形數據,帶來更銳麗的圖像和更流暢的遊戲體驗,實現更長久的持續遊戲體驗。

即將在12月發佈的《超級房車賽:傳奇(Grid Legends)》移動版將獨家支持高通自適應性能引擎4.0,這一引擎能引擎將提高終端能效,提供穩定的終端性能。

驍龍8至尊版還提供了更多下一代遊戲體驗。虛幻引擎5的Nanite解決方案首次在移動端運行,目前僅在驍龍平臺上提供支持,在終端側渲染栩栩如生的環境。

基於全新設計的GPU,在本站《永劫無間》手遊極致畫質下,與前代平臺相比,驍龍8至尊版的平均幀數提升22幀,幀率穩定性提升43%。這一遊戲是首個遊戲內終端側大語言模型,玩家可以用語音口令與AI隊友互動,幫助玩家優化構築、協調即將到來的作戰行動,向新玩家提供策略來幫助學習遊戲。

此時就不得不提再次進化的包含CPU、GPU、NPU的異構架構高通AI引擎。

Hexagon NPU更好地支持多模態大模型

“如果Oryon CPU是一個出色的指揮家,負責同時運行多個應用,負責啓動所有AI工作負載,處理繁重負載任務。那Hexagon NPU就是那個令人驚歎的小提琴手,它將在AI最激烈的演奏高潮成爲舞臺中央的焦點。”高通技術公司產品管理高級總監Siddhika Nevrekar這樣形容。

與第三代驍龍8相比,全新架構的Hexagon NPU性能提升45%,能效提升45%。結合全面提升的CPU和GPU,驍龍8至尊版能夠跨所有核心動態管理AI負載。

NPU性能的大幅提升來自一系列重大改進,包括提升了所有加速器內核的吞吐量,實現更快的AI推理性能。增加的標量內核數量可以支持更長內容,達到4k上下文窗口,增加的向量內核可以加強對大語言模型和傳統AI的支持。

MLPerf基準測試顯示,驍龍8至尊版的性能在所有模型上都超過了第三代驍龍8,基礎基礎大語言模型上的token生成速率提升了高達100%,目前業界流行的一些大語言模型上,驍龍8至尊版的處理速度達到超過70 tokens/s,可以加速AI助手運行速度。

“在高通AI引擎的性能合奏中,這次我們引入了更多藝術家,其中一位就是內存併發性。正如交響樂中的音樂家一起完美合奏,AI和計算機視覺工作負載現在可以同時訪問一個內存空間並協同工作,創造流暢有趣的體驗。”Siddhika Nevrekar補充表示。

這也是爲了更好支持AI智能體。AI智能體底層依靠多種先進AI模型支持,包括自動語音識別(ASR)、大語言模型(LLM)、大視覺模型(LVM)和全新多模態大模型(LMM)。

“每個模型都是各自領域的專家,它們能夠協同工作,爲用戶提供無縫的個性化服務。”Siddhika Nevrekar說,“這些模型在高通AI引擎的不同內核上運行,它們像訓練有素的團隊一樣運作,確保一切任務都能流暢高效地運行,這就是異構計算的魔力。”

爲了充分發揮高通AI引擎的強大,高通也改進了AI軟件。高通第一次能夠讓開發者驍龍8至尊版上利用高通AI Hub測試最新模型。

高通也與衆多合作伙伴一起推動端側AI的發展,最新的合作是與騰訊混元合作,基於驍龍8至尊版移動平臺,共同推動了騰訊混元大模型7B和3B版本的終端側部署。

智譜在GLM4v-mini上創建了基於多模態大模型的AI助手, GLM-4V端側視覺大模型能夠實現令人驚歎的處理能力,以超過70 tokens/秒的速度在基於驍龍8至尊版的終端側高速運行。

AI ISP與NPU直連,視頻也能有消除功能

全新升級的NPU讓視頻AI也成爲了可能。

“以前,ISP會先處理圖像,然後發送到NPU進行後處理。”阿力克斯·卡圖贊介紹,“現在,處理管線將更加緊密配合。NPU可以直接訪問RAW原生傳感器數據,在4K60fps下實現基於AI的實時增強。”

高通同樣爲驍龍8至尊版重新設計了ISP,升級爲AI ISP,性能全面提升,ISP吞吐量提高了近35%,能效提升高達25%。升級後的強大性能支持用戶利用多達三個4800萬像素傳感器同時進行拍攝。

高通技術公司產品市場資深經理Carina Affinito說,“我們還升級了關鍵組件,帶來更好的單幀逐行HDR對齊、時域降噪和自動對焦硬件。面向3A——即自動對焦、自動白平衡和自動曝光,還新增了AI輔助的增強功能。這些意味着圖像質量的全面提升。”

充分利用Hexagon NPU可以在4K 60fps下進行實時處理的特性,高通將先進的AI算法直接引入圖像和視頻處理管線的核心,高通稱之爲“Insight AI”,可以將攝影提升到全新高度。

其中一個功能無限語義分割支持對圖像進行超過250層語義識別和分割,分割完成後可以對膚色和天空實時識別並修正;另一個功能是AI補光,可以在視頻通話或者直播時添加虛擬可移動光源。

高通也與虹軟合作,展示了全新寵物攝影特性套件,手機能自動對焦跟蹤寵物的眼睛,拍出最好的照片。

除了照片,驍龍8至尊版的AI ISP結合NPU也能將照片的消除功能用於視頻,並且全部在終端側運行。

與去年一樣,驍龍8至尊版的首發將會是小米。

驍龍汽車平臺在高通內部地位更高

2024年的高通驍龍峰會罕見的用了一天的峰會來重點介紹驍龍數字地盤,包括全新的驍龍座艙至尊版平臺和Snapdragon Ride至尊版平臺。

與驍龍8至尊版一樣,全新的驍龍汽車平臺同樣採用專爲汽車定製的高通Oryon CPU。

高通技術公司汽車、行業解決方案和雲事業羣總經理Nakul Duggal告訴雷峰網,“爲汽車定製的Oryon CPU主要是在安全性方面進行增強,提供更高的安全係數。”

與前代頂級平臺相比,全新平臺的CPU速度旨實現在提升至3倍,AI性能旨在實現性能提升至最高12倍。

值得注意的是,高通爲軟件定義汽車提供靈活性和可擴展性,汽車製造商可以選擇在同一SoC上無縫運行數字座艙和智能駕駛功能。也就是說驍龍座艙至尊版平臺和Snapdragon Ride至尊版平臺有許多相同的IP,且具備擴展性。

Nakul Duggal認爲靈活的架構是高通發展艙駕一體的優勢所在。

另外,新的平臺滿足汽車安全標準ASIL-D,支持超過40個多模態傳感器,包括多達20個高分辨率攝像頭,實現360度全方位覆蓋和車內監測。

驍龍座艙至尊版平臺和Snapdragon Ride至尊版平臺將於2025年出樣,理想汽車和梅賽德斯-奔馳公司將會率先在量產車型中採用驍龍至尊版平臺。

高通也宣佈了與谷歌達成多年戰略合作,提供先進生成式AI賦能的解決方案以打造安全的先進數字化車內體驗。

從PC到手機再到汽車,高通自研的Oryon CPU充分支撐了高通公司的新戰略,也讓高通轉型成爲計算和連接的領導者。