2025年,無限可能
(本文編譯自Semiconductor Engineering)
芯片行業即將迎來創新之年,這將是過去幾十年都未曾有過的景象。但這一輪的技術進步真正獨特之處在於,需要聚焦物理原理和實際設計技能。
SoC的平面擴展使設計與驗證工具及方法沿着相對線性的路徑走向成熟。然而,過去幾年所發生的環境變化,卻比EDA行業誕生以來的任何時候都更具變革性。過去,行業關注焦點通常在新的製程技術,這有時會在整個流程中產生連鎖反應。設計本質上是漸進式的,可以儘可能多地借鑑之前的設計。
但如今,芯片微縮不再像以前那樣爲功耗、性能和麪積方面帶來巨大改進。未來越來越多地涉及異構和垂直微縮——通常稱爲3D-IC,但也包括2.5D——這在一些最先進的數據中心中已得到驗證。除了這些設計之外,人工智能將成爲推動力量,從內部影響工具、方法和流程。此外,功耗和散熱問題將成爲主要的優化目標,多物理場也不再侷限於混合信號設計組件。
需求端也在發生變化。人工智能對計算能力有巨大的提升需求。業界不再滿足於性能的漸進式改善,而是專注於根本性的架構變革,以實現數量級的性能提升。計算能力的提升還需要適當提高內存性能和通信帶寬,但芯片和封裝受到其散熱能力的制約。
《Semiconductor Engineering》認爲,2025年可能是幾十年來最令人興奮的年份之一。在功耗和散熱的限制範圍內,對計算能力的無限需求將推動新工具、方法和流程的出現。設計團隊將進行重大重組,以應對系統和芯片之間不斷擴展的流程,以及對安全和安保(包括數據安全)日益增長的擔憂。
由數據中心驅動
數據中心是目前許多創新的核心,這背後是與人工智能相關的對計算能力永無止境的需求。
人工智能的創新週期正在超越傳統設計迭代時間。是德科技設計和驗證業務部總經理Nilesh Kamdar表示:“生成式人工智能解決方案的發展意味着傳統計算必須進行自我革新,並實現指數級的吞吐量提升。傳統電子解決方案正失去動力,即將到來的首個突破是硅光子學和更多的光通信技術。如今,一定程度的光通信已很普遍,但隨着硅光子學的出現,它將開始取代短距離傳輸。2025年,光子學解決方案將成爲主流,並推動該領域的投資和人才招聘。半導體代工廠將通過更新的工藝變體進行創新,幫助推動生態系統向前發展。”
其他形式的通信方式也在被考慮之中。Point2 Technology產品營銷和業務開發副總裁David Kuo表示:“AI/ML工作負載每秒處理數萬億次計算,正不斷挑戰數據速率的極限。通信帶寬和互連必須跟上步伐,以支持這種增長。這就需要從銅和光學技術向新的通信形式,例如使用毫米波射頻信號通過塑料介電波導來傳輸和接收數據。”
過去,設計團隊並不太關心數據中心芯片的功耗問題。“如今,討論的焦點圍繞數據中心對功耗的影響,這已超出了與手機及電池壽命相關的預測,”Ansys總監Rich Goldman表示,“這場討論表明,人們的注意力已轉向數據中心巨大的電力需求,以及新建核電站以滿足這些需求的潛在必要性。”
這將對爲數據中心設計的芯片和供應鏈產生重大影響。Quadric首席營銷官Steve Roddy表示:“大型IP供應商已悄悄開始銷售芯粒(chiplet),並向上遊進軍進行芯片銷售的傳聞,已在媒體上流傳。2025年很可能會有一家或多家IP供應商正式宣佈進軍芯粒市場。如果芯粒成功將SoC分解爲芯粒系統,我們有望看到CPU子系統芯粒、連接芯粒、GPU處理芯粒和AI/ML子系統芯粒。最有可能率先參與這一演變的細分市場是大型數據中心計算領域。該領域的大型半導體公司已開始出貨封閉的、專有芯粒系統。隨着UCIe等標準化工作取得進展,我們將首先看到這種影響在數據中心等IP供應商中產生,未來幾年,將影響汽車等銷量更大的細分市場,並最終影響移動手機市場。”
儘管在過去幾年數據中心一直在進行整合,但這種情況可能會改變。Ampere Computing首席產品官Jeff Wittich表示:“部署靈活性正變得至關重要。隨着人工智能工作負載擴展到不同的環境(如本地部署、邊緣計算以及物理隔離的託管設施),對延遲敏感的應用將需要更靠近用戶的基礎設施,部署在現有的數據中心和網絡接入點(PoP)中。此外,推理不再是獨立的工作負載。支持檢索增強生成(RAG)和應用集成等任務將需要強大的通用計算能力,以及人工智能專用資源,這凸顯了效率和可擴展性的重要性。”
我們還有望看到量子計算成爲商業計算平臺。“光子學之後的一個前沿技術是量子計算,”是德科技的Kamdar表示,“這是一個令人興奮的研究領域,我們已經擁有能處理一千多個量子比特的量子計算機。按照目前的研究與創新速度,實現一萬個量子比特只需幾年時間。量子研究將擴展到更多國家,尤其是亞洲國家,因爲沒有哪個地區願意在計算領域向其他地區拱手讓出優勢。”
人工智能賦能
在過去幾年裡,許多工具都因AI而得到了改進,但到目前爲止,幾乎沒有工具或方法因AI發生根本性改變。2025年這種情況很可能會有所變化。Arteris產品管理和營銷副總裁Andy Nightingale表示:“我們有望看到AI融入佈局、佈線和優化等工具中,這將減少人工迭代。我們還預期生成式AI初步應用於設計探索、系統架構建議和管理IP複用。在驗證方面,AI將優先考慮極端情況測試,加速漏洞檢測,並分析大量數據集以進行功能驗證和形式驗證。”
2025年很可能是人工智能代理(AI Agent)之年。“高度專業化的人工智能代理可以協同工作,分析海量信息,這些信息涵蓋軟件架構、工作負載、製造規則、數據流、時間以及其他參數,”新思科技生成式人工智能中心傑出架構師兼執行董事Stelios Diamantidis表示,“這種人工智能之間的協作將有助於識別以前未見過的模式和相關性,爲長期存在的難題開發新的解決方案,併爲優化芯片設計和性能提供詳細的建議。”
AI也可能擴展到更多工具領域。“在工程和設計領域,AI/ML解決方案將從數字領域轉向模擬領域,對射頻/模擬設計師產生更大的影響,”是德科技的Kamdar表示,“生成式AI將影響設計界,基於ML的綜合解決方案將有助於創造新穎獨特的設計。企業將聘請數據專家,並設立首席數據官,專注於驅動所有AI/ML工作的動力——數據。由於AI/ML的進步,所有職能部門對生產力的影響都將得到提升。”
聊天機器人已被證明有助於提高設計師的工作效率。“過去一年主要關注聊天機器人的應用場景,且大多使用公開數據,但未來在於將生成式人工智能應用於私有、安全的數據集,以創建更有價值的工具,”Ampere的Wittich表示,“金融、保險和電子商務等行業的企業已做好採用這些技術的準備,以從專有數據中提取有意義的見解。”
這將開始成爲競爭優勢。Altair技術戰略、電子設計和仿真高級副總裁Sarmad Khemmoro表示:“創新速度是制勝法寶。隨着對AI芯片的需求持續激增,半導體公司將意識到新興技術在設計過程中發揮的關鍵作用。通過將AI與仿真軟件相結合,工程師測試新概念產品並做出設計決策的速度比傳統方法快1,000倍,從而大大加快產品上市時間並降低成本。這種方法對於更高效地生產高性能芯片以及在快速發展的半導體行業中保持競爭力至關重要。”
然而,授權方式也需要做出改變。Driver聯合創始人兼首席執行官Adam Tilton表示:“企業將以兩種不同的方式部署人工智能,一是通過結構良好的輸出自動執行高度受限的任務;二是爲開放式任務提供協作工具——兩者都旨在提高員工效率。不過,定價模型將反映這些不同的使用場景,結構化輸出採用基於使用量的定價,而協作工具則是採用按席位授權的定價方式。”
人們常說數據是新的石油,但業界纔剛剛開始意識到,管理和保護數據比儲存石油更困難。數據必須不斷進行驗證和清理。“人工智能代理的不斷髮展強化了對透明度的需求,”新思科技的Diamantidis表示,“換句話說,我們需要清楚地瞭解每個人工智能代理。它們是如何開發和訓練的?它們的運營目標是什麼?它們如何與其他人工智能代理交互?它們利用了哪些數據集?”
數據主權和安全將在2025年對人工智能部署策略產生重大影響。“企業越來越意識到其專有數據集的價值,並將其視爲競爭資產,”Wittich表示,“這種轉變意味着AI推理工作負載不僅會在公共超大規模雲平臺上運行,還會在更安全的環境中運行,如私有云、本地數據中心或私有託管設施。數據泄露和AI算法被篡改的風險凸顯了對安全、隔離基礎設施的需求。隨着企業在AI驅動的創新方面展開競爭,保護知識產權和敏感信息的能力將成爲成功的基石。此外,這一趨勢將擴大企業擁有的計算資源的作用,創建一個更加分散和安全的AI生態系統。”
當工具和數據來自不同的地方時,就需要創造性的解決方案。Cadence系統驗證組產品營銷總監Paul Graykowski表示:“EDA供應商一直在尋找訓練模型和隔離專有數據的最佳方法。相關解決方案即將問世。雖然我們暫時還看不到由GenAI設計和驗證的複雜SoC,但一些諸如文檔編制、編碼模板和自動化腳本等較爲繁瑣的工作即將實現自動化。人工智能技術將成爲驗證下一代芯片所需的力量倍增器。”
如今,人們很少考慮使用人工智能的成本效益。Driver的Tilton表示:“企業要想成功,應構建人工智能產品,而不僅僅是圍繞大語言模型(LLM)做包裝。這意味着採用混合技術棧,包括傳統軟件處理、算法,然後有針對性地使用大語言模型。人工智能解決方案需要展示具體的指標,如成本節約、生產力提升或收入增長,以證明其實施成本的合理性。”
此外,NPU領域也將經歷大洗牌。Quadric的Roddy表示:“在1998年至2001年的繁榮時期,我們看到行業中出現了50多種不同的RISC CPU架構和25多種DSP架構。就如同觀看一部關於物種數量興衰的自然紀錄片一樣,NPU的過度氾濫也會導致行業洗牌。那些認爲構建矩陣加速器能形成差異化的公司將會發現,授權IP模塊比重新發明現成的東西更便宜、更好。而且競爭的現實是,市場無法維持10或15家授權公司。我們在2024年已看到企業數量達到峰值,一些實力較弱的NPU IP公司已經倒閉。預計2025年這一趨勢將加速,即便交易數量會增加,但會有更多公司停止內部NPU的開發。”
物理限制
直到最近,在設計方面的物理限制還很少。如今,許多設計都面臨着光罩尺寸的限制,雖然功耗問題長期以來一直是需要被考慮的因素,但散熱問題現在正成爲許多設計的限制因素。
Ansys產品營銷總監Marc Swinnen表示:“功耗始終有一個軟性目標。一個設計必須達到一定的頻率,如果達不到,那就只能回過頭來重新設計,並推遲產品推出,直到滿足頻率要求。但功耗問題一直是‘我們已盡了最大努力’這種情況。現在情況變成了‘你必須考慮功耗進行設計’。你不能拿着一個高功耗的設計,然後把它變成低功耗設計。這必須從一開始就納入考量。目前,企業很早就開始考慮散熱問題,並且將其視爲設計的一個核心限制上限。爲此,原型設計變得非常重要。當我們首次開始涉足3D-IC市場時,這讓我們感到意外。”
這就需要新型工具。“這是一個電熱協同設計問題,”Arteris的Nightingale表示,“它需要能夠解決功耗、散熱和結構力學協同仿真的工具。這對於管理堆疊架構中的散熱和電力傳輸尤其重要。極端情況下,它需要將實時熱仿真集成到設計和驗證工作流程中,重點關注緊湊且主動的散熱解決方案。”
人工智能在數據中心對電力的巨大需求給電網和地區電力供應帶來了壓力。“爲了避免在短期內引入新的不可再生能源或延長其使用期限,硬件優化將在降低電力需求方面發揮關鍵作用,”Wittich表示,“用現代高效處理器取代舊的、高能耗系統,可以大幅減少能源使用,使現有基礎設施更具可持續性。這種效率轉變對於平衡能源需求與環境責任至關重要。”
3D-IC技術(包括2.5D)已被用於解決其中一些問題。“芯粒和3D-IC解決方案將繼續變得更加主流,”Kamdar表示,“預計會有更多封裝廠商加入芯粒生態系統,並助力設計和協作等諸多方面的標準化。包括異構集成(HI)在內的先進封裝技術,將爲系統公司帶來技術和商業優勢,這將持續吸引該領域的投資。創建3D-IC/HI設計的設計解決方案將日趨成熟,系統設計人員將能夠更輕鬆地進行前期設計和權衡。”
這可能會對IP市場產生重大影響。Quadric的Roddy表示:“新思科技和Cadence在物理IP領域佔據市場主導地位。這源於將複雜的高速模擬接口移植到每晶圓廠的每個新工藝變體所具有的工程密集型特性。但是當芯粒變得更加主流時會發生什麼呢?SoC設計團隊不再需要在同一工藝中擁有所有I/O。如果您可以利用芯粒和3D-IC封裝,在5nm芯粒中使用現有的接口IP,那麼對移植所有物理IP的需要就會大大減少。隨着更多IP被重複使用,現有的物理IP廠商可能會看到許可收入增加,但對NRE移植費用的需求會減少。而有抱負的新物理IP廠商會因瞭解到他們的成果能有更長的可用壽命,而更有勇氣進入市場。預計2025年排名前三的格局不會改變,但未來變化的種子將在2025年埋下。”
在EDA領域內
新技術節點不斷給設計帶來壓力。Atomera先進邏輯節點和電源業務負責人Shawn Thomas表示:“對於高度擴展的晶體管,例如2nm節點,隨機摻雜波動等效應會對晶體管特性(例如Vt或遷移率)產生很大影響。Vt的變化會導致開關速度的差異,這種情況在GAA結構中會加劇。GAA晶體管中的每個通道可能具有不同的Vt,進而累加影響器件的整體Vt。這會導致電路級的不匹配增加,並壓縮電路設計人員的設計裕度(即需要更保守的設計來應對增加的可變性)。Vt的變化還會導致晶體管的漏電流增加,從而增加晶體管和後續電路元件的關態功耗。”
先進封裝技術需要新工具。“封裝技術需要大變革,”Ansys的Swinnen表示,“組裝多個芯片並進行鍵合的方法有無數種,但並非所有方法都能獲得足夠投資,使其在整個大衆市場實現全面量產。推動這一趨勢的原因是,每個人都希望能夠銷售芯粒,而每個從事3D工作的人都需要芯粒,因此對標準化的需求非常強烈。整個行業利益一致,都希望確保爲此制定出標準。實現這一目標可能需要一年多的時間,但之後你會看到該領域的進展。”
在制定標準的同時,合作也變得非常重要。Altair的Khemmoro表示:“半導體公司將越來越重視與系統公司建立牢固的合作關係。這些合作至關重要,因爲許多芯片製造商並不完全瞭解他們的產品是如何集成到最終設備中的。在未來幾年,這種團隊合作將變得更加重要,尤其是系統設計師面臨着不斷創造更小、更高效產品的巨大壓力。緊跟這些變化並做出相應的調整,對於保持競爭力和推動創新至關重要。”
在EDA領域中,與AI相關的很多話題都集中在驗證方面。Cadence的Graykowski表示:“過去幾年,我們看到AI驗證領域取得了許多進展,這有助於優化迴歸測試,並縮小調試驗證失敗的範圍。隨着行業有時間對這些解決方案進行原型設計和完善,我預計我們將得到一套更優化的功能集,並且會看到更多采用,使這項技術融入主流驗證流程。明年,最有可能取得進展的領域不僅限於迴歸優化測試方面,還包括幫助縮小覆蓋率差距,並在更短時間內找出更多漏洞。自動化流程在分類和縮小調試範圍以及確定可能的故障源方面具有很大的潛力。驗證工程師將利用這些技術篩選數據,使他們能夠跟上當今設計規模的發展。我還預計生成式人工智能將在明年得到更多應用。”
設計過程也將因AI得到提升。“印刷電路板(PCB)設計需要多種學科和技能,”Khemmoro表示,“因此,公司越來越多地在整個工作流程中採用自動化,從最初的需求分析和邏輯設計,到製造和組裝。通過在設計過程中將AI與仿真相結合,可以加速設計決策速度,並顯著縮短開發週期。爲了進一步優化這一過程,對於汽車、航空航天和國防等產品生命週期較長的行業,現在正採用現場監控系統,以跟蹤PCB性能,以及降低元件的額定值,將潛在問題直接反饋給開發團隊。這些見解隨後可融入PCB設計過程,進一步提高效率和可靠性。”
設計團隊必須跨越越來越多的學科領域。Arteris的Nightingale表示:“許多設計的範圍正在擴大,這意味着仿真也必須擴展,以涵蓋光學、流體和機械效應,特別是在複雜封裝中。一些市場還增加了其他要求,例如硬件級安全的新方法,包括加密驗證和抗攻擊性,以及芯片級符合ISO 21434網絡安全風險管理標準。而可靠性方面則需要用於預測老化、電遷移和其他長期失效模式的工具。”
結論
總體而言,上述這些只是2025年行業將發生重大變化的部分領域。其中一些技術進行原型設計並推向行業的速度正在加快。這是前所未有的,也凸顯了搶佔先機的重要性。整個行業正處於一場巨大變革之中。