CPU、GPU的互連從1米飆至100米,英特爾:你相信光嗎?

英特爾用“光”,突破了大模型時代棘手的算力難題——

推出業界首款全集成OCI(光學計算互連)芯片。

△圖源:英特爾

要知道,在AI大模型遵循Scaling Law發展的當下,爲了取得更好的效果,要麼模型規模、要麼數據規模,都在往更大的趨勢發展。

這就會導致AI大模型在算力層面上,對整個計算、存儲,包括中間I/O通信等提出更高的要求。

而英特爾此次的突破口,正是I/O通信:

有什麼用?

一言蔽之,數據傳輸距離遠多了,量大了,功耗低了——更適合AI大模型的“體質”了。

△圖源:英特爾

那麼英特爾爲什麼要用到“光”?具體又是如何實現的?

傳統採用電氣I/O的方式(銅線連接)固然有它的優勢,例如支持高帶寬密度和低功耗,但致命的問題就是傳輸距離比較短(不到1米)。

這要放在一個機架裡倒也是沒有問題,但AI大模型在算力上往往標配都是服務器集羣這個量級。

不僅佔地面積大,還跨N多個機架,線都是需要幾十米甚至上百米的長度,功耗那是相當的高;它會吃掉所有供給機架的電源,以至於沒有足夠的電去做計算和存儲芯片的讀寫操作。

除此之外,存算比方面,也正是因爲大模型“大”的特點,由原來讀取一次做上百次計算的比例,到現在直接變成了接近1:1。

△圖源:英特爾

這就需要一種新的辦法,可以在提高算力和存儲密度的同時降低功耗、縮小體積,從而在一個有限的空間裡,放進更多的計算和存儲。

而用上了光學I/O,問題便迎刃而解了:

一個形象的比喻就是,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數量更大、距離更遠)。

不僅如此,即使是在相對較近的距離去完成一些更高密度、更靈活的數據傳輸工作,OCI這種方式則可以類比成摩托車,速度更快且更靈活。

值得一提的是,這種OCI的方法不是停留在理論的那種。

據英特爾介紹,他們已經利用了實際驗證的硅光子技術,集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。

並且在此前也展示了與自家CPU封裝在一起的OCI芯粒,還能與下一代CPU、GPU、IPU等SOC(系統級芯片)集成。

還沒完,英特爾也已經出貨了超過800萬個硅光子集成電路,其中超過3200萬個現已投入使用的激光器。

△圖源:英特爾

那麼接下來的一個問題是:

英特爾研究院副總裁、英特爾中國研究院院長宋繼強的交流過程中,他對這個問題做了深入的剖析和解讀。

△英特爾研究院副總裁、英特爾中國研究院院長,宋繼強

硅光子技術集合了20世紀兩項最重要的發明:硅集成電路和半導體激光。

與傳統電子產品相比,它支持在較遠的距離內更快的數據傳輸速度,同時利用英特爾高容量硅產品製造的效率。

英特爾這一次發佈的硅光集成技術,OCI芯粒達到了光電共封裝的層面。

這個光電共封裝是把一個硅光子集成電路(PIC),和一個電子集成電路(EIC),放在一個基板上組成了一個OCI芯粒,作爲一個集成性連接的部件。

這就意味着xPU,包括CPU,未來的GPU都可以和OCI芯片封裝在一起。

OCI芯粒就是把數據中心CPU出來的所有的電氣I/O信號轉成了光,通過光纖,在兩個數據中心的節點或者是系統裡面去互相傳輸。

目前的雙向數據傳輸速度達到了4Tbps,它在上層的傳輸協議兼容到PCIe 5.0,單向支持64個32Gbps通道,這在目前的數據中心當中是足夠用的:

△圖源:英特爾

在一個光傳輸的通道里,它實際上有8個不同的波段,每個波段的頻率間隔是200GHz,一共佔用了1.6THz光譜的間距用來傳輸。

光從可見光到不可見光,實際上它的頻譜寬度是很寬的,從THz開始就算是接近光通訊了。

那麼OCI芯粒未來會用在哪些領域呢?

對此,宋繼強表示:

就OCI I/O接口芯粒的性能演進路線圖來看,它目前可以達到32Tbps傳輸速度的技術方案,主要靠迭代式的穩步提升三個方面的指標,分別是:

這三個指標乘起來,就是目前單向上有2Tbps的數據傳輸速度,雙向即是4Tbps。未來可以繼續向上演進,逐步提升帶寬能力。

△圖源:英特爾

最後,英特爾在硅光集成技術的差異化方面,宋繼強也做出瞭解釋:

那麼你覺得英特爾pick的“光”如何呢?歡迎在評論區留言討論。

參考鏈接:[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Shows-OCI-Optical-I-O-Chiplet-Co-packaged-with-CPU-at/post/1582541[3]https://www.youtube.com/watch?v=Fml3yuPR2AU