電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 49|回復(fù): 0
收起左側(cè)

光計算互連(OCI)

[復(fù)制鏈接]

511

主題

511

帖子

3950

積分

四級會員

Rank: 4

積分
3950
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-10-12 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
引言
1 Y$ Q+ ?: J; W/ ~8 S在人工智能(AI)和機(jī)器學(xué)習(xí)(ML)快速發(fā)展的背景下,對更快、更高效、可擴(kuò)展的計算基礎(chǔ)設(shè)施的需求正在飛速增長。隨著我們不斷突破AI的可能性邊界,數(shù)據(jù)傳輸和處理方面的新挑戰(zhàn)也隨之出現(xiàn)。光計算互連(OCI)技術(shù)應(yīng)運(yùn)而生,這項(xiàng)突破性技術(shù)有望徹底改變我們構(gòu)建和連接AI系統(tǒng)的方式[1]。* C) O7 U3 `1 i3 _7 `& ]4 D
/ h7 ]8 R- x: R7 ?7 r: u
) L  G. c) Z- F1 i  k

- ?- {  y- A7 m2 u4 f挑戰(zhàn):AI基礎(chǔ)設(shè)施中的輸入/輸出瓶頸
2 o+ B8 w7 W2 U) G" I+ \% s隨著AI模型變得越來越復(fù)雜和龐大,計算節(jié)點(diǎn)之間需要傳輸?shù)臄?shù)據(jù)量呈指數(shù)級增長。傳統(tǒng)的電氣互連難以滿足這些需求,造成了限制AI系統(tǒng)整體性能的瓶頸。
6 \  w4 Q+ d& H8 ^
$ O$ o$ r1 H6 G0 s
% K+ k0 G( h3 {' X; j6 F圖1:展示了計算網(wǎng)絡(luò)互連帶寬與AI應(yīng)用需求之間隨時間推移而不斷增大的差距。
, b0 G' t% D5 A3 |0 Q; j
# M( S3 i: t; y0 q& z$ n' G; ?. K  I這張圖清楚地顯示了計算網(wǎng)絡(luò)互連在歷史上如何落后于AI應(yīng)用不斷演進(jìn)的帶寬需求。隨著AI的持續(xù)發(fā)展,這一差距預(yù)計將進(jìn)一步擴(kuò)大,創(chuàng)造了對新解決方案的迫切需求。
; G# N; I! _+ i/ W0 n! e
9 h& A5 ~2 s6 y解決方案:集成光電子技術(shù)和OCI5 Z- f+ M' ?. U, z1 ~
為了應(yīng)對這些挑戰(zhàn),研究人員和工程師正轉(zhuǎn)向集成光電子技術(shù),特別是光計算互連(OCI)技術(shù)。OCI利用光來傳輸數(shù)據(jù),相比傳統(tǒng)的電氣互連具有幾個關(guān)鍵優(yōu)勢:
5 S) _0 q3 W: c, V
  • 更高的帶寬密度
  • 更低的功耗
  • 更低的延遲
  • 更遠(yuǎn)的傳輸距離0 M9 |8 x3 C- r3 w6 G& g' q
    " |$ Q; h, m! G- X9 \- _

    / K3 J- |' I; n4 c* P5 r
    5 I+ B0 |2 q9 r3 `& `: z圖2:展示了不同互連技術(shù)的帶寬密度和傳輸距離之間的關(guān)系,突出了xPU光學(xué)I/O的優(yōu)勢。1 z; F/ E7 J# R* J$ f  r

    . `; A2 C5 h6 w  t- Z( g4 x這張圖描述了通過集成光電子技術(shù)實(shí)現(xiàn)的xPU光學(xué)I/O如何能夠同時達(dá)到高帶寬密度和更遠(yuǎn)的傳輸距離,相比傳統(tǒng)的電氣I/O和可插拔光模塊具有明顯優(yōu)勢。
    : X6 K' n( j7 w4 L" D
    2 x7 P" R7 U# K2 W  q# xOCI在AI基礎(chǔ)設(shè)施中的應(yīng)用
    ( y, I; d  \7 v$ tOCI技術(shù)在AI基礎(chǔ)設(shè)施中有兩個主要應(yīng)用:
  • 計算Fabric(AI/ML集群)
  • 資源分解
    ' A9 H, b# g& L& _1 |5 M[/ol]
    # |( Q1 J( k0 s  [( d計算Fabric(AI/ML集群)
    0 u1 F% K0 a% F0 Z/ L4 D" a- d7 H在AI/ML集群中,OCI可用于連接基于CPU/GPU的服務(wù)器,可以是節(jié)點(diǎn)到節(jié)點(diǎn)的連接,也可以是交換式Fabric配置。這種應(yīng)用提供了幾個優(yōu)勢:+ P6 \! {: O8 l1 c+ j: d
  • 為更大的集群提供增加的帶寬
  • 相比銅線互連延長了傳輸距離
  • 更低的延遲
  • 降低功耗
    + r. {5 ^5 n6 `4 L
    6 `  I) U& L5 }) m
    " c& D8 l5 P% ]9 W! D% h  [' B+ q

    / p" z( T! }- e# E8 v圖3:illustrating了OCI在AI/ML集群計算Fabric中的應(yīng)用,顯示了互連的XPU節(jié)點(diǎn)。
    3 j/ [. V+ P1 {  Z! w0 V0 g
    4 e  ^: D& h; t9 E) T這個圖表展示了OCI如何用于連接AI/ML集群中的多個XPU(CPU/GPU)節(jié)點(diǎn),實(shí)現(xiàn)計算資源之間的高帶寬、低延遲通信。6 n. r# {- s  }3 [- v

    0 l! t3 u0 U* |$ M資源分解; V7 X2 y$ i, V, U2 e8 z1 V
    OCI還能實(shí)現(xiàn)資源分解,允許在多個計算節(jié)點(diǎn)之間創(chuàng)建更大的共享資源池。這種方法提供了幾個優(yōu)勢:1 p- Z$ T- W. @. P6 a
  • 將資源從封裝和插槽限制中解放出來
  • 提高資源利用率和效率
  • 對延遲敏感的連接
  • 高帶寬密度
  • 低功耗* `, C+ v& [1 C. _' @

    * |! k# ^. k5 i* F: x9 C8 B% c3 A8 C& B$ ~: J; c
    ) p/ O+ T1 `1 t9 h7 z2 z. ?
    圖4:展示了OCI在資源分解中的應(yīng)用,描繪了不同計算資源的分離和池化。  r" M# i$ ~, \, n! m4 V

    , \; P& B6 b2 N% E; o  G7 h這個圖表描繪了OCI如何實(shí)現(xiàn)各種計算資源的分解,如CPU/XPU、內(nèi)存、加速器和存儲,允許在AI基礎(chǔ)設(shè)施中更靈活和高效地利用這些組件。
    1 f! t+ m5 w' z% j8 ~7 |% v* V# B  Y8 j0 r: A: `* S' c* P) C
    英特爾的OCI方法
    / i0 U' _" t* G7 [) i英特爾在OCI開發(fā)的前沿,利用其在硅基光電子和先進(jìn)封裝方面的專業(yè)知識,為AI基礎(chǔ)設(shè)施創(chuàng)造了可擴(kuò)展的解決方案。他們的方法集中在三個關(guān)鍵領(lǐng)域:
  • 在光電子集成芯片(PIC)上集成更多的光電子功能
  • 使用先進(jìn)封裝技術(shù)將PIC與最佳的電子集成電路(EIC)集成
  • 將光學(xué)Chiplet與主機(jī)(XPU,交換機(jī))更緊密地集成
    6 j/ Z/ l+ x* E. ]& r[/ol]
    2 ]2 o$ q& Z; y, [6 L7 E2 I5 n3 S- T! T& c0 y8 P1 k

    + A8 `- q% C, S" I! q圖5:英特爾OCI Chiplet概念圖,展示了xPU與OCI模塊的集成。! n# f% y/ a- Q3 e" _
    - w, ?5 b8 I4 K0 I/ H" w
    這個圖表illustrates了英特爾的OCI Chiplet概念,將xPU(CPU或GPU)與OCI模塊緊密集成,實(shí)現(xiàn)直接從計算單元進(jìn)行高帶寬、低延遲的光通信。
    4 X3 k( h! c9 e5 G/ N: P6 h( H* g4 c" b5 z# F
    OCI和AI基礎(chǔ)設(shè)施的未來; i& q9 |8 q$ h! E
    隨著AI的持續(xù)發(fā)展和對更強(qiáng)大計算能力的需求不斷增加,OCI技術(shù)將在實(shí)現(xiàn)下一代AI基礎(chǔ)設(shè)施中發(fā)揮關(guān)鍵作用。英特爾的OCI發(fā)展路線圖包括:
    - p# Y6 F7 A$ O; i) M! m& U  ]) g
  • 擴(kuò)展波長數(shù)量
  • 提高線路速率
  • 擴(kuò)大光纖數(shù)量
  • 利用偏振技術(shù)6 A9 R, U+ T  K: b

    ' r! E3 S9 H# v/ [/ A( j這些進(jìn)步將使帶寬、功率效率和可擴(kuò)展性持續(xù)提升,最終實(shí)現(xiàn)更強(qiáng)大、更高效的AI系統(tǒng)。
    * J0 [7 y6 X& _9 p
    * `/ G  x3 s3 q; x% i# D
    % j0 i% G: F$ h2 n1 H/ k圖6:展示了英特爾OCI擴(kuò)展路線圖,illustrating了隨時間推移預(yù)計的帶寬增長。
    , L" o6 u8 T% a8 t8 v- w
    * v& R6 g# g2 `% ~6 B這張圖展示了英特爾對OCI技術(shù)擴(kuò)展的宏偉計劃,預(yù)計從2Tbps PCIe5/CXL到未來迭代中的16Tbps UCIe/DWDM,帶寬將顯著提升。
    $ N) l$ G! W5 \! @* u, H* Y  J
    * y* A0 H+ l* c( g2 n9 {% k總結(jié)而言,光計算互連(OCI)技術(shù)代表了解決現(xiàn)代AI基礎(chǔ)設(shè)施互連挑戰(zhàn)的重大進(jìn)步。通過利用集成光電子技術(shù)的力量,OCI有望提供下一代AI和ML應(yīng)用所需的帶寬、延遲和功率效率。隨著英特爾等公司繼續(xù)投資和開發(fā)這項(xiàng)技術(shù),我們可以期待看到越來越強(qiáng)大和高效的AI系統(tǒng),將推動人工智能的可能性向前發(fā)展。$ ~$ S9 R) |5 U

    ; v) ?6 G" l8 |# j* R& UOCI技術(shù)的具體實(shí)現(xiàn)
    ) h  {" H9 p8 M7 W6 V7 g英特爾在OCI技術(shù)的實(shí)現(xiàn)上取得了顯著進(jìn)展。以下是一些關(guān)鍵的技術(shù)細(xì)節(jié):' M2 t) d- f* R( b
  • 集成光電子芯片(PIC)
  • 英特爾開發(fā)了一個完全集成的8Tbps光電子集成芯片,具有以下特點(diǎn):
  • 密集波分復(fù)用(DWDM)光接口
  • 8個光纖對 x 8波長 x 64G,符合CW-WDM MSA標(biāo)準(zhǔn)
  • 每個方向4Tbps的吞吐量
  • 標(biāo)準(zhǔn)單模光纖輸出,具有低數(shù)值孔徑,用于無源對準(zhǔn)的V形槽: A+ I: d" u9 ~) e& C# Q7 C# [

      c- I6 c% b4 ^. R
    4 Y! F; d, ^; \5 y8 B2 c, I
    5 o6 S) x4 x4 N) z圖7:英特爾8Tbps集成光電子芯片的概念圖,顯示了主要特性。
    3 E/ g- l' D* y% a- n2 U- S9 |
      B2 o1 d! k, Q8 R, L這個高度集成的PIC包含了完整的光學(xué)子系統(tǒng),包括片上激光源、高效微環(huán)調(diào)制器、鍺光電探測器和半導(dǎo)體光放大器等。這種高度集成不僅提高了性能,還降低了成本和功耗。
    ( T. l% C. ]& {$ C" o0 ^9 m/ W' Z  i: W0 F0 F4 m
    異質(zhì)集成
    # V+ e; g( f) Z( W& x6 R英特爾采用了晶圓級異質(zhì)集成技術(shù),將III-V族材料(如InP)與硅基光電子器件集成在一起。這種方法具有以下優(yōu)勢:2 s3 m( c9 F/ a8 R# L# s
  • 性能:最小化耦合損耗
  • 可靠性:激光器可靠性
  • 可制造性:晶圓級到已知良好管芯(KGD)
  • 成本:無需昂貴的激光器后端
  • 可擴(kuò)展性:高通道數(shù),資源共享
  • 靈活性:多波長能力,備用& ]4 l9 ]2 G6 C8 S9 X
    8 f' A) s0 ]3 E- C, t; T1 I: }
    7 k, n, H+ @; _2 C* U( x- v: v

    5 ^- R3 ~0 ~8 h( j: u圖8:異質(zhì)集成技術(shù)的示意圖,顯示了III-V族材料與硅基底的集成。
    . ~; M4 B6 X! [& D; v2 y
    0 o. C% j- @4 {& l這種異質(zhì)集成技術(shù)已經(jīng)在超過8百萬個部署在超大規(guī)模云服務(wù)提供商處的PIC中得到驗(yàn)證,包含超過3200萬個片上激光器。+ J" _/ f' D, |2 S* j) T4 f
    . ?" n) p" i+ `) h  n* N; v: Y
    OCI Chiplet4 a: b( P  ?  L  V
    英特爾的OCI Chiplet是一個die堆疊,提供使用英特爾硅基光電子技術(shù)的光學(xué)I/O,可以與xPU共同封裝。第一代OCI Chiplet的主要參數(shù)包括:
    8 {5 q/ @: |+ z) K. I
  • 主機(jī)接口:PCIe gen5 SerDes接口
  • 光學(xué)端:8光纖 x 8波長 x 32G NRZ,通過單模光纖的密集波分復(fù)用
  • 總帶寬:4 Tbps(雙向各2 Tbps)
  • 端到端比特錯誤率:
  • 能量效率:~5 pJ / bit
    . N6 ~8 ?. l3 i

    . `% r. k( F$ x1 P* a
    ) W( T3 ^+ c" D2 z3 m/ p/ B - @! c% t' I& k+ O
    圖9:OCI Chiplet概念圖,顯示了xPU與OCI模塊的共同封裝。) Q* o- L$ d* B9 a7 h
    8 ]5 R- u+ i( N* h  e
    英特爾在OFC 2024上展示的概念CPU與共同封裝OCI,展示了這項(xiàng)技術(shù)的實(shí)際應(yīng)用。該演示顯示,僅就光學(xué)鏈路而言,OCI技術(shù)在功率和密度方面分別比可插拔模塊提高了3倍以上和5倍以上。1 A4 s+ b7 N2 e$ R' V. q. j
    # x1 \4 E; r# e$ [7 q' n, K) a
    OCI技術(shù)的未來發(fā)展2 y  \7 `& p/ J1 |$ I+ e2 D0 d1 D
    英特爾對OCI技術(shù)的發(fā)展有明確的路線圖,包括以下幾個關(guān)鍵方向:
    ) B* ]6 U: q* \; x. E
  • 波長數(shù)量的擴(kuò)展:從當(dāng)前的8波長增加到16波長,甚至更多。
  • 線路速率的提升:從32G NRZ提升到64G PAM4,未來可能達(dá)到128G或更高。
  • 光纖數(shù)量的增加:在保持小型化的同時增加光纖數(shù)量,提高總帶寬。
  • 利用偏振技術(shù):通過偏振復(fù)用進(jìn)一步提高帶寬密度。* t  B; R* E' e
    , [8 U- z$ B3 H( y
    這些進(jìn)步將使OCI技術(shù)能夠支持更高帶寬、更低延遲和更高能效的AI和高性能計算應(yīng)用。% S, n& I% @, D: U+ E4 Z2 @
    . P* C  M) `$ f
    結(jié)論, ]7 x2 \2 x2 l. h
    光計算互連(OCI)技術(shù)代表了AI基礎(chǔ)設(shè)施互連領(lǐng)域的重大突破。通過利用集成光電子技術(shù)的優(yōu)勢,OCI提供了下一代AI和ML應(yīng)用所需的高帶寬、低延遲和高能效。隨著英特爾等公司持續(xù)投資和開發(fā)這項(xiàng)技術(shù),我們可以期待看到更強(qiáng)大、更高效的AI系統(tǒng)出現(xiàn),推動人工智能領(lǐng)域的持續(xù)發(fā)展。
    9 {4 H4 h1 c8 b6 D. C+ d% {5 M, s* l( Q/ h
    OCI技術(shù)不僅解決了當(dāng)前AI基礎(chǔ)設(shè)施面臨的挑戰(zhàn),還為未來的發(fā)展提供了可擴(kuò)展的解決方案。通過持續(xù)的技術(shù)創(chuàng)新和產(chǎn)業(yè)合作,OCI有潛力成為支撐下一代AI和高性能計算基礎(chǔ)設(shè)施的關(guān)鍵技術(shù)。7 c" V% ?) y4 q$ Y
    " x) I( n8 Y. i$ t: w8 R* Y
    本文詳細(xì)介紹了OCI技術(shù)的原理、應(yīng)用和發(fā)展前景,希望能為讀者提供對這一新興技術(shù)的全面了解。隨著技術(shù)的不斷進(jìn)步,我們可以期待OCI在推動AI和高性能計算領(lǐng)域發(fā)展中發(fā)揮越來越重要的作用。
    % H! D7 j& [) k- p
    # f/ u& q, l! x參考文獻(xiàn)
    ) C) ^. L; R/ C3 f[1] C. Urricariet, "Optical Compute Interconnect (OCI): A new class of optics for AI infrastructure," presented at LightCounting Webinar: "Special Requirements for Optical Connectivity in AI Clusters," Jul. 30, 2024.
      j0 R% \8 Z( y% A3 N5 P& [, J( ]" z) ^6 j6 o( [7 @: m; i2 @. i
    - END -
    * f5 L! B& C8 [' X' n: y6 x  Q. K1 H; \5 U- u, b) V. ^) V: z/ L5 x& m3 ^
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    3 M: a0 U) T0 |' ]' X9 G8 t點(diǎn)擊左下角"閱讀原文"馬上申請
    6 u9 z* k" X& A) g: e- S
    0 @9 b' W$ U: x6 w歡迎轉(zhuǎn)載
    1 Q) q2 f! m' _7 {7 ^  g8 L
    0 E6 ^9 C% D( w0 L* `9 l轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    # y9 q* d3 a3 I3 j+ K% a$ A4 z, `" m

    # C) r, y' ^% r4 B4 o2 o/ k
    ! e8 [5 T0 w* r# B

    " O$ E9 F9 d+ K; t6 ~5 {
    # G& r' ~: z: g+ H& O: I關(guān)注我們
    * I; L, S$ I% A6 a, }* v
    9 `- p9 I! d9 n

    1 x. e7 L% \8 _4 P) J4 N  F# P! Z
    ( H) ~9 v$ J$ k. h& Q' l) b7 j
    ) m" x2 X7 w3 F3 O

    ! J. t( Y6 w( H% ~5 n! ?3 [! B
    9 V4 a6 Y+ Q  Y! d
    1 ^; Z. E; K" `2 s( Y
                         
    " s) O/ t/ h* a6 }& K' T* U1 ?! ~. y/ G* u6 N
    : }( {) g1 ]/ Q& x" P( ^/ Z1 ^
    7 [, D' Z1 a' o$ k( }  t
    關(guān)于我們:
    & ^: P7 [/ N4 n深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    6 M2 Q& c7 X- s' n1 f6 H& Z+ I7 o/ R4 [2 M1 b( u
    http://www.latitudeda.com/# [7 e9 W; \/ C2 x; i1 I
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表