來源:華爾街見聞
AI領(lǐng)域又一重大突破?媒體稱,英特爾(30.54, -0.20, -0.65%)推出首款OCI芯片組,能提高AI基礎(chǔ)設(shè)施的數(shù)據(jù)傳輸速率,并減少延遲和功耗,這對(duì)需要高速數(shù)據(jù)傳輸?shù)腁I基建和應(yīng)用至關(guān)重要。
美東時(shí)間6月26日,在2024年的光纖通信會(huì)議(OFC)上,英特爾的集成光子解決方案(IPS)小組展示了業(yè)界最先進(jìn)的、也是首次完全集成的光計(jì)算互連(OCI)芯片組,該芯片組與英特爾CPU共同封裝并運(yùn)行實(shí)時(shí)數(shù)據(jù)。
英特爾的OCI芯片組通過在數(shù)據(jù)中心和高性能計(jì)算 (HPC) 應(yīng)用的新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)共同封裝的光輸入/輸出 (I/O),代表了高帶寬互連的一次飛躍。英特爾稱,我們?cè)谌诤瞎怆娍萍嫉礁咚贁?shù)據(jù)傳輸方面實(shí)現(xiàn)一個(gè)革命性的里程碑。
功能方面,這款首款OCI芯片支持64個(gè)獨(dú)立通道,每個(gè)通道能夠以32千兆位/秒 (Gbps)的速率傳輸數(shù)據(jù),并在長(zhǎng)達(dá)100米的光纖上高效傳輸數(shù)據(jù),有望滿足AI基礎(chǔ)設(shè)施對(duì)更高帶寬、更低功耗和更長(zhǎng)傳輸距離日益增長(zhǎng)的需求。它增強(qiáng)了集群中CPU與GPU之間的連接,并支持創(chuàng)新的計(jì)算架構(gòu),如一致性內(nèi)存擴(kuò)展和資源解耦。
新一代光學(xué)I/O技術(shù)推動(dòng)了計(jì)算平臺(tái)的革新,以適應(yīng)日益增長(zhǎng)的AI工作負(fù)載
隨著AI技術(shù)的飛速發(fā)展,自動(dòng)駕駛、高級(jí)數(shù)據(jù)分析和虛擬助手等應(yīng)用在全球范圍內(nèi)日益普及,對(duì)計(jì)算資源的需求急劇增加。特別是大型語(yǔ)言模型如GPT,以及生成式AI技術(shù)的快速發(fā)展,極大地推動(dòng)了AI技術(shù)的應(yīng)用。然而,這些先進(jìn)的AI模型需要處理和生成的數(shù)據(jù)量巨大,對(duì)計(jì)算資源和數(shù)據(jù)傳輸提出了極高的要求。
隨著機(jī)器學(xué)習(xí)模型的規(guī)模不斷擴(kuò)大,它們?cè)贏I加速工作中的作用也變得越來越復(fù)雜,需要極高的計(jì)算能力和數(shù)據(jù)處理能力才能有效運(yùn)行。這種對(duì)高性能計(jì)算平臺(tái)的需求正在推動(dòng)輸入/輸出(I/O)帶寬的指數(shù)級(jí)增長(zhǎng)和(4.7, 0.10, 2.17%)數(shù)據(jù)傳輸距離的延伸。
為了應(yīng)對(duì)這一挑戰(zhàn),數(shù)據(jù)中心正在向更大的處理單元集群,如CPU、GPU和IPU的使用,以及更高效的資源利用架構(gòu),如xPU解耦和內(nèi)存池化方向發(fā)展。這些技術(shù)的實(shí)施將提高處理效率,降低系統(tǒng)延遲,并優(yōu)化資源配置,從而支持更廣泛的AI計(jì)算和應(yīng)用。
盡管傳統(tǒng)的電子I/O系統(tǒng)在傳輸大量數(shù)據(jù)時(shí)表現(xiàn)出高帶寬密度和低功耗的優(yōu)點(diǎn),但其最大的弱點(diǎn)是傳輸距離短,通常僅限于一米內(nèi)。這嚴(yán)重限制了數(shù)據(jù)中心內(nèi)部的設(shè)備布局,使得組件之間的連接受到嚴(yán)格的空間限制。
為了突破這一限制,數(shù)據(jù)中心和早期AI集群開始采用可插拔光學(xué)模塊技術(shù),這種技術(shù)能夠提供比電子I/O更長(zhǎng)的傳輸距離。然而,隨著AI應(yīng)用對(duì)資源的不斷增加,光學(xué)模塊在成本和能耗方面的壓力也隨之增大。
為了應(yīng)對(duì)這些挑戰(zhàn),新一代光學(xué)I/O技術(shù)應(yīng)運(yùn)而生。這種技術(shù)將光學(xué)I/O與處理器(如CPU、GPU或IPU等,統(tǒng)稱為xPU)共封裝,不僅大幅提高了帶寬,還優(yōu)化了芯片內(nèi)部的光和電信號(hào)傳輸,顯著降低了能量消耗,還大幅減少了數(shù)據(jù)傳輸過程中的延遲,對(duì)于需要快速響應(yīng)的AI應(yīng)用來說至關(guān)重要。
更令人興奮的是,這項(xiàng)技術(shù)支持的傳輸距離遠(yuǎn)超以往,為數(shù)據(jù)中心的設(shè)計(jì)提供了更大的靈活性,使得系統(tǒng)能夠適應(yīng)更廣泛的擴(kuò)展需求。光學(xué)I/O技術(shù)的推廣不僅解決了數(shù)據(jù)傳輸?shù)耐袋c(diǎn),也為AI和機(jī)器學(xué)習(xí)的未來發(fā)展鋪平了道路。
打個(gè)比方,傳統(tǒng)的電子I/O連接,類似于舊式馬車,在短距離傳輸中效率較高,但面對(duì)大量數(shù)據(jù)的長(zhǎng)距離傳輸需求時(shí),卻顯得力不從心。而英特爾的OCI芯片等光學(xué)I/O技術(shù),如同現(xiàn)代的汽車和卡車,不僅能在更長(zhǎng)的距離上傳輸更多的數(shù)據(jù),而且保持?jǐn)?shù)據(jù)的完整性,大大超越了傳統(tǒng)電子I/O的性能。
隨著AI和ML模型需求的不斷擴(kuò)大,光學(xué)I/O憑借其卓越的傳輸能力和高效能源利用,成為推動(dòng)未來AI技術(shù)發(fā)展的關(guān)鍵力量。就像汽車和卡車滿足了現(xiàn)代社會(huì)對(duì)快速、大規(guī)模物流的需求一樣,光學(xué)I/O使得數(shù)據(jù)能夠更快、更高效地在更長(zhǎng)的距離上傳輸,這對(duì)于擴(kuò)展AI基礎(chǔ)設(shè)施至關(guān)重要。
英特爾在硅光子學(xué)領(lǐng)域處于領(lǐng)導(dǎo)地位
憑借超過25年的深厚研究基礎(chǔ),英特爾實(shí)驗(yàn)室在集成光子學(xué)領(lǐng)域取得了開創(chuàng)性的成就。英特爾不僅是首家成功開發(fā)并大規(guī)模生產(chǎn)硅光子連接產(chǎn)品的企業(yè),更是以其卓越的產(chǎn)品可靠性,贏得了全球主要云服務(wù)提供商的信賴。
英特爾的核心競(jìng)爭(zhēng)力在于其獨(dú)特的混合激光器晶圓上技術(shù)和直接集成工藝,這些技術(shù)不僅提高了產(chǎn)品的可靠性,還降低了成本。這種獨(dú)特的方法使得英特爾能夠在保持高效率的同時(shí),提供卓越的性能。到目前為止,英特爾的強(qiáng)大生產(chǎn)平臺(tái)已經(jīng)出貨超過800萬(wàn)片集成電路芯片,這些芯片集成了超過3200萬(wàn)個(gè)芯片級(jí)激光器。其激光器的故障率極低(故障率小于0.1),這一指標(biāo)在業(yè)界廣泛認(rèn)可,表明故障率極低。
這些芯片被封裝在可插拔的收發(fā)器模塊中,并在大型數(shù)據(jù)中心網(wǎng)絡(luò)中得到部署,服務(wù)于多家大型云服務(wù)提供商,用于100Gbps、200Gbps和400Gbps的應(yīng)用。目前,英特爾還在開發(fā)下一代200Gbps每通道的芯片,以支持即將到來的800Gbps和1.6Tbps的應(yīng)用。
在制造工藝上,英特爾引入了全新的硅光子制造工藝節(jié)點(diǎn),這一工藝不僅提升了設(shè)備性能,還實(shí)現(xiàn)了更高的集成度和更佳的耦合效率,同時(shí)顯著降低了成本。英特爾在芯片激光器和SOA性能、成本控制以及能效優(yōu)化方面不斷取得突破,芯片面積減少了超過40%,能耗降低了超過15%,進(jìn)一步鞏固了其在硅光子技術(shù)領(lǐng)域的領(lǐng)先地位。
英特爾目前的OCI芯片模塊尚處于原型階段。展望未來,英特爾正在與特定客戶合作,將OCI與他們的系統(tǒng)級(jí)芯片(SoCs)一起封裝,開發(fā)一種創(chuàng)新的光學(xué)輸入/輸出解決方案。