根據(jù)最近的一項(xiàng)調(diào)查,大量人工智能專業(yè)人士正計(jì)劃從英偉達(dá)轉(zhuǎn)向采用AMD Instinct MI300X GPU。
TensorWave 聯(lián)合創(chuàng)始人 Jeff Tatarchuk 透露,他們進(jìn)行了一項(xiàng)獨(dú)立調(diào)查,涵蓋 82 名工程師和人工智能專業(yè)人士。其中,約有 50% 的受訪者表示他們對(duì) AMD Instinct MI300X GPU 充滿信心,因?yàn)橄啾扔谟ミ_(dá)的 H100 系列產(chǎn)品,MI300X 不僅擁有更出色的性價(jià)比,而且供應(yīng)充足,避免了遇到貨源緊張的問(wèn)題。Jeff 還提到,TensorWave 公司也將采用 MI300X 人工智能加速器。這對(duì)于 AMD 來(lái)說(shuō)無(wú)疑是個(gè)好消息,因?yàn)橐酝?Instinct 系列產(chǎn)品相比英偉達(dá)的競(jìng)品,市場(chǎng)占有率一直處于劣勢(shì)。
據(jù)IT之家了解,AMD Instinct MI300X 人工智能加速器基于 CDNA 3 架構(gòu)打造,采用混合的 5nm 和 6nm 制程工藝,擁有多達(dá) 1530 億晶體管 (MI300X 型號(hào))。存儲(chǔ)方面也獲得了巨大提升,MI300X 的 HBM3 容量比上一代的 MI250X (128 GB) 高出 50%。
與英偉達(dá) H100 相比,MI300X 擁有以下優(yōu)勢(shì):
內(nèi)存容量高出 2.4 倍
內(nèi)存帶寬高出 1.6 倍
FP8 性能 (TFLOPS) 高出 1.3 倍
FP16 性能 (TFLOPS) 高出 1.3 倍
在 1v1 對(duì)比測(cè)試中,性能方面可領(lǐng)先 H100 (Llama 2 70B) 最多 20%
在 1v1 對(duì)比測(cè)試中,性能方面可領(lǐng)先 H100 (FlashAttention 2) 最多 20%
在 8v8 服務(wù)器對(duì)比測(cè)試中,性能方面可領(lǐng)先 H100 (Llama 2 70B) 最多 40%
在 8v8 服務(wù)器對(duì)比測(cè)試中,性能方面可領(lǐng)先 H100 (Bloom 176B) 最多 60%
AMD 的旗艦 Instinct 人工智能加速器 MI300X 不僅在性能上取得了巨大飛躍,而且上市時(shí)機(jī)也非常巧妙,因?yàn)橛ミ_(dá)目前正被積壓的訂單困擾,這限制了他們拓展新客戶的機(jī)會(huì)。雖然此前 AMD 在人工智能領(lǐng)域的表現(xiàn)并不盡如人意,但未來(lái)似乎一片光明,有望在激烈的競(jìng)爭(zhēng)中占據(jù)一席之地。