首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 頭條資訊 >> 正文

英偉達深夜發(fā)“重磅” 預計2025年推出Blackwell Ultra AI芯片

2024年6月4日 07:48  每日經濟新聞  作 者:楊卉

6月2日晚間,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛登臺演講,透露了不少關鍵信息。據他介紹,使用NVIDIA NIM將AI模型部署在云、數據中心或工作站上的開發(fā)者,可將模型部署時間從以前的數周縮短至幾分鐘。和碩、勞氏公司、西門子等客戶均在使用。

此外,被英偉達寄予厚望的新一代AI芯片與超級計算平臺Blackwell芯片已開始投產,預計將在2025年推出Blackwell Ultra AI芯片。

NVIDIANIM可將模型部署時間從數周縮短至幾分鐘

6月2日晚間,一身皮衣的英偉達創(chuàng)始人黃仁勛又在舞臺上擺弄起了自家產品,重磅介紹了NVIDIANIM,一種推理微服務,可通過經優(yōu)化的容器形式提供模型,旨在助力各種規(guī)模企業(yè)部署AI服務。

不過,嚴格來說,NVIDIANIM并非新品,最早露面是在今年3月。英偉達在6月2日晚間宣布,全球2800萬開發(fā)者皆可下載NVIDIANIM,將AI模型部署在云、數據中心或工作站上,構建Copilot(一種AI助理)、ChatGPT聊天機器人(10.190, -0.13, -1.26%)等生成式AI應用。下月起,NVIDIA 開發(fā)者計劃的會員可免費使用NIM,在其選擇的基礎設施上進行研究、開發(fā)和測試。

根據英偉達的說法,新的生成式AI應用正變得越來越復雜,通常需要使用具有不同功能的多個模型來生成文本,如圖像、視頻、語音等。而NVIDIANIM提供了一種簡單、標準化的方式——將生成式AI添加到應用中,可使模型部署時間從以前的數周縮短至幾分鐘。

黃仁勛還透露,包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近200家技術合作伙伴正在將NIM集成到他們的平臺中,以加快生成式AI部署!懊總企業(yè)都希望在其運營中融入生成式AI,但并非每個企業(yè)都擁有專門的AI研究團隊。NVIDIA NIM 可被集成到任意平臺中,任何地方的開發(fā)者都可以訪問,并且可以在任意環(huán)境中運行。”黃仁勛稱。

《每日經濟新聞》記者了解到,NIM是預先構建的,目前有近40個模型可作為NIM的端點供開發(fā)者體驗;開發(fā)人員可從開源社區(qū)平臺Hugging Face訪問適用于Meta Llama 3模型的NVIDIA NIM微服務,使用Hugging Face推理端點訪問和運行 Llama 3 NIM。

值得注意的是,英偉達還透露了一批大客戶的使用情況,如電子制造商Foxconn正在使用NIM開發(fā)針對特定領域的大語言模型(LLM),用于智能制造、智慧城市和智能電動汽車;和碩正在將NIM用于一個當地的混合專家(MoE)模型;勞氏公司正在用 NVIDIA NIM推理微服務來提升員工和客戶的體驗;西門子正在將其運營技術與NIM微服務整合,用于車間AI工作負載;還有數十家醫(yī)療保健公司正在部署NIM,為包括手術規(guī)劃、數字助理、藥物發(fā)現和臨床試驗優(yōu)化等在內的應用領域的生成性AI推理提供支持。

Blackwell芯片開始投產

除了上述產品,黃仁勛還在演講中透露,英偉達Blackwell芯片已開始投產,并將在2025年推出Blackwell Ultra AI芯片。

今年5月,黃仁勛在財報電話會上稱,預計今年Blackwell架構芯片將為公司帶來大量收入。英偉達對Blackwell芯片寄予厚望,還是與市場強勁需求有關。從最新披露的財報數據來看,2025財年第一財季,英偉達實現營收260億美元,較上年同期增長262%。其中,數據中心業(yè)務營收226億美元,與上年同期相比增長427%,是業(yè)績收入的“大頭”。

據英偉達首席財務官科萊特•克雷斯解讀,數據中心業(yè)務的增長源自Hopper架構GPU(例如H100)出貨量的增加;該季度的重要亮點之一就是Meta宣布推出Lama 3開源大模型,使用了近2.4萬塊H100 GPU。

除了披露芯片量產進度,英偉達此次還推出了一系列采用NVIDIABlackwell架構的系統。

據悉,這些系統搭載了GraceCPU以及NVIDIA網絡和基礎設施,用于助力企業(yè)建立AI工廠和數據中心。其中,NVIDIA MGX模塊化參考設計平臺加入了對NVIDIA Blackwell產品的支持,包括專為主流大語言模型推理、檢索增強生成和數據處理提供卓越性能打造的NVIDIA GB200 NVL2平臺。

英偉達強調,GB200 NVL2適合用于數據分析等新興領域,借助NVLink—C2C互連技術帶來的帶寬內存性能及Blackwell架構中專有的解壓縮引擎,較使用X86CPU時的數據處理速度可最多提速到18倍,能效提高8倍。“新一輪工業(yè)革命已經開始,眾多企業(yè)和地區(qū)正在與NVIDIA合作推動價值萬億美元的傳統數據中心向加速計算轉型,并建造一種新型數據中心AI工廠來生產新的商品,人工智能!秉S仁勛稱。

英偉達方面表示,目前已有超過25家合作伙伴的90多套已發(fā)布或正在開發(fā)中的系統使用了MGX參考架構,開發(fā)成本較之前最多降低了四分之三,開發(fā)時間縮短到六個月,較之前減少了三分之二。另外,英偉達還透露,比亞迪(237.100, 8.08, 3.53%)電子、西門子、泰瑞達和Alphabet旗下公司Intrinsic等全球十多家機器人企業(yè)正在將NVIDIAIsaac加速庫、基于物理學的仿真和AI模型集成到其軟件框架和機器人模型中,以此提高工廠、倉庫和配送中心的工作效率。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國電信董事長柯瑞文:天翼云作為國家云已經越過向智能云發(fā)展的拐點
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像