2月2日—4日,騰訊云、百度智能云、阿里云前后接入DeepSeek相關(guān)大模型,而大廠在春節(jié)假期為深度求索公司加班,只是DeepSeek爆火的一個(gè)證據(jù)。英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄、OpenAI上新o3-mini推理模型、DeepSeek卡頓、榜單第一……與深度求索直接間接相關(guān)的新聞,在春節(jié)期間不斷刷新。
單論擁抱DeepSeek,海外同行的動(dòng)作更快,微軟、英偉達(dá)、亞馬遜科技等在1月底就已接入。據(jù)稱(chēng)DeepSeek以3%的成本超越了OpenAI,且開(kāi)源,這意味著以低成本已可訓(xùn)練出足夠好的AI模型。不管是為了客戶(hù)的多樣化需求,還是為了構(gòu)建AI生態(tài),云廠商快速接入最火的大模型,都是筆劃算的買(mǎi)賣(mài)。
七巨頭集結(jié)
“讓更多開(kāi)發(fā)者便捷調(diào)用DeepSeek,騰訊云再出一把力”,2月4日,騰訊云又一次拉近與DeepSeek的距離,在騰訊云TI平臺(tái)推出“開(kāi)發(fā)者大禮包”:DeepSeek全系模型一鍵部署,部分模型限免體驗(yàn)。在此之前,騰訊云已在2月2日宣布將DeepSeek-R1大模型一鍵部署至騰訊云“HAI”上,開(kāi)發(fā)者僅需3分鐘就能接入調(diào)用,一改以往慢吞吞的風(fēng)格。
更早打出低價(jià)牌的是百度智能云,2月3日,百度智能云千帆平臺(tái)正式上架DeepSeek-R1和 DeepSeek-V3模型,并推出超低價(jià)格方案,用戶(hù)還可享受限時(shí)免費(fèi)服務(wù)。
北京商報(bào)記者了解到,目前騰訊云TI平云采用按量計(jì)費(fèi)和包年包月計(jì)費(fèi)模式,百度智能云千帆平臺(tái)限時(shí)免費(fèi)2周至2月18日24:00。
阿里云也在春節(jié)期間就開(kāi)了工,“大年初六,我們進(jìn)入正題”,阿里云以此開(kāi)場(chǎng),在2月3日宣布阿里云PAI ModelGallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。
對(duì)于費(fèi)用,阿里云相關(guān)人士以全部部署好所需資源為例向北京商報(bào)記者介紹,“部署DeepSeek-R1-Distill-Qwen-7B模型的價(jià)格約為11.1元/小時(shí)(以A10機(jī)型為例);部署DeepSeek-R1模型的價(jià)格約為316元/小時(shí)。模型部署成功后按實(shí)例運(yùn)行時(shí)長(zhǎng)計(jì)費(fèi),不滿(mǎn)1小時(shí)按具體分鐘數(shù)折算計(jì)費(fèi)”。目前阿里云百煉平臺(tái)也已上線DeepSeek-R1和DeepSeek-V3模型API,且面向用戶(hù)限時(shí)免費(fèi)中。
華為云則在2月1日即宣布,硅基流動(dòng)與華為云團(tuán)隊(duì)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek-R1/V3推理服務(wù)。
這波比拼中,不在春節(jié)假期的海外公司占了先機(jī)。
1月31日,英偉達(dá)宣布,NVIDIA NIM(一種云原生微服務(wù)技術(shù))已經(jīng)可以使用DeepSeek-R1。微軟同日稱(chēng)已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級(jí)AI服務(wù)平臺(tái)的一部分。
亞馬遜云科技(AWS)也宣布:企業(yè)和開(kāi)發(fā)者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,還可以使用AWS Trainium等以經(jīng)濟(jì)高效的方式部署 DeepSeek-R1-Distill模型。
春節(jié)彩蛋
不是深度求索2025年1月20日發(fā)布的DeepSeek-R1,就是2024年12月26日上線的全新系列模型DeepSeek-V3,海內(nèi)外大廠接入的,正是春節(jié)前就在各大主流媒體和社交網(wǎng)站刷屏的大模型“黑馬”。
“突然間,美國(guó)在人工智能領(lǐng)域相對(duì)于中國(guó)的領(lǐng)先地位,似乎比自ChatGPT走紅以來(lái)的任何時(shí)候都要小”,英國(guó)《經(jīng)濟(jì)學(xué)人》雜志評(píng)論,理由是“一家中國(guó)公司(即深度求索)發(fā)布了最新的令人印象深刻的大語(yǔ)言模型”。
從數(shù)據(jù)到體感,印象深刻的例子不難找。
七麥數(shù)據(jù)顯示,1月27日至今,DeepSeek在中國(guó)內(nèi)地免費(fèi)蘋(píng)果總榜、應(yīng)用榜、效率榜均排在第一名,放大到全球榜單,截至北京商報(bào)記者發(fā)稿,DeepSeek在72個(gè)地區(qū)的免費(fèi)蘋(píng)果總榜、應(yīng)用榜、效率榜位居榜首。
根據(jù)AI產(chǎn)品榜1月31日的數(shù)據(jù),DeepSeek上線18天日活用戶(hù)數(shù)1500萬(wàn),ChatGPT達(dá)到同樣的數(shù)據(jù)用了244天,增速是ChatGPT的13倍之多,DeepSeek被公認(rèn)為是全球增速最快的AI應(yīng)用。
除了大模型的真本事,春節(jié)或許也是DeepSeek加速擴(kuò)散的原因之一。
2025年1月28日除夕夜,在互聯(lián)網(wǎng)大廠工作的林悅(化名)把DeepSeek生成的拜年祝福分享在家族群。就這樣,DeepSeek被“分發(fā)”到天南海北,那晚他給自己及親戚好友生成了不低于10個(gè)新春祝福。第二天,林悅在西北四線城市生活的阿姨告訴他,自己在社交平臺(tái)刷到了談?wù)揇eepSeek的短視頻。
再比如登上熱搜第一的話題:“DeepSeek回答如何過(guò)好這一生”,它的回復(fù)是:“沒(méi)有完美的人生劇本,所有選擇都有代價(jià),關(guān)鍵是要有承擔(dān)選擇的勇氣!北本┥虉(bào)記者也向DeepSeek提出了同樣的問(wèn)題,嘗試多次后DeepSeek均顯示“服務(wù)器繁忙,請(qǐng)稍后再試”,火爆程度可見(jiàn)一斑。
“拼多多”路徑
需要強(qiáng)調(diào)的是,“中國(guó)的大語(yǔ)言模型并非最頂尖的,但它們的制造成本要低得多”,《經(jīng)濟(jì)學(xué)人》舉例,阿里旗下的通義千問(wèn)QwQ-32B-Preview于2024年11月推出,與美國(guó)的頂尖模型相比,差距不到三個(gè)月,DeepSeek在一項(xiàng)標(biāo)準(zhǔn)評(píng)估中排名第七。
報(bào)道稱(chēng),DeepSeek是由2000多塊二流芯片訓(xùn)練而來(lái),Meta的模型則用了1.6萬(wàn)塊頂尖芯片。在某些排名中,DeepSeek的表現(xiàn)甚至超過(guò)了Meta的模型。訓(xùn)練一個(gè)美國(guó)的大語(yǔ)言模型成本高達(dá)數(shù)千萬(wàn)美元,而且還在上升,而DeepSeek方面表示,其訓(xùn)練成本不到600萬(wàn)美元。
提到DeepSeek火爆的原因,工信部信息通信經(jīng)濟(jì)專(zhuān)家委員會(huì)委員盤(pán)和林表示,“DeepSeek采取低價(jià)和開(kāi)源兩條路并行的策略,尤其是開(kāi)源,之前全球AI開(kāi)發(fā)者都要看Meta的臉色,因?yàn)樽钣忻拈_(kāi)源模型是Llama,有了DeepSeek,Llama立馬不香了,而那些收費(fèi)較高的,如ChatGPT則受到較大打擊,免費(fèi)和收費(fèi)哪個(gè)香?很容易作出決斷,DeepSeek也算中國(guó)第一個(gè)打通國(guó)內(nèi)國(guó)外應(yīng)用生態(tài)的產(chǎn)品”。
“模型成本的下降對(duì)產(chǎn)業(yè)鏈上的云服務(wù)廠商存在利好”,在比達(dá)分析師李錦(金麒麟分析師)清看來(lái),這正是云廠商火速接入DeepSeek的原因,站在市場(chǎng)競(jìng)爭(zhēng)力與商業(yè)價(jià)值看,“接入DeepSeek模型有助于云廠商提升自身在AI領(lǐng)域的競(jìng)爭(zhēng)力,吸引更多開(kāi)發(fā)者和企業(yè)客戶(hù)。通過(guò)提供DeepSeek模型的部署和應(yīng)用服務(wù),云廠商可以拓展業(yè)務(wù)范圍,增加收入來(lái)源”。