首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

305個(gè)大模型備案率僅45.9% 如何尋找破局之路?

2024年5月21日 08:38  每日經(jīng)濟(jì)新聞  作 者:可楊 楊卉

2023年3月15日,隨著OpenAI多模態(tài)預(yù)訓(xùn)練大模型GPT-4的發(fā)布,國內(nèi)包括百度、華為、騰訊等科技巨頭,百川智能等初創(chuàng)企業(yè),以及智譜AI研究院等研究機(jī)構(gòu)紛紛揚(yáng)帆起航,投身到人工智能(AI)大模型的開發(fā)中,試圖搭上這趟時(shí)代列車,轟轟烈烈的“百模大戰(zhàn)”也由此開啟。

新華社圖

據(jù)《每日經(jīng)濟(jì)新聞》記者不完全統(tǒng)計(jì),截至2024年4月底,國內(nèi)共計(jì)推出了305個(gè)大模型。而截至5月16日,只有約140個(gè)大模型完成了生成式人工智能服務(wù)備案,占發(fā)布總量的45.9%。這意味著,還有約165個(gè)大模型尚未“過審”。

這一嚴(yán)峻現(xiàn)實(shí)的背后除了技術(shù)層面的難題,還有訓(xùn)練和推理過程中高昂算力成本的制約。即便跨過這些關(guān)卡,大模型企業(yè)如何實(shí)現(xiàn)商業(yè)化,依然面臨眾多難題。而對這場競賽中可能被“出局”的公司來說,未來的路又在何方?

現(xiàn)狀:305個(gè)大模型發(fā)布,約140個(gè)完成備案

GPT-4的發(fā)布在全球掀起了“大模型”熱潮,面對這一新藍(lán)海,科技巨頭、初創(chuàng)企業(yè)以及科研院所相繼開啟布局,沒人想錯(cuò)過這趟時(shí)代的列車。

據(jù)《每日經(jīng)濟(jì)新聞》記者不完全統(tǒng)計(jì),截至今年4月底,國內(nèi)共推出了約305個(gè)大模型,在過去一年推動著語言理解、圖像識別等多個(gè)領(lǐng)域的技術(shù)進(jìn)步。截至2024年5月16日,國內(nèi)共有約140個(gè)大模型完成生成式人工智能服務(wù)備案,占305個(gè)大模型的約45.9%。

此前,國家網(wǎng)信辦有關(guān)負(fù)責(zé)人就《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《辦法》)相關(guān)問題回答媒體提問時(shí)介紹,《辦法》規(guī)定,利用生成式人工智能技術(shù)向中華人民共和國境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務(wù),適用本辦法。

在已備案的大模型中,在地域分布上,北京以70個(gè)備案大模型領(lǐng)跑全國,凸顯了其在AI領(lǐng)域的集聚效應(yīng)。上海和廣東緊隨其后,分別有28個(gè)和19個(gè)大模型備案。

而“140”這一數(shù)字同時(shí)也意味著,從備案層面來看,大約還有165個(gè)大模型依舊未通過備案,無法公開向公眾提供服務(wù)。這些尚未能“過審”的大模型中,不乏一些備受關(guān)注的明星項(xiàng)目,包括曾號稱是“國內(nèi)首個(gè)ChatGPT”的元語智能大模型ChatYuan。

更多未完成備案的是“學(xué)院派”大模型。在305個(gè)大模型中,有60個(gè)大模型是由大學(xué)或研究院所研發(fā)的。或許是由于研究機(jī)構(gòu)的項(xiàng)目更偏重學(xué)術(shù)探索,而非商業(yè)應(yīng)用,備案動力可能不如企業(yè)充足。也有大模型轉(zhuǎn)向“境內(nèi)深度合成服務(wù)算法”備案,例如恒生電子(21.710, 0.45, 2.12%)的大模型。

一名大模型行業(yè)的創(chuàng)業(yè)者對記者介紹道,當(dāng)前大模型相關(guān)的備案申請有點(diǎn)像專利申請,并不一定會通過,且申請周期較長,約為4~6個(gè)月。他表示,當(dāng)下,大模型只要做To C(面向消費(fèi)者)服務(wù),就需要備案,而在B端(企業(yè)端),一些大客戶會要求大模型公司完成備案工作。

不過他同時(shí)強(qiáng)調(diào),沒備案的大模型也不代表就消失在市面上了,很多來自研究所、大學(xué)的大模型僅僅只用于研究,就沒有動機(jī)去完成備案。

一家大模型頭部企業(yè)從業(yè)人士也告訴記者,來自大學(xué)的大模型,如果只做自身學(xué)術(shù)范圍內(nèi)的研究,是可以不用備案的。

“百模大戰(zhàn)”行至此時(shí),最終留下3~5個(gè)大模型已經(jīng)成為行業(yè)對于這場競賽最終結(jié)局的共識!按竽P瓦@個(gè)行業(yè)(到最后)可能就不存在了,未來大模型就是幾個(gè)最基本的底座,只有少數(shù)的幾家公司(去搞)!毙行蠥I董事長、順福資本創(chuàng)始人李明順此前在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)坦言。

難點(diǎn):日活千萬需年入超100億元才能覆蓋數(shù)據(jù)中心成本

算力資源的稀缺是制約大模型發(fā)展的關(guān)鍵瓶頸。對不少大模型來說,沒能挺過一周年,難搞的算力要負(fù)很大責(zé)任。對于大模型廠商而言,目前主要的算力成本包括預(yù)訓(xùn)練成本和推理成本。模型推理應(yīng)用階段對算力的需求要遠(yuǎn)遠(yuǎn)高于訓(xùn)練階段。

據(jù)中國工程院院士鄭緯民計(jì)算,在大模型訓(xùn)練的過程中,70%的開銷要花在算力上;推理過程中95%的花費(fèi)也是在算力上。以GPT-4為例,該模型的訓(xùn)練需要一萬塊英偉達(dá)A100芯片跑上11個(gè)月。假設(shè)每塊A100芯片的成本為10000美元(價(jià)格因供應(yīng)商和購買數(shù)量而異),那么一萬塊A100芯片的總成本約為1億美元。

對于許多急匆匆踏上大模型賽道的創(chuàng)業(yè)公司或科技企業(yè)來說,在“燒”了一陣子錢后,他們絕望地發(fā)現(xiàn),算力不僅越來越貴,質(zhì)量也開始下降,而且可能買不到。

鄭緯民表示,目前,市面上只有三類系統(tǒng)可支持大模型訓(xùn)練。其中,基于英偉達(dá)GPU的系統(tǒng)一卡難求;基于國產(chǎn)AI芯片的系統(tǒng)面臨國產(chǎn)卡應(yīng)用不足、生態(tài)系統(tǒng)有待改善的問題;而基于超級計(jì)算機(jī)的系統(tǒng),雖然可在做好軟硬件協(xié)同設(shè)計(jì)的情況下實(shí)現(xiàn)大模型訓(xùn)練,但需在超算機(jī)器尚未飽和的前提下操作,私人企業(yè)獲得超算設(shè)備的機(jī)會并不大。

據(jù)英特爾方面介紹,在大模型領(lǐng)域,去年關(guān)注點(diǎn)更多是在模型訓(xùn)練上,對成本和功耗并不那么重視。彼時(shí),企業(yè)都希望能訓(xùn)練一個(gè)自身的通用大模型。隨著很多通用大模型被訓(xùn)練出來,今年關(guān)注的重點(diǎn)則轉(zhuǎn)移到了推理。對企業(yè)來說,大模型訓(xùn)練出來是需要變現(xiàn)且能夠盈利的。但目前市場上很多大模型都是開源的,性能差不多,用于訓(xùn)練的數(shù)據(jù)也差不多,很難通過差異化來盈利。

沒有足夠的資金支撐推理過程,成了很多創(chuàng)業(yè)者敗退的重要原因。為了降低成本,部分企業(yè)正在嘗試探索是否可以用CPU來做大模型推理。從當(dāng)前一些案例來看,在130億參數(shù)以下的大模型中,CPU是可以做到這一點(diǎn)的。

然而,即便是熬過了推理關(guān),企業(yè)要將大模型變現(xiàn)仍有不小的難度。在行云集成電路創(chuàng)始人季宇看來,大模型的商業(yè)落地與早期互聯(lián)網(wǎng)時(shí)代相比區(qū)別很大,邊際成本仍然非常高。大模型每增加一個(gè)用戶,基礎(chǔ)設(shè)施需增加的成本是肉眼可見的,一個(gè)月幾十美元的訂閱費(fèi)用根本不足以抵消背后高昂的成本。

更為關(guān)鍵的是,眼下大模型要大規(guī)模商業(yè)化,在模型質(zhì)量、上下文長度等方面還有進(jìn)一步訴求,不排除會進(jìn)一步增加邊際成本。目前來看,日活千萬的通用大模型一年需超過100億元的收入才能支撐其背后的數(shù)據(jù)中心成本,未來大模型要像互聯(lián)網(wǎng)產(chǎn)業(yè)一樣服務(wù)上億人,成本一定是邁不過去的檻。

尋找新“航道”:投身應(yīng)用或?qū)W⒋诡惣?xì)分行業(yè)

如果說“百模大戰(zhàn)”最后的贏家只屬于少數(shù)幾家公司,那在這場賽事中被淘汰的公司,未來會走向何方?

昆侖萬維(37.400, 0.31, 0.84%)董事長方漢此前在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,“百模大戰(zhàn)”會淘汰一部分公司,剩下的科技公司肯定會繼續(xù)全速前進(jìn)。

在行云集成電路創(chuàng)始人季宇看來,當(dāng)下和未來兩三年,大模型的商業(yè)探索會在成本和Token(大模型可以理解和生成的最小意義單位)質(zhì)量上相互妥協(xié),并逐漸分化為兩派。

一派是質(zhì)量優(yōu)先,用高端系統(tǒng)打造高質(zhì)量的通用大模型,尋找超級應(yīng)用來覆蓋高昂的成本。另一派是成本優(yōu)先,用足夠便宜的硬件提供基本夠用的Token質(zhì)量,尋找垂直場景的落地。若能在同樣的成本下買到規(guī)格大得多的芯片,跑一個(gè)百億千億模型,支持超長上下文,商業(yè)化的空間會比今天大得多,就像曾經(jīng)的顯卡和游戲行業(yè)一樣。

啟明創(chuàng)投合伙人周志峰認(rèn)為,當(dāng)下,絕大多數(shù)的大模型企業(yè)是包著大模型的皮,裹著應(yīng)用的心。擁有模型能力的團(tuán)隊(duì)更容易在算法、模型、數(shù)據(jù)、模型的加速方面去作優(yōu)化,以做出體驗(yàn)更好的產(chǎn)品,尤其是相對那些用第三方模型純粹做應(yīng)用的公司。這一類公司其實(shí)不是模型公司,未來一定會是一家應(yīng)用公司。

周志峰以字節(jié)跳動為例,從今日頭條到抖音再到TikTok,背后的軸是AI驅(qū)動的推薦引擎。“字節(jié)跳動第一輪、第二輪融資的時(shí)候跟我們投資人講得更多的故事是AI驅(qū)動的推進(jìn)引擎,而今天大家不會再去說字節(jié)跳動是一家AI技術(shù)公司,只會記得是哪幾個(gè)應(yīng)用成就了這么大的規(guī)模!

李明順也持同樣的觀點(diǎn),在不遠(yuǎn)的將來,有一部分大模型公司要轉(zhuǎn)型成應(yīng)用公司,因?yàn)榇竽P皖I(lǐng)域不需要這么多公司,有一些大模型公司的創(chuàng)始人有Plan A和Plan B的雙計(jì)劃,就是一旦其模型實(shí)在是拼不過前面的5家之后,就要被迫在一些垂直領(lǐng)域里面找到生存之地,它就會轉(zhuǎn)型為一家應(yīng)用公司。

在備案成功的大模型中,部分模型已經(jīng)從通用型轉(zhuǎn)變?yōu)榫劢固囟I(lǐng)域或行業(yè)的細(xì)分垂類模型。

中科聞歌董事長王磊在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)坦言,在過去的半年到一年內(nèi),適當(dāng)做小行業(yè)大模型,降低參數(shù)規(guī)模的趨勢已經(jīng)變得非常明顯。真正成功的商業(yè)應(yīng)用不是制造一個(gè)巨無霸,而是能夠被用戶廣泛使用且價(jià)格適中。實(shí)用至上,不必為了面子而去追求大規(guī)模,高昂的代價(jià)會影響產(chǎn)品的市場推廣和用戶的使用,實(shí)用性才是商業(yè)發(fā)展的主導(dǎo)原則。

王磊表示:“在我們的大模型發(fā)布時(shí),國外網(wǎng)友評價(jià)這是企業(yè)級應(yīng)用的小型參數(shù)規(guī)格。我認(rèn)為一般的企業(yè)可能難以承受更大規(guī)模的產(chǎn)品。對于文本生成任務(wù),這個(gè)規(guī)模基本上是足夠的,但對于一些特定領(lǐng)域的任務(wù),還需要強(qiáng)化模型的能力。”

第四范式也同樣堅(jiān)定選擇投入行業(yè)大模型。“如果說無限把模型做大,往里面放無限多的數(shù)據(jù),最后可能會達(dá)到AGI(通用人工智能)的狀態(tài),但是在每一個(gè)垂直應(yīng)用領(lǐng)域,我們都要平衡好能力以及代價(jià)。”第四范式創(chuàng)始人戴文淵此前在公司業(yè)績溝通會上表示,從技術(shù)的角度來說,第四范式也追求AGI,但是與此同時(shí),對于每一個(gè)客戶的具體場景,也要做一定的裁剪,比如說這個(gè)考試只考數(shù)學(xué),不一定需要讓它(大模型)有解決物理問題的能力。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國移動李慧鏑:積極推進(jìn)算力網(wǎng)絡(luò)AI注智賦能,推動實(shí)現(xiàn)自智網(wǎng)絡(luò)“三零三自”愿景
精彩專題
CES 2024國際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像