近日,有報(bào)道稱人工智能領(lǐng)域新星Anthropic正在進(jìn)行一筆高達(dá)20億美元的融資談判,該輪融資由Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投。
自2021年成立以來(lái),Anthropic已從Menlo Park Ventures等VC以及亞馬遜、谷歌和 Salesforce等科技巨頭獲得超過(guò)113億美元的資金。最新一輪融資完成后,Anthropic估值將達(dá)到600億美元,較一年前的180億美元估值翻了三倍多。600億美元的估值意味著Anthropic將躋身美國(guó)估值最高的五大創(chuàng)業(yè)公司,僅次于SpaceX、OpenAI、Stripe和Databricks。
最近,海內(nèi)外模型廠商相繼開啟了新一輪融資。上個(gè)月,馬斯克的大模型平臺(tái)xAI完成了60億美元的C輪融資,市場(chǎng)估值超過(guò)400億美元。國(guó)內(nèi)模型廠商方面,2024年12月11日,面壁智能宣布完成新一輪數(shù)億元融資;12月17日,智譜AI獲得新一輪30億元融資;12月23日,階躍星辰完成了數(shù)億美元的B輪融資。
火熱背后,傳出異動(dòng)。李開復(fù)創(chuàng)立的零一萬(wàn)物被曝要將團(tuán)隊(duì)整體打包賣給阿里,雖然李開復(fù)連夜在朋友圈辟謠否認(rèn)出售,但零一萬(wàn)物明顯減少了對(duì)基礎(chǔ)大模型的押注。多位投資人、業(yè)內(nèi)高管向時(shí)代周報(bào)記者透露,“AI六小龍”普遍已不在預(yù)訓(xùn)練方面傾斜更多精力。
Anthropic的市場(chǎng)期待已高于OpenAI?
Anthropic由一對(duì)在美國(guó)舊金山的意大利裔美籍兄妹創(chuàng)立,兩人都是OpenAI的早期員工。公司成立兩個(gè)月后,A輪融資就籌集了1.24億美元;一年后拿下5.8億美元的B輪融資,團(tuán)隊(duì)隨之?dāng)U展到40多人。
Anthropic的大語(yǔ)言模型Claude,被認(rèn)為是OpenAI ChatGPT的最大競(jìng)爭(zhēng)對(duì)手。Claude主要被應(yīng)用在B端銷售、營(yíng)銷和客戶服務(wù)等領(lǐng)域。據(jù)了解,Anthropic目前的年化收入約為8.75億美元,主要來(lái)自B端客戶,按照600億美元估值計(jì)算,Anthropic估值/收入比約68.6倍;OpenAI的最新估值為1570億美元,預(yù)計(jì)2024年收入為37億美元,估值/收入比約為42.4倍,這意味著市場(chǎng)對(duì)Anthropic寄予了高度期待。
與背靠微軟的OpenAI相比,Anthropic背后的支持者并不遜色,這些公司都希望全力爭(zhēng)奪未來(lái)十年內(nèi)市場(chǎng)收入超過(guò)1萬(wàn)億美元的AI份額。
作為Anthropic的重要支持者,亞馬遜在去年11月追加了40億美元投資,成為Anthropic的最大投資者。同時(shí),Anthropic也承諾使用亞馬遜云科技的自研芯片Trainium和 Inferentia來(lái)訓(xùn)練和部署其人工智能模型;谷歌此前也表示向Anthropic投資20億美元,并已確認(rèn)持有該公司10%的股份,同時(shí)兩家公司之間簽訂了一份大型云計(jì)算合同。
Anthropic在去年加大了研發(fā)力度,技術(shù)和產(chǎn)品迭代加速。去年9月,Anthropic推出了Claude Enterprise,這是自其聊天機(jī)器人Claude問(wèn)世以來(lái)最大的產(chǎn)品更新,專為希望將人工智能技術(shù)集成到業(yè)務(wù)中的企業(yè)設(shè)計(jì)。早些時(shí)候,Anthropic還推出了更強(qiáng)大的AI模型Claude 3.5 Sonnet。
2024年10月,Anthropic宣布其AI智能體能夠像人類一樣使用計(jì)算機(jī)完成復(fù)雜任務(wù)。據(jù)介紹,Anthropic的“計(jì)算機(jī)使用能力”新功能使其能夠與計(jì)算機(jī)界面交互,解讀計(jì)算機(jī)屏幕上的信息、選擇按鈕、輸入文本、導(dǎo)航網(wǎng)站并通過(guò)任何軟件和實(shí)時(shí)互聯(lián)網(wǎng)瀏覽執(zhí)行任務(wù),這為實(shí)現(xiàn)更智能化的工作流程奠定了基礎(chǔ)。
國(guó)內(nèi)獨(dú)角獸“讓路”大廠
Anthropic和OpenAI的大參數(shù)模型對(duì)外發(fā)布速度已經(jīng)放緩。
Anthropic Claude系列模型從大到小,分為Opus、Sonnet和Haiku 3個(gè)版本。Claude 3發(fā)布了全部 3個(gè)版本,而 Claude 3.5 目前只對(duì)外發(fā)布了Sonnet和Haiku。同樣地,GPT-5(或GPT-4.5)也遲遲未出現(xiàn)在大眾眼前。
據(jù)了解,Opus模型和GPT-5均在內(nèi)部取得了良好的測(cè)試效果,但因效果無(wú)法與成本匹配都被內(nèi)部當(dāng)作“教師模型”使用,即在內(nèi)部扮演者提升小模型性能的角色。
對(duì)大參數(shù)模型,國(guó)外創(chuàng)企尚在堅(jiān)持,國(guó)內(nèi)獨(dú)角獸已“讓路”大廠。
1月6日晚,有消息稱零一萬(wàn)物將把預(yù)訓(xùn)練團(tuán)隊(duì)和算力資源打包出售給阿里云。隨后,第一財(cái)經(jīng)也報(bào)道,“阿里云正在洽談收購(gòu)零一萬(wàn)物的預(yù)訓(xùn)練團(tuán)隊(duì),已談好報(bào)價(jià)。”彼時(shí),阿里云未對(duì)該消息作出回應(yīng)。
零一萬(wàn)物CEO李開復(fù)很快在朋友圈辟謠稱,“不知為什么會(huì)有這樣的謠言散播,不過(guò)散的快,撤的也快。”零一萬(wàn)物公眾號(hào)在凌晨發(fā)布官方回應(yīng),否認(rèn)“阿里收購(gòu)零一萬(wàn)物”。后據(jù)界面新聞和智能涌現(xiàn)報(bào)道,相比于“零一萬(wàn)物出售預(yù)訓(xùn)練團(tuán)隊(duì)”的說(shuō)法,更接近事實(shí)的是,零一萬(wàn)物的確在進(jìn)行預(yù)訓(xùn)練團(tuán)隊(duì)及Infra團(tuán)隊(duì)的調(diào)整,部分人員以跳槽形式加入阿里旗下公司。其中預(yù)訓(xùn)練算法團(tuán)隊(duì)獲得通義團(tuán)隊(duì)offer,Infra團(tuán)隊(duì)則獲得阿⾥云offer。
1月7日,李開復(fù)回應(yīng)表示,只有大廠能夠“燒”超大模型,零一萬(wàn)物內(nèi)部愿意繼續(xù)訓(xùn)練超大參數(shù)模型的成員,加入了零一萬(wàn)物和阿里云成立的“產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”。
去年5月,在零一萬(wàn)物發(fā)布千億參數(shù)模型Yi-Large時(shí),李開復(fù)還宣布公司已經(jīng)啟動(dòng)下一代萬(wàn)億參數(shù)Yi-XLarge MoE模型訓(xùn)練。當(dāng)時(shí),智譜、MiniMax、百川、月之暗面、零一萬(wàn)物、階躍星辰在內(nèi)的“AI六小龍”也在全力追逐AGI。
困擾李開復(fù)的“預(yù)訓(xùn)練”是什么?所謂“預(yù)訓(xùn)練(pre-train)”,指對(duì)大模型的基礎(chǔ)教育,即賦予模型海量而通用的知識(shí),來(lái)決定模型性能,這是模型廠商最核心的技術(shù)壁壘。而狂堆參數(shù)的Scaling Law,目前是預(yù)訓(xùn)練的主流路徑,同時(shí)也意味著高昂且持續(xù)的算力和數(shù)據(jù)投入。
馬斯克曾估算,GPT-5的訓(xùn)練可能需要3萬(wàn)-5萬(wàn)張H100,僅芯片成本就超過(guò)7億美元(約50億元),對(duì)于尚未規(guī);膭(chuàng)業(yè)公司而言,繼續(xù)堆參數(shù)訓(xùn)練模型,要跨越高企的資金門檻。
而大模型發(fā)展至當(dāng)下階段,邊際效應(yīng)顯現(xiàn)。在接受晚點(diǎn)采訪時(shí),李開復(fù)提到,去年9、10月時(shí),公司看到Scaling Law明顯進(jìn)入 diminishing return(收益遞減)。不是說(shuō)用更多算力和數(shù)據(jù)做不出進(jìn)步,而是進(jìn)步不符合投資回報(bào),“從一張卡加到10張卡時(shí),可以達(dá)到9.5張卡的價(jià)值,但從10萬(wàn)張卡加到100萬(wàn)張卡,也許只能達(dá)到 30萬(wàn)張卡的價(jià)值”。
事實(shí)上,去年10月有報(bào)道稱,“AI六小龍”中已經(jīng)有兩家公司逐步放棄預(yù)訓(xùn)練模型,縮減了預(yù)訓(xùn)練算法團(tuán)隊(duì)人數(shù),業(yè)務(wù)重心轉(zhuǎn)向AI應(yīng)用。而目前,放棄預(yù)訓(xùn)練的公司數(shù)量還在攀升。
“當(dāng)下的技術(shù)路徑很容易同質(zhì)化和到達(dá)瓶頸,再多投入也可能無(wú)法建立有效壁壘!币晃粯I(yè)內(nèi)高管告訴時(shí)代周報(bào)記者,“去年大部分人不是這樣預(yù)期的。彼時(shí)大家認(rèn)為,領(lǐng)先的大模型會(huì)步步領(lǐng)先,AGI會(huì)很快到來(lái)。如果該預(yù)期能實(shí)現(xiàn),那的確應(yīng)該在訓(xùn)練上死砸(資金)。至于資金實(shí)力強(qiáng)如Open AI和Anthropic的這類企業(yè)想實(shí)現(xiàn)‘暴力美學(xué)’,更多要看下一代技術(shù)框架能在什么時(shí)間誕生”。
從一級(jí)市場(chǎng)資金流向來(lái)看,側(cè)重落地的細(xì)分領(lǐng)域AIGC投融資情況相對(duì)樂(lè)觀。IT桔子的數(shù)據(jù)顯示,2024年國(guó)內(nèi)人工智能行業(yè)投資事件466個(gè),投資金額634億元,相比2023年分別減少27%、9%;細(xì)分領(lǐng)域AIGC方面,國(guó)內(nèi)AIGC投資事件117個(gè),同比減少26個(gè),投資金額370億元,增加164.82億元,平均每個(gè)投資事件投資金額增加了一倍。
“從資金消耗程度來(lái)看,訓(xùn)練模型比開發(fā)推廣應(yīng)用要大!鄙鲜龈吖芟驎r(shí)代周報(bào)記者解釋稱,投流獲客和推理算力是應(yīng)用層兩大成本,不過(guò),這兩項(xiàng)成本支出的高與低,企業(yè)在策略推進(jìn)上有較大的自主權(quán)和靈活性。