每經(jīng)記者 可楊 每經(jīng)編輯 董興生
開(kāi)源與閉源之爭(zhēng)延續(xù)到大模型時(shí)代。在尋找“新大陸(16.880, 0.04, 0.24%)”的路上,開(kāi)源與閉源的辯論,就像是一場(chǎng)關(guān)于AI未來(lái)的“航海策略”討論。
開(kāi)源一派認(rèn)為,開(kāi)源能夠促進(jìn)全球科研人員和開(kāi)發(fā)者的協(xié)作,加速AI技術(shù)的迭代與創(chuàng)新。同時(shí),開(kāi)源讓更多人參與到模型的改進(jìn)和優(yōu)化中,通過(guò)集體智慧解決復(fù)雜的技術(shù)難題。
閉源的倡導(dǎo)者則看重其在商業(yè)化、技術(shù)保護(hù)和產(chǎn)品差異化方面的優(yōu)勢(shì)。閉源模型使得企業(yè)能夠控制產(chǎn)品的開(kāi)發(fā)節(jié)奏和市場(chǎng)策略,保護(hù)其商業(yè)利益。此外,閉源也有助于企業(yè)維護(hù)其技術(shù)優(yōu)勢(shì),避免競(jìng)爭(zhēng)對(duì)手模仿或超越。
Llama 3的發(fā)布讓開(kāi)源大模型在與閉源的競(jìng)爭(zhēng)中再度“扳回一城”。從測(cè)試結(jié)果來(lái)看,Llama 3的成績(jī)大幅超越了Llama 2,也勝過(guò)了GPT-3.5。
在AI這場(chǎng)沒(méi)有硝煙的“航海競(jìng)賽”中,大模型已然成為眼前的燈塔。未知的是,這座燈塔究竟是向所有航海者開(kāi)放其光芒,還是僅為特定的船只照亮前行的航道。
開(kāi)源在開(kāi)發(fā)者和研究人員中極受歡迎
Meta正沿著開(kāi)源路徑繼續(xù)前進(jìn)。
近日,Meta推出開(kāi)源大模型Llama 3系列,發(fā)布8B和70B兩個(gè)版本。Meta創(chuàng)始人兼首席執(zhí)行官扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手現(xiàn)在已經(jīng)覆蓋Instagram、WhatsApp、Facebook等全系應(yīng)用,并單獨(dú)開(kāi)啟了網(wǎng)站。
與Llama 2相比,Llama 3進(jìn)行了幾項(xiàng)關(guān)鍵的改進(jìn):使用具128K token(輸入數(shù)據(jù)的最小單元)詞匯表的tokenizer(編譯器),可以更有效地編碼語(yǔ)言,從而顯著提升模型性能;在8B和70B模型中都采用分組查詢(xún)注意力(GQA),以提高Llama 3模型的推理效率;在8192個(gè)token的序列上訓(xùn)練模型,使用掩碼來(lái)確保自注意力(Self-Attention)不會(huì)跨越文檔邊界。
據(jù)Meta介紹,Llama 3已經(jīng)在多種行業(yè)基準(zhǔn)測(cè)試上展現(xiàn)了最先進(jìn)的性能,提供了包括改進(jìn)的推理能力在內(nèi)的新功能,是目前市場(chǎng)上最好的開(kāi)源大模型。
此外,Llama 3發(fā)布后,微軟Azure、谷歌云、百度智能云等陸續(xù)宣布其平臺(tái)上線Llama 3。百度方面此前對(duì)《每日經(jīng)濟(jì)新聞》記者表示,百度智能云千帆大模型平臺(tái)在國(guó)內(nèi)首家推出針對(duì)Llama 3全系列版本的訓(xùn)練推理方案,便于開(kāi)發(fā)者進(jìn)行再訓(xùn)練,搭建專(zhuān)屬大模型。
工業(yè)和信息化部工業(yè)文化發(fā)展中心AI應(yīng)用工作組執(zhí)行組長(zhǎng)、行行AI董事長(zhǎng)李明順在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,Meta的Llama 3發(fā)布可能會(huì)帶來(lái)更多AI應(yīng)用落地機(jī)會(huì)和場(chǎng)景,它通過(guò)提供更大詞匯量的Token詞典、更長(zhǎng)的輸入上下文長(zhǎng)度以及優(yōu)化的模型結(jié)構(gòu),增強(qiáng)了模型的編碼效率和推理效率!艾F(xiàn)在,比起Llama 2,Llama 3在代碼能力和邏輯推理能力上有顯著提升,這可能會(huì)促進(jìn)相關(guān)AI應(yīng)用的性能(提升),尤其是在需要復(fù)雜邏輯和代碼理解的場(chǎng)景中去落地!
OpenAI在GPT-2之后調(diào)轉(zhuǎn)船頭走向閉源,Meta則成為開(kāi)源界的引領(lǐng)者之一。
從2020年發(fā)布GPT-3,到引發(fā)轟動(dòng)的GPT-3.5,以及2023年3月發(fā)布的GPT-4,都是閉源模型。此前,馬斯克起訴OpenAI時(shí)曾直言:“如果OpenAI改名為ClosedAI,我就撤銷(xiāo)訴訟!
李明順認(rèn)為,OpenAI的轉(zhuǎn)變可能與其商業(yè)戰(zhàn)略和市場(chǎng)定位有關(guān)!俺跗陂_(kāi)源有助于快速吸引關(guān)注和社區(qū)參與,但隨著公司的發(fā)展,我估計(jì)阿爾特(10.770, -0.15, -1.37%)曼(Sam Altman)的野心和商業(yè)夢(mèng)想越來(lái)越膨脹了,閉源可以更好地讓它融資,包括和微軟合作,保護(hù)領(lǐng)先的技術(shù)優(yōu)勢(shì)!彼硎,從OpenAI的轉(zhuǎn)變中可以看出,開(kāi)源與閉源的選擇并非固定不變,而是需要根據(jù)公司戰(zhàn)略目標(biāo)、市場(chǎng)環(huán)境和產(chǎn)品發(fā)展階段靈活調(diào)整。天下沒(méi)什么事情是絕對(duì)的,很多開(kāi)源公司也是拿著次優(yōu)代碼開(kāi)源,獨(dú)家秘方閉源。
在追逐AGI(通用人工智能)這顆明珠的道路上,迄今為止,Meta依舊持續(xù)沿著開(kāi)源的路徑前行。
2024年初,扎克伯格在Meta第四季度及2023全年財(cái)報(bào)電話(huà)會(huì)議上表示:“長(zhǎng)期以來(lái),我們的策略是構(gòu)建并開(kāi)放源代碼通用基礎(chǔ)設(shè)施,同時(shí)保留我們的具體產(chǎn)品實(shí)現(xiàn)為專(zhuān)有技術(shù)!
他認(rèn)為,開(kāi)源帶來(lái)了幾個(gè)戰(zhàn)略好處。首先,開(kāi)源軟件通常更加安全可靠,并且因?yàn)樯鐓^(qū)的持續(xù)反饋、審查和開(kāi)發(fā),更加高效。其次,開(kāi)源軟件經(jīng)常成為行業(yè)標(biāo)準(zhǔn),“當(dāng)企業(yè)開(kāi)始基于我們的技術(shù)棧建立標(biāo)準(zhǔn)時(shí),這使得將創(chuàng)新融入我們的產(chǎn)品變得更加容易。這種微妙的優(yōu)勢(shì),能夠迅速學(xué)習(xí)和改進(jìn),是巨大的競(jìng)爭(zhēng)優(yōu)勢(shì),而成為行業(yè)標(biāo)準(zhǔn)正是這一能力的關(guān)鍵”。第三,開(kāi)源在開(kāi)發(fā)者和研究人員中極受歡迎。
開(kāi)源與閉源并不矛盾
開(kāi)源還是閉源,也許是全球人工智能信徒長(zhǎng)久的辯題。在Llama 3誕生前幾天,國(guó)內(nèi)同樣在進(jìn)行一場(chǎng)“辯論”。
4月11日,百度董事長(zhǎng)兼首席執(zhí)行官李彥宏在其內(nèi)部講話(huà)中直言,大模型開(kāi)源的意義不大,閉源模型在能力上會(huì)持續(xù)領(lǐng)先,而不是一時(shí)領(lǐng)先,做模型的創(chuàng)業(yè)公司既做模型又做應(yīng)用的“雙輪驅(qū)動(dòng)”不是一個(gè)好的模式。在一周后的Create 2024百度AI開(kāi)發(fā)者大會(huì)上,李彥宏再度提到,大家以前用開(kāi)源覺(jué)得開(kāi)源便宜,其實(shí)在大模型場(chǎng)景下,開(kāi)源是最貴的,所以開(kāi)源模型會(huì)越來(lái)越落后。
360公司創(chuàng)始人周鴻祎則持不同的觀點(diǎn)。他表示:“網(wǎng)上有些名人胡說(shuō)八道,大家也別被他們忽悠,說(shuō)開(kāi)源不如閉源好。一句話(huà),今天沒(méi)有開(kāi)源就沒(méi)有Linux(操作系統(tǒng)內(nèi)核),沒(méi)有Linux就沒(méi)有互聯(lián)網(wǎng),就連說(shuō)這話(huà)的公司自己都借助了開(kāi)源的力量才成長(zhǎng)到今天!
這段發(fā)言被解讀為對(duì)李彥宏觀點(diǎn)的回懟,周鴻祎隨后澄清道:“我一直是開(kāi)源的信徒,但是我說(shuō)開(kāi)源好,是(4月)13日在哈佛講的,李廠長(zhǎng)(指李彥宏)說(shuō)閉源好,是(4月)16日在北京講的!
生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝站在閉源的一邊。在4月18日舉行的“2024中國(guó)生成式AI大會(huì)”上,唐家渝表示:“在我們看來(lái),開(kāi)源、閉源都有各自可以做的商業(yè)生態(tài),但是從模型能力的提升來(lái)說(shuō),或者持續(xù)走到前列來(lái)說(shuō),閉源還是會(huì)走到開(kāi)源的前面。”
昆侖萬(wàn)維(37.520, 0.38, 1.02%)董事長(zhǎng)方漢的觀點(diǎn)是,開(kāi)源模型與閉源模型之間的差距正在不斷縮小。4月16日,方漢在接受《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體采訪時(shí)表示,閉源模型的確是第一,但是開(kāi)源大模型在2023年到今年這一年間,從落后兩年以上,已經(jīng)進(jìn)化到落后4~6個(gè)月以上。
此外,方漢認(rèn)為,在應(yīng)用側(cè),閉源對(duì)于產(chǎn)品特性和長(zhǎng)尾需求的滿(mǎn)足都落后于開(kāi)源大模型,開(kāi)源大模型是一種生態(tài)構(gòu)建器,更利于滿(mǎn)足用戶(hù)的長(zhǎng)尾需求。開(kāi)源大模型和閉源大模型是一個(gè)生態(tài)的組成部分,不是誰(shuí)壓倒誰(shuí),大家都有自己的生存空間,也都有更好的明天。
不過(guò),從商業(yè)化上來(lái)講,閉源和開(kāi)源也許并不矛盾。啟明創(chuàng)投合伙人周志峰就認(rèn)為,開(kāi)源閉源在過(guò)去幾個(gè)大浪潮當(dāng)中沒(méi)有很大的沖突,不太理解為什么很多人把閉源、開(kāi)源在AI時(shí)代看成對(duì)立的。
李明順的觀點(diǎn)則是,在當(dāng)前強(qiáng)應(yīng)用導(dǎo)向的背景下,開(kāi)源模式具有顯著優(yōu)勢(shì),能夠吸引全球范圍內(nèi)最廣泛的人參與,從而使其創(chuàng)新性保持在較高水平。
相較之下,盡管一些閉源大模型在技術(shù)上具有領(lǐng)先地位,但其成本太高。不過(guò)他也強(qiáng)調(diào),開(kāi)源與閉源在不同公司和應(yīng)用場(chǎng)景中可以相互轉(zhuǎn)換。一些基于開(kāi)源的產(chǎn)品在發(fā)掘到獨(dú)特優(yōu)勢(shì)后,可能會(huì)通過(guò)閉源策略建立競(jìng)爭(zhēng)壁壘。同時(shí),一些閉源公司也會(huì)不斷將其部分產(chǎn)品開(kāi)源。這兩個(gè)應(yīng)該是共存的,未來(lái)開(kāi)源可能用戶(hù)量級(jí)上更大,但是行業(yè)內(nèi),商業(yè)化做得比較好的公司,往往還是閉源的多一點(diǎn)。
在開(kāi)源與閉源的辯論中,也許答案并非非此即彼。AI的未來(lái)可能既不是完全開(kāi)放的“自由港”,也不是徹底封閉的“孤島”,而是一個(gè)既包含開(kāi)放協(xié)作也包含封閉競(jìng)爭(zhēng)的混合生態(tài)。在這個(gè)生態(tài)系統(tǒng)中,開(kāi)放與封閉不是對(duì)立的兩極,而是一枚硬幣的兩面。