6月14日,2024北京智源大會在京舉行。百度首席技術(shù)官王海峰受邀出席并作主旨演講,對人工智能技術(shù)發(fā)展作出最新判斷。王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。從人工智能技術(shù)發(fā)展趨勢來看,未來幾年,規(guī)模定律依然有效,大語言模型仍有很大提升空間,多模態(tài)大模型會越來越好用,智能體技術(shù)逐漸成熟加速應(yīng)用爆發(fā)等。
通用人工智能新視角:技術(shù)通用、能力全面
人工智能是模擬、延伸和擴展人的智能。王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。
人工智能技術(shù)歷經(jīng)幾十年發(fā)展,從早期的人工撰寫規(guī)則,到后來統(tǒng)計機器學(xué)習(xí),可以自動從數(shù)據(jù)中學(xué)習(xí),但解決不同場景的問題需要不同的算法,演進到深度學(xué)習(xí)時代,算法的通用性大大加強,深度神經(jīng)網(wǎng)絡(luò)一套架構(gòu)和技術(shù)可以解決各種問題,再到大模型時代,除了算法,模型也變得更加通用和統(tǒng)一。
在技術(shù)的通用性方面,大模型在解決不同任務(wù)、語言、模態(tài)、場景的通用性都變得越來越好。以自然語言處理為例,之前有分詞、句法分析、語義匹配、機器翻譯、問答、對話等等很多個子方向,現(xiàn)在一個大語言模型就可以解決絕大多數(shù)任務(wù);語言方面,大模型既可以解決單語言的問題,也可以跨語言,不僅學(xué)習(xí)了人類的自然語言,也學(xué)習(xí)了人工定義的形式語言,架起了從思考到執(zhí)行的橋梁;同時,大模型也可以實現(xiàn)多模態(tài)的統(tǒng)一建模,廣泛賦能各行各業(yè)應(yīng)用,等等?傮w上,人工智能技術(shù)的通用性越來越強。
在能力的全面性方面,理解、生成、邏輯、記憶是人工智能的四項基礎(chǔ)能力,其他各項人工智能的典型能力,無論是創(chuàng)作、解題、代碼,還是規(guī)劃、決策等等,基本上都是這四項基礎(chǔ)能力的綜合運用。這四項能力越強,越接近通用人工智能。
文心大模型技術(shù)解讀
文心一言是百度自主研發(fā)的新一代知識增強大語言模型,基于更強平臺、更優(yōu)數(shù)據(jù)和更好算法訓(xùn)練,從萬億數(shù)據(jù)和千億知識中融合學(xué)習(xí),突破知識內(nèi)化與外用技術(shù),具備知識增強、檢索增強和對話增強的核心技術(shù),在基礎(chǔ)模型訓(xùn)練、數(shù)據(jù)構(gòu)建與優(yōu)化、對齊技術(shù)創(chuàng)新、提示優(yōu)化、智能體機制等方面進一步創(chuàng)新突破。
智能體是在基礎(chǔ)模型上,進一步進行思考增強訓(xùn)練,包括思考過程的有監(jiān)督精調(diào)、行為決策的偏好學(xué)習(xí)、結(jié)果反思的增強學(xué)習(xí),進而得到思考模型。智能體的思考模型可以調(diào)用工具來完成任務(wù)。代碼智能體首先通過思考模型理解用戶需求,經(jīng)過思考,把完成任務(wù)的指令和相關(guān)信息整合成提示,輸入給代碼解釋器;然后,代碼解釋器根據(jù)提示,把自然語言表達的用戶需求翻譯成代碼并執(zhí)行,相當(dāng)于“用模型寫代碼讓復(fù)雜的任務(wù)變簡單”。
公開資料顯示,百度自2010年起開始全面布局人工智能,2019年3月推出文心大模型1.0,持續(xù)迭代升級, 去年10月發(fā)布文心大模型4.0。文心大模型的持續(xù)快速進化,得益于百度在芯片、框架、模型和應(yīng)用上的全棧布局,尤其是飛槳深度學(xué)習(xí) 平臺和文心的聯(lián)合優(yōu)化。文心大模型的周均訓(xùn)練有效率達到98.8%,相比一年前文心一言發(fā)布時,訓(xùn)練效率提升到當(dāng)時的5.1倍,推理105倍。
人工智能進入工業(yè)大生產(chǎn)
對于人工智能技術(shù)的進一步發(fā)展,王海峰強調(diào),規(guī)模定律未來若干年仍將有效;大語言模型現(xiàn)在能力很強,還在快速進步,未來仍有很大提升空間;多模態(tài)大模型會越來越好用;智能體技術(shù)會越來越成熟。人工智能技術(shù)正在加速進步,產(chǎn)業(yè)進入爆發(fā)期。
王海峰認為,縱觀人類經(jīng)歷的前三次工業(yè)革命,其核心驅(qū)動力量機械技術(shù)、電氣技術(shù)和信息技術(shù)都有很強的通用性,會應(yīng)用于各行各業(yè),當(dāng)它們呈現(xiàn)出標(biāo)準(zhǔn)化、自動化和模塊化的工業(yè)大生產(chǎn)特征,核心技術(shù)就進入工業(yè)大生產(chǎn)階段。人工智能基于深度學(xué)習(xí)及大模型工程平臺,包括算法、數(shù)據(jù)、模型、工具等,也已經(jīng)具備了非常強的通用性,并且具備了標(biāo)準(zhǔn)化、模塊化和自動化的特征,所以深度學(xué)習(xí)及大模型工程平臺推動人工智能進入到了工業(yè)大生產(chǎn)階段,通用人工智能將加速到來。