6月14日,2024北京智源大會在京舉行。全球領(lǐng)先真機實驗成功率突破95%的泛化抓取技術(shù)、全球首個端到端基于視頻的多模態(tài)具身導(dǎo)航大模型NaVid、全球首個智能心臟超聲機器人等多項人工智能領(lǐng)域的創(chuàng)新成果集結(jié)亮相,引發(fā)業(yè)內(nèi)關(guān)注。
開幕式上,北京智源人工智能研究院院長王仲遠作2024智源進展報告,介紹了智源研究院在語言、多模態(tài)、具身、生物計算大模型領(lǐng)域的前沿探索和研究進展,以及大模型全棧開源技術(shù)基座的迭代升級與版圖布局。
王仲遠介紹,現(xiàn)階段語言大模型已具備一定的理解和推理能力,但這并不是讓人工智能感知、理解物理世界的終極技術(shù)路線。未來大模型將以數(shù)字智能體的形態(tài)與智能硬件融合,以具身智能的形態(tài)從數(shù)字世界進入物理世界。
中關(guān)村科學(xué)城管委會副主任、海淀區(qū)副區(qū)長唐超表示,海淀區(qū)擁有一大批頂尖科學(xué)家和產(chǎn)業(yè)領(lǐng)軍人才,在產(chǎn)業(yè)發(fā)展方面,已基本形成芯片、框架、大模型、數(shù)據(jù)技術(shù)與處理服務(wù)等全產(chǎn)業(yè)鏈部署,集聚企業(yè)超千家,占全市的2/3、全國的1/6。海淀區(qū)將規(guī)劃全球首個人工智能街區(qū),以五道口和大鐘寺為先導(dǎo)區(qū),規(guī)劃53平方公里建設(shè)人工智能創(chuàng)新策源地和產(chǎn)業(yè)高地,強化產(chǎn)學(xué)研用一體化的協(xié)同創(chuàng)新。
在零一萬物、創(chuàng)新工場董事長李開復(fù)與清華大學(xué)智能產(chǎn)業(yè)研究院院長、智源學(xué)術(shù)顧問委員張亞勤的對話中,張亞勤歸納了大模型的“三個做對了”和“三個需改進”。他說,規(guī)模定律、“Token-Based”(“基于詞元的機制”)、通用性是現(xiàn)階段大模型的正確選擇。與此同時,當(dāng)前大模型也面臨效率低下、未能真正理解物理世界、邊界問題的挑戰(zhàn),有待進一步解決。
人工智能技術(shù)正在加速進步,產(chǎn)業(yè)進入爆發(fā)期。百度首席技術(shù)官王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。從人工智能技術(shù)發(fā)展趨勢來看,未來幾年,規(guī)模定律依然有效,大語言模型仍有很大提升空間,多模態(tài)大模型會越來越好用,智能體技術(shù)逐漸成熟從而加速應(yīng)用爆發(fā)。
北京智源大會由北京智源人工智能研究院主辦,以“全球視野、思想碰撞、前沿引領(lǐng)”為特色,匯聚海內(nèi)外研究者分享研究成果、探尋前沿知識、交流實踐經(jīng)驗。自2019年10月首度亮相至今,大會已成功舉辦5屆,成為國際人工智能交流的一張名片。