7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)在上海世博中心開幕,WAIC 2024作為全球最高規(guī)格的AI產(chǎn)業(yè)盛會,今年共有500多家企業(yè)參展,匯聚了超1500件展品,大模型成為本屆大會的“重頭戲”,國內(nèi)主流大模型齊聚上海灘,既包括科大訊飛星火、百度文心一言、阿里通義、騰訊元寶、華為盤古等市場熱門產(chǎn)品,又囊括百川智能、智譜AI、Minimax、階躍星辰等新銳實力。
從今年WAIC 2024展會可以看出,大模型產(chǎn)業(yè)逐步由虛向?qū)、錨定場景、深耕行業(yè),不斷發(fā)揮賦能價值。本次是訊飛星火V4.0、訊飛曉醫(yī)、星火企業(yè)智能體平臺正式發(fā)布后的首秀,不但展示了訊飛星火V4.0在學習、生活、工作等多場景下的最新應用成果,還面向行業(yè)場景與企業(yè)客戶提供了豐富的解決方案。
國產(chǎn)算力自主可控 星火V4.0拿下“中國唯一”
去年,AIGC(生成式大模型)開啟了人工智能嶄新的時代,“生成”實際上是前端呈現(xiàn)給用戶的結果,其后端還需要經(jīng)過復雜的訓練和運算。因此在大模型的底層,算力扮演著重要角色。大模型數(shù)據(jù)訓練的時長或者創(chuàng)新的快慢,根本上取決于算力的大小以及穩(wěn)定、持續(xù)地供應。但隨著中美科技博弈的加劇,如何保障大模型算力的持續(xù)供給,防止技術封鎖與“卡脖子”的發(fā)生?
正如科大訊飛董事長劉慶峰所言,國產(chǎn)底座能力決定了企業(yè)在這條路上到底能走多遠,要以長期主義來打造我們真正自主可控的AI產(chǎn)業(yè)生態(tài)。據(jù)訊飛星火V4.0發(fā)布會介紹,訊飛星火是中國第一個基于國產(chǎn)算力訓練出來的全民開放的大模型。在國產(chǎn)化的底座下,能為行業(yè)帶來更高的話語權與安全性。
無論是從技術迭代還是數(shù)據(jù)安全等維度,建立自主可控的國產(chǎn)算力底座無疑才是“最優(yōu)解”,科大訊飛肩負“AI國家隊”的責任與使命,致力打造自主可控的AI產(chǎn)業(yè)生態(tài)。這次星火大模型V4.0最醒目的優(yōu)勢,就是基于全國首個國產(chǎn)萬卡算力集群“飛星一號”訓練,不僅算力與算法自主可控,而且代碼完全自己編寫,數(shù)據(jù)完全自己清洗,成為中國唯一全自主可控的大模型。
對標GPT-4 Turbo ,國產(chǎn)大模型打造“更懂你的AI助手”
作為人工智能國家隊,科大訊飛一直積極投身于通用人工智能技術浪潮,自去年五月正式發(fā)布訊飛星火大模型,持續(xù)對標國際最先進水平,以自主創(chuàng)新推動每一次技術躍遷。
訊飛星火V3.0已實現(xiàn)了對ChatGPT的整體超越,醫(yī)療領域更是超越GPT-4。而在更早的星火V2.0那一版本,知名科技媒體《麻省理工科技評論》就對中國四款主流大模型進行橫評,結果訊飛星火力壓群雄,被評為“最聰明”的中國大模型。
就在WAIC前夕,6月27日,全新升級的訊飛星火V4.0如約而至,科大訊飛交出訊飛星火下半年的“成績單”:8個國際權威測試集測評第一,整體超越GPT-4 Turbo。在發(fā)布會上,科大訊飛根據(jù)《通用認知智能大模型評測體系》構建測試集,結果顯示訊飛星火V4.0在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力等維度全面超越GPT-4 Turbo,代碼與多模態(tài)能力也大幅提升。而在國際組織的12項測試集對比中,訊飛星火V4.0也實現(xiàn)了8項超越,其中理解與推理能力在四大機構測試中取得“全勝”戰(zhàn)績,該能力也是大模型最基礎、卻又最核心的能力,可以幫助AI思考、分析、理解和掌握事物的本質(zhì)和運作規(guī)律,訊飛星火實力捍衛(wèi)“國產(chǎn)最強大模型”站位。
全新升級后的訊飛星火V4.0“智商”再進化,在上個月結束的中高考實測中,訊飛星火語數(shù)外各科“成績”均排名第一,被業(yè)界評為“更會做題的大模型”。全國中小學生作文競賽評委呂政嘉和河南省基礎教育教學專家?guī)斐蓡T李來明共同選取了新課標I卷高考作文、新課標II卷作文、北京高考(1)和(2)卷作文這四張試題“刁難”7款大模型,結果訊飛星火作出的《問,豈可少?》得到51.5的最高分,不僅思路清晰,而且鞭辟入里,發(fā)人深省。而在新京報對星火V4.0與GPT-4o進行的中考作文實測中,星火V4.0以36.5平均分力壓GPT-4o。
除了在底座能力上對標國際領先水平,具體到大模型的落地打法和實用性,訊飛星火還走出了一條自己獨特的發(fā)展路線,讓大模型從“通用AI助手”躍遷到“懂你的AI助手”,開啟大模型“私人定制”時代,讓大模型更好用、更實用、更具“個性化”。訊飛星火V4.0版本全新發(fā)布“個人空間”功能,用戶可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再結合人設,讓大模型生成更個性化內(nèi)容。此外,訊飛星火首批上線 14 個智能體,面向特定場景打造專屬助手。
同時訊飛星火作為業(yè)界首個支持長視頻、長文本、長語音的大模型,訊飛星火V4.0版本的長文本能力也全新升級,并針對長文檔知識問答的幻覺問題,業(yè)界首發(fā)了溯源功能,大大提升大模型工作、學習“可用性”。
軟硬一體化落地 解決大模型應用的“最后一公里”
一款大模型的產(chǎn)業(yè)價值,不僅要看算力與算法等數(shù)據(jù)參數(shù),更要看如何與垂直行業(yè)進行結合,以及產(chǎn)品在剛需場景下如何落地。同時大模型與行業(yè)結合時二次開發(fā)、對接成本盡可能要小,否則就是中看不中用的“繡花枕頭”?拼笥嶏w采取的策略是,用更小的算力、更高的效率,來打造企業(yè)專屬大模型。并通過軟硬一體化協(xié)同,讓大模型由虛向?qū),從落地深耕邁向落地“生根”。
具體來看,科大訊飛基于云邊端一體化和軟硬件一體化,在智能家電、智能汽車、運營商、機器人等行業(yè)場景實現(xiàn)全面賦能。比如科大訊飛與奇瑞聯(lián)合打造的星紀元ET智慧座艙,就通過星火大模型作為智慧中臺,打通了心率傳感器等內(nèi)外部設備,可以對司機進行心率監(jiān)測提醒,確保長途行車安全。還有業(yè)界首發(fā)的星火智能批閱機,看似打印機的外表,卻擁有自動批改試卷的“魔力”,讓老師減負增效,將更多精力投入到學生的五育教育上。
面向更多行業(yè)場景,訊飛還以企業(yè)智能體的方式,面向特定行業(yè)、特定場景打造專屬AI助手,訊飛星火V4.0發(fā)布會現(xiàn)場正式發(fā)布星火企業(yè)智能體平臺。據(jù)了解,圍繞搭建智能體的三大關鍵能力,當前星火企業(yè)智能體平臺已覆蓋400+AI原子能力,集成90+外部信源,打通100+內(nèi)部IT系統(tǒng),可供企業(yè)結合業(yè)務場景快速構建可落地的智能體應用。平臺還圍繞生產(chǎn)域、科創(chuàng)域、辦公域、管理域上線32個企業(yè)智能體,供企業(yè)即插即用。星火企業(yè)智能體平臺打通了場景價值落地的最后一公里,也幫助企業(yè)打通了大模型應用的最后一公里。
正是憑借真正的實用與好用,使得星火深受企業(yè)歡迎。根據(jù)數(shù)智前線披露的2024上半年大模型招投標情況,科大訊飛成為了外部訂單數(shù)量最多的“標王”,央國企為代表的行業(yè)客戶成為星火最大客群。在訊飛星火構建的大模型算力底座下,企業(yè)可以根據(jù)自身業(yè)務需求去匹配不同的算力,用最小的算力實現(xiàn)更高的效率,也就是“殺雞焉用宰牛刀”的邏輯,最終實現(xiàn)效率最大化與效益最優(yōu)化。
再回到本屆WAIC,今年大模型參展數(shù)量多達百款,多家廠商帶來了產(chǎn)品和技術“首秀”,再次讓“百模大戰(zhàn)”得以具象化,在現(xiàn)場你會感受到大模型賽道的蓬勃生機,同時也暗藏優(yōu)勝劣汰的殘酷競爭。
對于國內(nèi)的大模型廠商來說,理性看待差距,堅持長期主義精神,是決勝關鍵。在國際人工智能拉力賽中,國產(chǎn)大模型在迎頭追趕的同時,對方也在快速迭代,只有正視差距,才有機會趕超。在訊飛星火V4.0發(fā)布會上,科大訊飛董事長劉慶峰說道:“我們既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到產(chǎn)業(yè)生態(tài)、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI產(chǎn)業(yè)生態(tài)!
劉慶峰坦言,訊飛星火V4.0已經(jīng)實現(xiàn)了GPT-4 Turbo的對標,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學這些能力上都已經(jīng)實現(xiàn)超越,但在代碼和多模態(tài)能力上還有差距。代碼是連接虛擬世界和物理世界的橋梁,這個能力是中國大模型一定要搶占的核心能力。在訊飛星火V4.0發(fā)布會上,科大訊飛也介紹了代碼領域的最新進展:持續(xù)迭代的代碼智能體iFlyCode集成了代碼生成助手、架構設計助手、代碼問答助手、測試助手、數(shù)據(jù)庫優(yōu)化助手、代碼審核助手等六大場景智能體,將采納率由30%提升至52%,大幅度提升企業(yè)智能體的實用性。據(jù)了解,代碼智能體已在銀行、家電等行業(yè)在內(nèi)的100多家企業(yè)以“AI程序員”的身份上崗。以交通銀行為例,基于星火大模型能力的產(chǎn)品iFlyCode覆蓋6000+研發(fā)人員,代碼采納率達38%,工作效率顯著提升。
劉慶峰表示,代碼能力是科大訊飛非常關注的能力之一,因為它涉及未來的產(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,而ChatGPT去年2月份通過谷歌二級程序員測試,當時的GPT-3.5用這個測試集只獲得了60多分,GPT-4 Turbo今年1月份測試大概在80分,現(xiàn)在到86分,也在快速迭代和進步?拼笥嶏w預計在今年8月份,訊飛星火將達到86分以上的水平。
隨著訊飛星火V4.0重磅發(fā)布以及在WAIC上的升級后“首秀”,可以窺見訊飛星火作為國產(chǎn)大模型代表,已在技術底座、商業(yè)化落地等方面彰顯出引領性。未來,在以商業(yè)落地為重頭戲的后半場,隨著AI助手的持續(xù)打造以及一系列的落地動作,無疑都會助其再次占領行業(yè)競爭的先機。