首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

李開(kāi)復(fù)披露大模型創(chuàng)業(yè)進(jìn)展:開(kāi)源、To C、超級(jí)應(yīng)用方法論

2023年11月7日 07:32  第一財(cái)經(jīng)  

11月6日,零一萬(wàn)物創(chuàng)始人及CEO李開(kāi)復(fù)帶隊(duì)創(chuàng)辦的AI 2.0公司零一萬(wàn)物,正式發(fā)布首款開(kāi)源預(yù)訓(xùn)練大模型 Yi-34B。

截至目前,國(guó)內(nèi)外大模型開(kāi)源平臺(tái)此起彼伏,如Meta大型語(yǔ)言模型LLama 2,阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。

對(duì)于大模型開(kāi)源平臺(tái)之間的同質(zhì)化競(jìng)爭(zhēng)問(wèn)題,李開(kāi)復(fù)對(duì)第一財(cái)經(jīng)記者表示,有競(jìng)爭(zhēng)才會(huì)有進(jìn)步,如Hugging Face這樣的開(kāi)源社區(qū),作為獨(dú)立第三方進(jìn)行測(cè)試,其測(cè)試結(jié)果會(huì)讓外界產(chǎn)生自然的關(guān)注。但如果只是千家、萬(wàn)家公司每家都做一個(gè)沒(méi)什么價(jià)值的開(kāi)源模型,那這個(gè)社區(qū)就亂了。

通過(guò)競(jìng)爭(zhēng)可以進(jìn)行開(kāi)放式的、公平的對(duì)比,讓行業(yè)知道哪些開(kāi)源模型是最好的。因此,李開(kāi)復(fù)認(rèn)為開(kāi)源模型的發(fā)布就是一個(gè)驗(yàn)證開(kāi)源社區(qū)與開(kāi)源方法論的嘗試。

Hugging Face作為AI領(lǐng)域的Github,提供大量開(kāi)源模型與工具。根據(jù) Hugging Face 英文開(kāi)源社區(qū)平臺(tái)和C-Eval 中文評(píng)測(cè)的最新榜單,Yi-34B預(yù)訓(xùn)練模型取得多項(xiàng)SOTA國(guó)際最佳性能指標(biāo)認(rèn)可。

此次零一萬(wàn)物開(kāi)源發(fā)布的Yi系列模型,包含34B和6B兩個(gè)版本。其中開(kāi)源的Yi-34B模型將發(fā)布全球最長(zhǎng)、可支持200K 超長(zhǎng)上下文窗口(context window)版本,可以處理約40萬(wàn)漢字超長(zhǎng)文本輸入。此前OpenAI的GPT-4上下文窗口只有32K,文字處理量約2.5萬(wàn)字。今年3月,硅谷 AI 2.0 創(chuàng)業(yè)公司Anthropic的Claude2-100K 將上下文窗口擴(kuò)展到了100K規(guī)模。

對(duì)于優(yōu)先選擇34B訓(xùn)練及開(kāi)源的原因,李開(kāi)復(fù)表示,34B是一個(gè)黃金尺寸,雖然6B也可以做出在部分垂直領(lǐng)域應(yīng)用的模型,但模型越大越好,當(dāng)然也伴隨著推理成本與訓(xùn)練成本增加所帶來(lái)的GPU資源耗費(fèi)。而34B作為一個(gè)黃金尺寸,不會(huì)小到?jīng)]有涌現(xiàn)或涌現(xiàn)不夠,又不會(huì)過(guò)大,允許高效率的單卡推理,且該類推理并不需要H或A級(jí)別顯卡,甚至RTX4090或3090便足夠。既滿足精度要求,實(shí)現(xiàn)訓(xùn)練成本友好,又能達(dá)到涌現(xiàn)門檻,屬于非常多商業(yè)應(yīng)用均適配的程度。

對(duì)于大模型的具體落地商業(yè)化方向,李開(kāi)復(fù)明確其為To C領(lǐng)域,他認(rèn)為AI2.0時(shí)代最大的商機(jī)是創(chuàng)造超級(jí)應(yīng)用 Super APP。李開(kāi)復(fù)將超級(jí)應(yīng)用定位為大部分人需要花大部分時(shí)間、每天必須用它才能得到價(jià)值體現(xiàn)或?qū)W到新技術(shù)的產(chǎn)品。同時(shí)如果將該應(yīng)用內(nèi)的大模型拿掉了,整個(gè)應(yīng)用就不成立。

例如李開(kāi)復(fù)雖然認(rèn)為微軟Copilot是很有價(jià)值的產(chǎn)品,但未來(lái)消費(fèi)者所使用的office,一定不是在今天的office基礎(chǔ)上去堆積功能,而是一個(gè)從零做起的東西。也就是說(shuō)內(nèi)容的創(chuàng)造不是由人來(lái)創(chuàng)造,再由AI來(lái)幫一點(diǎn)小忙,而應(yīng)主要是由AI來(lái)創(chuàng)造,人來(lái)幫忙,這才是王道。

當(dāng)然,李開(kāi)復(fù)補(bǔ)充稱,零一現(xiàn)階段不可能自己便將所有的超級(jí)應(yīng)用都做了,因?yàn)閼?yīng)用一定是一個(gè)簡(jiǎn)單的開(kāi)始,再通過(guò)精益創(chuàng)業(yè)的方法不斷迭代,就像抖音和微信的第一個(gè)版本并不是超級(jí)應(yīng)用,而是捕捉到用戶的需求,同時(shí)通過(guò)新平臺(tái)的技術(shù)精髓來(lái)做一個(gè)大家都喜歡的簡(jiǎn)單應(yīng)用,然后不斷根據(jù)用戶反饋進(jìn)行調(diào)整,最終迭代成超級(jí)應(yīng)用,這是零一萬(wàn)物做超級(jí)應(yīng)用的方法論。

目前零一所發(fā)布版本以文字為主,但多模態(tài)仍是努力方向。李開(kāi)復(fù)表示,零一萬(wàn)物目前在多模態(tài)方面已有超過(guò)十個(gè)人的團(tuán)隊(duì),目前美國(guó)在多模態(tài)領(lǐng)域已進(jìn)入白熱化競(jìng)爭(zhēng)狀態(tài),如DALL-E3、GPT-4V,還有即將推出的谷歌 Gemini,都將多模態(tài)作為兩家公司最大的競(jìng)爭(zhēng)關(guān)注領(lǐng)域,零一肯定也要參與這一競(jìng)賽。

至于大模型落地應(yīng)用之后的商業(yè)化問(wèn)題,在AI1.0時(shí)代投過(guò)許多AI創(chuàng)業(yè)公司的李開(kāi)復(fù)總結(jié)認(rèn)為,AI1.0的公司所面臨的挑戰(zhàn),一是收入沒(méi)有做好,二是收入沒(méi)做到可持續(xù),許多AI1.0時(shí)代的收入問(wèn)題做不好的公司很早就被淘汰了。他仍舊以抖音與微信舉例稱,兩款產(chǎn)品規(guī)模化與利潤(rùn)率以及收入質(zhì)量都高于大部分做商業(yè)、做系統(tǒng)集成、做To B業(yè)務(wù)的公司,所以零一堅(jiān)定不移走消費(fèi)者端To C路徑。

目前零一萬(wàn)物團(tuán)隊(duì)成員主要來(lái)自Google、微軟、阿里巴巴、百度、字節(jié)跳動(dòng)、騰訊等國(guó)內(nèi)外企業(yè),零一萬(wàn)物技術(shù)副總裁及AI Alignment負(fù)責(zé)人是 Google Bard/Assistant 早期核心成員,主導(dǎo)參與了從 Bert、LaMDA 到大模型在多輪對(duì)話、個(gè)人助理、AI Agent 等多個(gè)方向的研究和工程落地;首席架構(gòu)師曾在Google Brain與Jeff Dean、Samy Bengio等合作,為TensorFlow的核心創(chuàng)始成員之一。

接下來(lái),零一萬(wàn)物將基于Yi 基座模型,快節(jié)奏開(kāi)源發(fā)布一系列量化版本、對(duì)話模型、數(shù)學(xué)模型、代碼模型和多模態(tài)模型等,邀請(qǐng)開(kāi)發(fā)者加入,培育新型“AI-first”創(chuàng)新生態(tài)體系。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像