12 月 28 日消息,Canalys 今天 “AI 手機”進行了分析,認為最近出現(xiàn)的大語言模型(LLM)驅(qū)動了相關手機行業(yè),預計 2024 年全球?qū)⒊鲐?nbsp;6000 萬部 AI 手機,超過同年“AI PC”的 5300 萬臺出貨量。
IT之家從報告中得知,Canalys 認為“AI 手機”是一個“廣泛且模糊”的概念,不過相對于“AI PC”概念,“AI Phone”實際上更貼近消費者,當下蘋果、華為、vivo、小米等廠商已經(jīng)在自家手機中大量應用設備端 AI,從而提升成像質(zhì)量、電池壽命和打字體驗。
不過 Canalys 同時提到,在生成式 AI 模型爆發(fā)的當下相關手機還應“整合 AI 模型”,具體應該滿足以下標準:
最低要求
SoC 應包含能夠加速 AI 任務的專用單元。(例如,高通 Hexagon、聯(lián)發(fā)科 APU、Google TPU)
智能手機應能夠在端側(cè)運行 LLM(例如,Google Gemini、三星 Gauss)和其他生成式 AI 模型(例如,Stable Diffusion)。
端側(cè) LLM 的推理性能應快于成人的平均閱讀速度,相當于 10 token / s。(基于 LLaMA-2 7B, 或同等水平)
使用端側(cè) AI 生成圖像的時間應小于 2 秒。(基于 Stable Diffusion v1.5,20 步,512*512 分辨率,或同等水平)
可選要求
設備出廠時應預裝 LLM(例如,Google Gemini, 三星 Gauss)。
為第三方開發(fā)者提供生成式 AI 相關的 API 和 SDK,以方便開發(fā)者將生成式 AI 驅(qū)動的功能集成于端側(cè)移動應用中。
在設備上預裝由廠商第一方開發(fā)的生成式 AI 功能,并且保證其可以在端側(cè)高效運行。
Canalys 表示,當前智能手機擁有“最龐大的裝機量”,到今年年底全球手機總量預計將達到 50 億部,雖然其中預計只有 5% 為 AI 手機,但已經(jīng)足夠加速 AI 應用的普及與個性化,并有助于開發(fā)者社區(qū)創(chuàng)造多樣化的第三方 AI 應用。
Canalys 同時聲稱,根據(jù)對早期“AI 手機”的觀察,相關手機的功能性主要包含以下十點:
硬件優(yōu)化:AI 可以根據(jù)用戶行為或場景為操作系統(tǒng)提供幫助以優(yōu)化電池壽命或相機成像。
跨設備自動化:通過利用智能手機傳感器獲得的數(shù)據(jù),AI 將能夠理解使用場景,并生成跨設備自動化任務。
圖像和視頻編輯:除了消除物體和智能摳像之外,用戶還可以利用 AI 驅(qū)動的功能獲得更心儀的照片以及更好的視頻編輯體驗,如自動顏色校正、背景替換和藝術風格化轉(zhuǎn)換等。
社交媒體內(nèi)容創(chuàng)作:AI 可以根據(jù)視頻或照片撰寫帖文,幫助用戶維持社交活躍度。
自動電話接聽:AI 將根據(jù)用戶的語音語調(diào)生成更自然的聲音用于自動電話接聽。AI 能夠更好地理解撥打方的意思,提高對話質(zhì)量。
自動回復:AI 將利用學習到的用戶行為模式,在消息應用程序中生成自然的回復信息,以供用戶選擇。
視頻搜索:AI 可以幫助用戶理解視頻內(nèi)容,以便在視頻中搜索特定信息。例如,通過搜索對話語句關鍵詞在視頻中定位到特定場景。
端側(cè) AI 驅(qū)動的聊天機器人和搜索:AI 將有助于更好地理解用戶通過自然語言進行的搜索查詢,并改進搜索結果。端側(cè)聊天機器人能夠理解和記錄用戶數(shù)據(jù)和歷史對話,同時確保用戶隱私受到保護。
內(nèi)容摘要:AI 將能夠從各種格式(例如,音頻、視頻、電子郵件附件)的長篇內(nèi)容提取內(nèi)容,生成簡潔的摘要,幫助用戶更方便地在智能手機上閱讀這些內(nèi)容。
日程助理:AI 將利用來自橫跨多個應用程序的數(shù)據(jù)源,自動創(chuàng)建和管理日歷日程,同時確保用戶數(shù)據(jù)受到保護。
Canalys 強調(diào),AI 手機成功的關鍵在于“能否擴大智能手機的應用場景并搭建 AI 原生應用”,第三方應用往往能決定用戶如何使用手機,因此智能手機廠商必須與開發(fā)者社區(qū)緊密合作,以設備端 AI 優(yōu)勢獲得未來的競爭優(yōu)勢。
參考
智能手機新時代:智慧升級再創(chuàng)高峰