飛象網(wǎng)訊 近日,科大訊飛董事長(zhǎng)劉慶峰在公司成立 25 周年司慶活動(dòng)上透露,訊飛星火 V4.0 發(fā)布時(shí)將展示最新的端到端智能語(yǔ)音落地成果,同時(shí)公司的端到端的語(yǔ)音技術(shù)建模方案也排在計(jì)劃中,預(yù)計(jì)三季度推向市場(chǎng)。
除此之外,科大訊飛還將提供GPT-4o沒(méi)有的一句話復(fù)刻、高噪音場(chǎng)景語(yǔ)音識(shí)別、多方言多語(yǔ)種免切換功能。
在劉慶峰看來(lái),OpeanAI 發(fā)布 GPT-4o 對(duì)萬(wàn)物互聯(lián)時(shí)代語(yǔ)音浪潮的推動(dòng),類似于當(dāng)年 Siri 對(duì)語(yǔ)音應(yīng)用的推動(dòng)。它備受關(guān)注的原因有幾個(gè)點(diǎn):超擬人合成,使得說(shuō)話不再是朗讀腔調(diào),而是真的像人一樣自由對(duì)話;全雙工交互,可以同時(shí)(瞬時(shí))進(jìn)行信號(hào)的雙向傳輸,人機(jī)對(duì)話可以隨時(shí)打斷和繼續(xù);通過(guò)語(yǔ)音到語(yǔ)音的端到端建模,實(shí)現(xiàn)快速反應(yīng)的極致交互體驗(yàn)。
劉慶峰透露,下一步,科大訊飛將發(fā)力遠(yuǎn)場(chǎng)高噪音多人說(shuō)話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景、云邊端一體化、軟硬件一體化,從技術(shù)優(yōu)勢(shì)、市場(chǎng)先機(jī)、落地成效構(gòu)建全方位持續(xù)領(lǐng)先優(yōu)勢(shì)。據(jù)他介紹,在5月底上線的訊飛星火V3.5 Max版本,已在文本生成、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力上超越GPT-4 Turbo 0429的最新版本。