在近日舉辦的第七屆數(shù)字中國建設(shè)峰會上,中國電信人工智能研究院宣布了一項(xiàng)技術(shù)突破,發(fā)布了業(yè)內(nèi)首個能同時(shí)識別30種方言的語音識別大模型——星辰超多方言語音識別大模型。這一創(chuàng)新技術(shù)打破了傳統(tǒng)單一模型僅能識別特定方言的限制,為語言文化的傳承注入了新的活力。
中國是一個語言多樣性極其豐富的國家,“百里不同俗,十里不同音”的現(xiàn)象十分普遍。方言作為地域文化的重要組成部分,其保護(hù)和傳承顯得尤為重要。然而,由于方言種類繁多,語法語音特征各異,傳統(tǒng)的方言研究方式依賴大量的人力進(jìn)行主觀感知和標(biāo)注,工作量大且標(biāo)注難以系統(tǒng)化。在此背景下,AI技術(shù)的介入無疑為方言的保護(hù)和研究帶來變革。
星辰超多方言語音識別大模型的發(fā)布,正是基于AI技術(shù)的高效與系統(tǒng)性對方言進(jìn)行整理歸納的重大成果。該模型不僅能同時(shí)識別包括粵語、上海話、四川話、溫州話等在內(nèi)的30多種方言,更在豐富性和質(zhì)量上居于行業(yè)前列。這得益于中國電信人工智能研究院構(gòu)建的超過30種、總計(jì)超過30萬小時(shí)的高質(zhì)量方言數(shù)據(jù)庫。
在技術(shù)研發(fā)方面,中國電信的研發(fā)團(tuán)隊(duì)首創(chuàng)了“蒸餾+膨脹”聯(lián)合訓(xùn)練算法,有效解決了在超大規(guī)模多場景數(shù)據(jù)集和大規(guī)模參數(shù)條件下預(yù)訓(xùn)練可能出現(xiàn)的坍縮問題。
目前,星辰語音大模型已在福建、江西、廣西、北京、內(nèi)蒙古等地的中國電信10000智能客服進(jìn)行試點(diǎn)應(yīng)用。通過接入星辰大模型,智能客服能夠迅速理解30種方言,日均處理電話量達(dá)到約200萬通,極大地提高了服務(wù)效率和用戶體驗(yàn)。此外,該模型還在多個城市的12345市民服務(wù)平臺得到應(yīng)用,為市民提供更加便捷的服務(wù)。
星辰超多方言語音識別大模型的發(fā)布和應(yīng)用,不僅展示了AI技術(shù)在語言文化傳承方面的巨大潛力,也為中國電信在人工智能領(lǐng)域的研究和應(yīng)用增添了新的亮點(diǎn)。