根據(jù)美國商標和專利局(USPTO)近日公示的清單,微軟攜手 OpenAI 構(gòu)想了一個聲音識別 AI 技術(shù)專利,不僅能夠識別門鈴、狗叫或嬰兒啼哭等日常聲音,還能檢測地震和風(fēng)暴等自然災(zāi)害的跡象。
微軟構(gòu)想的該系統(tǒng)通過處理環(huán)境聲音,可以提醒用戶注意潛在的危險,可以在公共安全、備災(zāi)工作發(fā)揮重要作用。
微軟這項聲音 AI 專利的核心在于對音頻信號的復(fù)雜處理。
系統(tǒng)首先將聲音信號分解成較小的片段,在經(jīng)過獨立處理之后創(chuàng)建聲音在時域中的規(guī)范化表示,本質(zhì)上是聲音在時間軸上的映射。
然后該系統(tǒng)映射數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),進一步匹配和評估聲音片段,識別出的每一類聲音事件的分配得分(assigning scores)和發(fā)生概率。
系統(tǒng)再調(diào)用算法進行后期處理之后,完善這些分數(shù)和概率,為每種聲音類型生成置信度值(confidence values)。這一細致的過程使人工智能能夠準確識別從普通到潛在危險的各種聲音。