近日,騰訊披露自研編解碼芯片“滄!弊钚逻M展。據(jù)了解,滄海芯片已在業(yè)務(wù)場景中投用數(shù)萬片,服務(wù)騰訊自研業(yè)務(wù)及公有云客戶。
據(jù)介紹,在SSIM (結(jié)構(gòu)相似性)、PSNR(峰值信噪比)和VMAF(視頻多方法評估融合) 等多項評價指標上,滄海芯片大幅領(lǐng)先行業(yè)GPU等標品硬件。此外,在120fps的高幀率檔位上,在同等畫質(zhì)下滄海較行業(yè)領(lǐng)先ASIC水平能再節(jié)省10%碼率。
2019年初,騰訊蓬萊實驗室、香農(nóng)實驗室聯(lián)合啟動編解碼芯片”滄海“研發(fā)。對硬件編解碼的算法、架構(gòu)和工程進行深度攻關(guān),向高畫質(zhì)、低延遲、低成本的“不可能三角”發(fā)起挑戰(zhàn)。
基于自身在底層軟硬件架構(gòu)和音視頻領(lǐng)域的多年積累,研發(fā)團隊對每個模塊的計算任務(wù)都作了并行拆解。通過分配不同的計算單元,從而疊加大量處理任務(wù);為滄海芯片內(nèi)置視頻編碼加速專用功能模塊,讓流水控制邏輯更純粹,減少重復(fù)計算和分支判斷,帶來更低的功耗和成本。
滄海芯片的編碼器設(shè)計中完整實現(xiàn)了高精度運動搜索、全率失真優(yōu)化、高效自適應(yīng)量化等所有主流編碼工具,并融合騰訊云軟件編碼器碼率控制等方面的領(lǐng)先技術(shù),壓縮率高于市面標品35%以上。
在硬件架構(gòu)上,通過將視頻預(yù)分析計算單元進一步卸載到硬件中,滄海芯片大幅減少了高密度轉(zhuǎn)碼場景下任務(wù)對CPU性能的依賴,將轉(zhuǎn)碼性能提升到更強。通過靈活的多核擴展架構(gòu)、高性能編碼流水線、層級化Memory布局,滄海芯片能滿足高吞吐、低時延和實時性要求。
去年3月,滄海芯片順利“點亮”,目前已經(jīng)量產(chǎn)并投用數(shù)萬片,在云游戲、直點播等場景中,面向騰訊自研業(yè)務(wù)和公有云客戶提供服務(wù)。