5月30日,全國(guó)數(shù)據(jù)資源調(diào)查工作組(國(guó)家工業(yè)信息安全發(fā)展研究中心)編纂的《全國(guó)數(shù)據(jù)資源調(diào)查報(bào)告(2023年)》對(duì)外公布。
根據(jù)說(shuō)明,2024年2月,國(guó)家數(shù)據(jù)局聯(lián)合中央網(wǎng)信辦、工業(yè)和信息化部、公安部組織開展全國(guó)數(shù)據(jù)資源調(diào)查,國(guó)家工業(yè)信息安全發(fā)展研究中心承擔(dān)調(diào)查實(shí)施工作。在前期工作基礎(chǔ)上,此次調(diào)查擴(kuò)大調(diào)查范圍、擴(kuò)展調(diào)查對(duì)象、增設(shè)調(diào)查指標(biāo),通過(guò)全量測(cè)算和抽樣調(diào)查等方式,調(diào)查全國(guó)關(guān)鍵數(shù)據(jù)資源情況,為政府施策、產(chǎn)業(yè)發(fā)展提供參考。
調(diào)查報(bào)告指出,數(shù)據(jù)作為新型生產(chǎn)要素,具有重要基礎(chǔ)性和戰(zhàn)略性,是發(fā)展新質(zhì)生產(chǎn)力的重要基礎(chǔ)。近年來(lái),在政產(chǎn)學(xué)研用合力推動(dòng)下,我國(guó)數(shù)據(jù)規(guī)模實(shí)現(xiàn)快速增長(zhǎng),數(shù)據(jù)流通交易架構(gòu)逐步形成,數(shù)據(jù)開發(fā)利用創(chuàng)新探索,數(shù)據(jù)要素價(jià)值加快釋放,為做大做強(qiáng)數(shù)字經(jīng)濟(jì)、建設(shè)數(shù)字中國(guó)奠定了堅(jiān)實(shí)基礎(chǔ)。
調(diào)查發(fā)現(xiàn),我國(guó)數(shù)據(jù)資源管理和利用整體處于起步階段,數(shù)據(jù)“產(chǎn)-存-算”規(guī)模優(yōu)勢(shì)基本形成,數(shù)據(jù)“供給-流通-應(yīng)用”主體逐漸豐富,海量數(shù)據(jù)和豐富場(chǎng)景優(yōu)勢(shì)潛力仍待釋放。
全國(guó)數(shù)據(jù)生產(chǎn)、存儲(chǔ)、計(jì)算呈現(xiàn)規(guī)模大、增速快的特點(diǎn)。2023年,全國(guó)數(shù)據(jù)生產(chǎn)總量達(dá)到32.85澤字節(jié)(ZB),同比增長(zhǎng)22.44%。2023年,全國(guó)數(shù)據(jù)存儲(chǔ)總量為1.73澤字節(jié)(ZB),存儲(chǔ)空間利用率為59%。2023年,2200多個(gè)算力中心的算力規(guī)模超0.23十萬(wàn)億億次浮點(diǎn)運(yùn)算/秒(ZFLOPS),同比增長(zhǎng)約30%。其中,智能算力占比約30%。
2023年,全國(guó)一體化政務(wù)數(shù)據(jù)共享樞紐接入53個(gè)國(guó)家部門、31個(gè)省/自治區(qū)/直轄市和新疆生產(chǎn)建設(shè)兵團(tuán)數(shù)據(jù),“一網(wǎng)通辦”事項(xiàng)不斷增加。2023年,公共數(shù)據(jù)開放量同比增長(zhǎng)超16%。18.6%的平臺(tái)企業(yè)和51%的中央企業(yè)在數(shù)據(jù)開發(fā)利用過(guò)程中應(yīng)用到政府開放數(shù)據(jù)。4個(gè)國(guó)家部門、15個(gè)省級(jí)數(shù)據(jù)管理部門探索公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)。
值得注意的是,數(shù)據(jù)生產(chǎn)存儲(chǔ)、流通交易、開發(fā)利用過(guò)程中的數(shù)據(jù)量降幅較大,能支撐人工智能訓(xùn)練的數(shù)據(jù)資源較少,數(shù)據(jù)價(jià)值仍需進(jìn)一步挖掘。2023年,全國(guó)數(shù)據(jù)產(chǎn)存轉(zhuǎn)化率為2.9%,海量數(shù)據(jù)源頭即棄。企業(yè)一年未使用的數(shù)據(jù)占比為38.93%,大量數(shù)據(jù)被存儲(chǔ)后不再被讀取和復(fù)用。交易所需求方是供給方的1.75倍,數(shù)據(jù)產(chǎn)品成交率為17.9%,數(shù)據(jù)場(chǎng)內(nèi)交易供需匹配率低。2023年,尚未建設(shè)數(shù)據(jù)管理系統(tǒng)的大企業(yè)比例為21.9%,實(shí)現(xiàn)規(guī)劃管理的數(shù)據(jù)資源仍然較少。2023年,開展數(shù)字化轉(zhuǎn)型的大企業(yè)中,實(shí)現(xiàn)數(shù)據(jù)復(fù)用增值的僅有8.3%,數(shù)據(jù)價(jià)值挖掘任重道遠(yuǎn)。
1)我國(guó)數(shù)據(jù)生產(chǎn)規(guī)模持續(xù)擴(kuò)大
2023年數(shù)據(jù)生產(chǎn)總量達(dá)到32.85澤字節(jié)(ZB),同比增長(zhǎng)22.44%,非結(jié)構(gòu)數(shù)據(jù)爆發(fā)式增長(zhǎng)。隨著5G、AI技術(shù)的快速發(fā)展及智能設(shè)備的規(guī)模應(yīng)用,內(nèi)容創(chuàng)作、影像視聽等非結(jié)構(gòu)數(shù)據(jù)對(duì)我國(guó)數(shù)據(jù)總規(guī)模增長(zhǎng)貢獻(xiàn)較大,消費(fèi)民生領(lǐng)域新業(yè)態(tài)不斷涌現(xiàn),滿足了人們不斷增長(zhǎng)的文化娛樂消費(fèi)需求。
2)智慧城市擴(kuò)大物聯(lián)感知范圍
公共數(shù)據(jù)獲取范圍不斷擴(kuò)大,設(shè)施物聯(lián)傳感數(shù)據(jù)占比超40%。城市各種基礎(chǔ)設(shè)施、資源、服務(wù)等加速數(shù)字化、網(wǎng)絡(luò)化、智能化升級(jí),攝像頭、傳感器、無(wú)線設(shè)備等相互連接形成城市的“神經(jīng)脈絡(luò)”,實(shí)時(shí)捕捉城市交通、人流等各種信息,推動(dòng)海量數(shù)據(jù)從大街小巷匯入城市大腦。
3)智能應(yīng)用推動(dòng)數(shù)據(jù)產(chǎn)量提速
隨著技術(shù)的創(chuàng)新突破以及硬件的迭代更新,生產(chǎn)生活的數(shù)字化應(yīng)用逐漸增加,推動(dòng)我國(guó)數(shù)據(jù)產(chǎn)量快速增長(zhǎng)。在生活方面,智能網(wǎng)聯(lián)車驅(qū)動(dòng)車、路、網(wǎng)、云數(shù)據(jù)快速交換,出行數(shù)據(jù)同比增幅達(dá)到49%。在生產(chǎn)方面,老舊生產(chǎn)設(shè)備的升級(jí)改造以及智能邊緣設(shè)備、工業(yè)機(jī)器人、數(shù)控機(jī)床等智能設(shè)備的推廣應(yīng)用,推動(dòng)生產(chǎn)制造數(shù)據(jù)同比增幅達(dá)到20%。
4)算力中心規(guī)模持續(xù)增長(zhǎng),算力建設(shè)仍需適度超前布局
至2023年底,2200多個(gè)算力中心的算力規(guī)模約為0.23十萬(wàn)億億次浮點(diǎn)運(yùn)算/秒(ZFLOPS),同比增長(zhǎng)約為30%。與此同時(shí),大模型訓(xùn)練算力需求高漲,科學(xué)、政務(wù)、金融、工業(yè)等行業(yè)算力需求隨之增加,一體化算力體系建設(shè)仍需加快推進(jìn),保持適度超前布局。
5)消費(fèi)領(lǐng)域數(shù)據(jù)交互活躍度較高
2023年,四大運(yùn)營(yíng)商數(shù)據(jù)顯示全國(guó)數(shù)據(jù)總流量較去年同期增長(zhǎng)7.6%,數(shù)據(jù)流量保持穩(wěn)步增長(zhǎng)。隨著汽車、家居、穿戴等智能終端品類不斷豐富和聲像視聽數(shù)據(jù)交互需求持續(xù)增加,移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)流通活躍度不斷增加。
6)平臺(tái)和央企數(shù)據(jù)流通量遠(yuǎn)超其他企業(yè)
中央企業(yè)和平臺(tái)企業(yè)成為行業(yè)領(lǐng)域的數(shù)據(jù)樞紐,在各自領(lǐng)域探索交互機(jī)制。平臺(tái)企業(yè)是行業(yè)領(lǐng)域的數(shù)據(jù)樞紐。本次調(diào)查中,平臺(tái)企業(yè)平均數(shù)據(jù)交互量為行業(yè)重點(diǎn)企業(yè)的249倍,各行業(yè)數(shù)據(jù)正逐漸向平臺(tái)聚攏。SaaS服務(wù)模式日益成熟,平臺(tái)提供數(shù)據(jù)產(chǎn)品中SaaS化產(chǎn)品占比超五成,訂閱式交易占比逐年增多。中央企業(yè)成為產(chǎn)業(yè)鏈數(shù)據(jù)樞紐。本次調(diào)查中,中央企業(yè)平均數(shù)據(jù)交互量為行業(yè)重點(diǎn)企業(yè)的42倍。鏈主企業(yè)正在通過(guò)產(chǎn)業(yè)鏈協(xié)同賦能上下游企業(yè),匯聚全產(chǎn)業(yè)鏈數(shù)據(jù)。
在發(fā)展趨勢(shì)方面,全國(guó)數(shù)據(jù)資源調(diào)查工作驗(yàn)證了我國(guó)發(fā)展數(shù)字經(jīng)濟(jì)具備超大規(guī)模市場(chǎng)、海量數(shù)據(jù)資源和豐富應(yīng)用場(chǎng)景潛在優(yōu)勢(shì)。未來(lái),隨著數(shù)據(jù)技術(shù)不斷進(jìn)步,基礎(chǔ)制度持續(xù)完善,數(shù)據(jù)生產(chǎn)規(guī)模將保持高速增長(zhǎng),存儲(chǔ)計(jì)算將向按需調(diào)度發(fā)展,數(shù)據(jù)流通將向規(guī)范有序、多元協(xié)同發(fā)展,數(shù)據(jù)開發(fā)利用將向需求牽引、智能驅(qū)動(dòng)發(fā)展。
1)數(shù)據(jù)生產(chǎn)向高增速和高質(zhì)量同步發(fā)展
在政策、技術(shù)和應(yīng)用多重因素驅(qū)動(dòng)下,我國(guó)數(shù)據(jù)規(guī)模將保持快速增長(zhǎng)趨勢(shì),高質(zhì)量數(shù)據(jù)資源將成為經(jīng)濟(jì)增長(zhǎng)的重要源泉。一方面,數(shù)據(jù)規(guī)模優(yōu)勢(shì)將進(jìn)一步擴(kuò)大。數(shù)據(jù)生產(chǎn)能力將隨著衛(wèi)星通信、自動(dòng)駕駛、生成式AI等新技術(shù)的規(guī)模化應(yīng)用而持續(xù)提升,預(yù)計(jì)2024年數(shù)據(jù)生產(chǎn)量增長(zhǎng)將超25%,同時(shí),數(shù)據(jù)存儲(chǔ)能力也將隨硬件技術(shù)的升級(jí)迭代和成本降低提升。另一方面,數(shù)字化轉(zhuǎn)型將促進(jìn)各行業(yè)高質(zhì)量數(shù)據(jù)形成,數(shù)據(jù)從設(shè)備、系統(tǒng)的分散狀態(tài)釋放、匯聚和應(yīng)用。同時(shí),AI大模型的迅猛發(fā)展對(duì)大規(guī)模、高質(zhì)量、多樣性數(shù)據(jù)集提出更高要求,有助于數(shù)據(jù)質(zhì)量進(jìn)一步提升。
2)數(shù)據(jù)存儲(chǔ)計(jì)算向一體化按需供給發(fā)展
隨著人工智能訓(xùn)練需求的高漲,算力在短期內(nèi)仍會(huì)出現(xiàn)難以滿足需求的情況,但會(huì)隨應(yīng)用需求加速調(diào)整布局,提高算力利用率。一方面,數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)將按需調(diào)整,邊緣智能計(jì)算將有所提高,把有價(jià)值的數(shù)據(jù)釋放出來(lái);協(xié)同交互需求推動(dòng)部分?jǐn)?shù)據(jù)向云端遷移,實(shí)現(xiàn)在線調(diào)度和應(yīng)用。另一方面,隨著數(shù)據(jù)高效計(jì)算、實(shí)時(shí)讀取需求不斷增長(zhǎng),未來(lái)全國(guó)一體化算力體系將向算力能力發(fā)布、算力調(diào)度、安全服務(wù)等多元功能擴(kuò)展,緩解東部實(shí)時(shí)算力壓力的同時(shí),釋放西部算力優(yōu)勢(shì)。
3)數(shù)據(jù)流通向規(guī)范有序、多元協(xié)同發(fā)展
隨著國(guó)家層面的數(shù)據(jù)交易規(guī)范進(jìn)一步完善。一方面,隨著數(shù)據(jù)流通基礎(chǔ)規(guī)則不斷完善,數(shù)據(jù)交易場(chǎng)所、數(shù)據(jù)服務(wù)商等流通載體將逐步走向規(guī)范有序發(fā)展。另一方面,場(chǎng)內(nèi)場(chǎng)外流通交易模式更加多元化,各類細(xì)分領(lǐng)域交易機(jī)構(gòu)向?qū)I(yè)化發(fā)展。平臺(tái)企業(yè)和中央企業(yè)將持續(xù)發(fā)揮行業(yè)數(shù)據(jù)樞紐作用,帶動(dòng)行業(yè)領(lǐng)域的數(shù)據(jù)匯聚、流通和應(yīng)用。
4)數(shù)據(jù)應(yīng)用向需求牽引、智能驅(qū)動(dòng)發(fā)展
應(yīng)用場(chǎng)景牽引的數(shù)據(jù)開發(fā)利用將成為主要趨勢(shì),AI技術(shù)成為數(shù)據(jù)開發(fā)利用的重要推動(dòng)力。一方面,應(yīng)用需求涌現(xiàn),場(chǎng)景逐漸豐富化。大模型對(duì)海量高質(zhì)量數(shù)據(jù)提出了迫切需求,垂直領(lǐng)域的數(shù)據(jù)應(yīng)用需求將持續(xù)保持快速增長(zhǎng),并逐步從業(yè)務(wù)降本提效轉(zhuǎn)向協(xié)同創(chuàng)新、市場(chǎng)拓展,數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)發(fā)展將成為主要應(yīng)用訴求。另一方面,自然語(yǔ)言處理、語(yǔ)音識(shí)別等技術(shù)進(jìn)步降低開發(fā)門檻,圍繞數(shù)據(jù)增值的產(chǎn)品服務(wù)將逐漸成為數(shù)據(jù)供給的主要方式。