隨著時(shí)代進(jìn)步和科技發(fā)展,大數(shù)據(jù)逐步為人類創(chuàng)造出更多的價(jià)值。你知道大數(shù)據(jù)的概念是什么嗎?它又有怎樣的特點(diǎn)呢?
大數(shù)據(jù)又稱巨量數(shù)據(jù)、海量數(shù)據(jù),是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多的數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的集成共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。也有相關(guān)機(jī)構(gòu)對(duì)其有所定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。換言之,大數(shù)據(jù)就是在浩如煙海的信息中,利用數(shù)據(jù)分析的技術(shù),對(duì)冗雜無序的數(shù)據(jù)進(jìn)行分析和整理,并迅速篩選出有價(jià)值的信息。
2010年10月,麥肯錫在《大數(shù)據(jù):創(chuàng)新競(jìng)爭(zhēng)和提高生產(chǎn)率的下一個(gè)新領(lǐng)域》的研究報(bào)告里正式使用“大數(shù)據(jù)”一詞,并最早提出“大數(shù)據(jù)”時(shí)代已經(jīng)到來。簡(jiǎn)單地說,“大數(shù)據(jù)”即“海量數(shù)據(jù)”+復(fù)雜類型的數(shù)據(jù),麥肯錫認(rèn)為大數(shù)據(jù)就是指無法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)有4個(gè)方面的典型特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低、處理速度快。
大數(shù)據(jù)可以將數(shù)據(jù)分析和整合的結(jié)果應(yīng)用于為企業(yè)提供決策支持,也可以將分析與建模的成果轉(zhuǎn)化為具體的應(yīng)用集成到業(yè)務(wù)流程中,為業(yè)務(wù)直接提供數(shù)據(jù)的支持。大數(shù)據(jù)的應(yīng)用一般分為兩類。一類是嵌入業(yè)務(wù)流程的數(shù)據(jù)輔助功能,如我們?cè)诰W(wǎng)絡(luò)購(gòu)物時(shí),經(jīng)常會(huì)有“相關(guān)推薦”“猜你喜歡”等購(gòu)物推薦,這就是通過數(shù)據(jù)分析與建模,分析我們的購(gòu)物喜好,進(jìn)行數(shù)據(jù)整合和篩選,最終得出推薦給我們的內(nèi)容。另一類則是以數(shù)據(jù)為驅(qū)動(dòng)的業(yè)務(wù)場(chǎng)景,如我們?cè)诔鲂星斑M(jìn)行相關(guān)準(zhǔn)備時(shí),經(jīng)常會(huì)在網(wǎng)絡(luò)上對(duì)住宿,門票,車票等進(jìn)行比價(jià),這就是在采集各電商網(wǎng)站報(bào)價(jià)的基礎(chǔ)上,利用大數(shù)據(jù)對(duì)同一產(chǎn)品進(jìn)行識(shí)別和排序,從而得到最優(yōu)方案。
提到大數(shù)據(jù)的發(fā)展,我們不得不提到一個(gè)概念——大數(shù)據(jù)的生命周期。事實(shí)上,它指的是某個(gè)集合的大數(shù)據(jù)從產(chǎn)生和獲取到銷毀的過程。也就是企業(yè)在實(shí)際運(yùn)用大數(shù)據(jù)的過程中,在大數(shù)據(jù)戰(zhàn)略的基礎(chǔ)上,定義大數(shù)據(jù)范圍,確定大數(shù)據(jù)采集、存儲(chǔ)、整合、呈現(xiàn)與使用、分析與應(yīng)用、歸檔與銷毀的流程,并根據(jù)數(shù)據(jù)和應(yīng)用的狀況,對(duì)該流程進(jìn)行持續(xù)優(yōu)化。
隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算技術(shù)的迅速發(fā)展,大數(shù)據(jù)技術(shù)也越來越受人們關(guān)注。