飛象原創(chuàng)(魏德齡/文)剛剛過去的2024年,新變化與新技術(shù)時刻環(huán)繞在企業(yè)身邊,“降本增效”“出海創(chuàng)收”“高質(zhì)量發(fā)展”等成為企業(yè)在講述自身發(fā)展策略時的關(guān)鍵詞。與此同時,o1與智能體又成為伴隨AI技術(shù)演進(jìn)時,被業(yè)界所更多聊起的新話題。
如今,即便是體育比賽也開始更多講求高階數(shù)據(jù),對于企業(yè)而言,無論是發(fā)展變革,還是AI賦能,其背后都與企業(yè)對于數(shù)據(jù)資源的有效挖掘,存在著巨大關(guān)系。
發(fā)展變革與AI賦能的背后
告別粗放式發(fā)展的背后,重點在于企業(yè)正在從以往的“堆人與堆技術(shù)”轉(zhuǎn)變?yōu)閷τ凇敖当驹鲂А钡年P(guān)注,背后需要創(chuàng)新技術(shù)對企業(yè)實現(xiàn)更多助力。例如,對于中國的制造業(yè)企業(yè)而言,隨著智能化轉(zhuǎn)型,將朝著提升技術(shù)含量和附加值的方向發(fā)展,智能制造、自動化、機器人技術(shù)等將成為重點。
從企業(yè)數(shù)據(jù)的發(fā)展過程中,將持續(xù)從生產(chǎn)數(shù)據(jù)向分析數(shù)據(jù)的過程推進(jìn)。當(dāng)數(shù)據(jù)在生產(chǎn)環(huán)節(jié)中誕生,便可能會在公有云和私有平臺上進(jìn)行分配,再傳送至不同的云上,最后以SaaS模式對客戶進(jìn)行服務(wù)分析?项loudera在近期的媒體溝通會上,結(jié)合當(dāng)下的市場情況給出了三個趨勢觀察結(jié)果。
當(dāng)數(shù)據(jù)變得越來越多,企業(yè)在數(shù)據(jù)管理中正面臨從傳統(tǒng)數(shù)據(jù)倉庫向數(shù)據(jù)湖倉一體轉(zhuǎn)變的趨勢。以往分析任務(wù)可能依賴于報表系統(tǒng)和數(shù)據(jù)倉庫。然而,隨著業(yè)務(wù)需求對數(shù)據(jù)實時性、完整性以及對結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的支持提出更高要求,數(shù)據(jù)的重心逐漸向數(shù)據(jù)湖倉一體傾斜。
另一個趨勢是了解數(shù)據(jù)資產(chǎn)需要數(shù)據(jù)網(wǎng)格或數(shù)據(jù)編織,作為企業(yè)數(shù)據(jù)治理的重要手段,通過整合多種數(shù)據(jù)格式和語言,為數(shù)據(jù)分析和對外服務(wù)提供支持!霸诳缬驍(shù)據(jù)中,數(shù)據(jù)網(wǎng)格和數(shù)據(jù)編織為企業(yè)提供了溝通與協(xié)作的新模式!盋loudera大中華區(qū)技術(shù)總監(jiān)劉隸放描述了企業(yè)數(shù)據(jù)管理的新方向。
例如,對于存在多個不同資方的企業(yè)而言,由于數(shù)據(jù)安全性和復(fù)雜的股權(quán)結(jié)構(gòu),數(shù)據(jù)的歸屬和跨域使用問題變得突出,數(shù)據(jù)網(wǎng)格理念尤其是在面對不同資方,以及解決跨部門、跨架構(gòu)的數(shù)據(jù)協(xié)作問題上,提供了“以數(shù)據(jù)為產(chǎn)品”的有效對話模式。
第三個趨勢在于人工智能應(yīng)用生命周期需要可信數(shù)據(jù)。企業(yè)成功應(yīng)用AI的關(guān)鍵在于從0到1的積累過程!捌髽I(yè)不要去羨慕市場上的生成式AI有多火,要先把馬步扎實!眲㈦`放專門在媒體會上強調(diào)了企業(yè)數(shù)據(jù)資產(chǎn)文化積累的重要性。
例如,在大語言模型大熱之前,許多企業(yè)已具備成熟的數(shù)據(jù)資產(chǎn)和相關(guān)文化,如OCR系統(tǒng)、智能客服等。沒有這些基礎(chǔ),僅依賴現(xiàn)成模型難以實現(xiàn)真正的突破。在AI應(yīng)用中,數(shù)據(jù)不僅是支撐技術(shù)的基礎(chǔ),更是企業(yè)構(gòu)建獨特競爭力的核心。結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的組織能力以及對數(shù)據(jù)資產(chǎn)的深度利用,決定了企業(yè)能否從AI中獲得實質(zhì)性價值。
Cloudera也正在順應(yīng)上述市場環(huán)境趨勢需求,為AI提供一個集中可信的數(shù)據(jù)中心,為模型和平臺的構(gòu)建提供堅實的數(shù)據(jù)基礎(chǔ)。Cloudera不僅支持在公有云和私有平臺上的AI部署,還注重跨平臺能力,推動現(xiàn)代化數(shù)據(jù)架構(gòu)的發(fā)展,實現(xiàn)數(shù)據(jù)和應(yīng)用的無縫連接。
務(wù)實AI策略與數(shù)據(jù)管理挑戰(zhàn)
面向2025年,Cloudera發(fā)布了五大科技趨勢預(yù)測。揭示了在未來一年生成式AI和AI Agent等創(chuàng)新技術(shù)的發(fā)展趨勢。其中包括生成式AI的應(yīng)用將趨向務(wù)實,AI Agent將在商業(yè)決策中發(fā)揮重要作用。同時,企業(yè)面臨著AI生成數(shù)據(jù)激增的挑戰(zhàn),亟需提升數(shù)據(jù)治理能力。企業(yè)需要強大的數(shù)據(jù)管理和多云策略來訪問、存儲和分析數(shù)據(jù),從而獲取數(shù)據(jù)的最大價值,充分發(fā)揮AI潛力。
首先便是企業(yè)對于AI的態(tài)度變化,預(yù)計生成式AI熱度將減退,企業(yè)會采取更務(wù)實的AI策略。Cloudera預(yù)測,企業(yè)將不再相信生成式AI的大肆炒作,而是專注于制定與企業(yè)整體目標(biāo)一致的技術(shù)投資計劃。在很多企業(yè)內(nèi)部的生成式AI應(yīng)用過程中,初期通常從內(nèi)部知識庫問答系統(tǒng)入手。這種簡單應(yīng)用易于實現(xiàn)且安全可控,可以通過開源模型和提示詞調(diào)整生成式AI結(jié)果。而一旦這一應(yīng)用進(jìn)行對外服務(wù)的話,就需要面臨更高的準(zhǔn)確性和可靠性要求,一直存在的致幻率問題將會嚴(yán)重影響客戶體驗。
預(yù)計到2025年,企業(yè)將在生成式AI應(yīng)用上分化為兩大陣營。一類是已成功應(yīng)用生成式AI的企業(yè),通過成熟應(yīng)用實現(xiàn)了顯著成效,背后的核心價值在于規(guī);闹R獲取和洞察生成,數(shù)據(jù)質(zhì)量是確保AI模型成功運行的關(guān)鍵。而另一類企業(yè)由于缺乏足夠的數(shù)據(jù)儲備,難以從生成式AI中獲得相同效益。因此他們將更傾向于采用傳統(tǒng)AI或確定性機器學(xué)習(xí)模型,以提升效率和生產(chǎn)力。
第二個預(yù)測是AI Agent將重塑商業(yè)決策,2025年將會迎來一個井噴式發(fā)展。Agentic AI正在推動創(chuàng)新浪潮,改變實時問題解決和決策過程。AI智能體高效優(yōu)化任務(wù),迅速應(yīng)對挑戰(zhàn),并實時靈活調(diào)整。這將促使企業(yè)構(gòu)建事件驅(qū)動型架構(gòu),支持AI能夠及時響應(yīng)現(xiàn)實事件,從而徹底改變電信和物流等行業(yè)。
第三是“全天候”AI為數(shù)據(jù)管理帶來新挑戰(zhàn)。以某國內(nèi)制造業(yè)企業(yè)為例,該企業(yè)將電池信息的收集頻率從每小時一次提升到每幾分鐘一次,顯著增加了數(shù)據(jù)的實時性和精準(zhǔn)性。但數(shù)據(jù)量的爆發(fā)也帶來了存儲和分析方面的挑戰(zhàn),需要更高效、更廉價的存儲解決方案。企業(yè)面臨算法優(yōu)化和數(shù)據(jù)管理的多重挑戰(zhàn),需結(jié)合成本控制和技術(shù)提升來實現(xiàn)數(shù)據(jù)價值的最大化。
當(dāng)AI如同空氣無處不在,滲透至個人生活的方方面面。面對數(shù)量龐大且種類繁多的AI生成數(shù)據(jù),企業(yè)如何從中挖掘出有價值的信息,成為亟待解決的問題。企業(yè)努力從不斷增長且種類繁多的AI生成數(shù)據(jù)中獲取洞察力,糟糕的數(shù)據(jù)管理可能會導(dǎo)致企業(yè)被信息流淹沒,難以有效地利用這些數(shù)據(jù)資源。為了充分釋放AI潛力,企業(yè)需要強大的數(shù)據(jù)管理和多云策略來訪問、存儲和分析數(shù)據(jù),無論數(shù)據(jù)是在本地、云中還是在邊緣,都能提煉獲取數(shù)據(jù)的最大價值。
這也引出了下一個預(yù)測內(nèi)容,當(dāng)企業(yè)在2025年致力于推動生成式AI的全面生產(chǎn)和規(guī);渴穑瑔渭兊幕旌显萍軜(gòu)已無法滿足企業(yè)需求。當(dāng)前企業(yè)的AI算法與分析算法需要能夠跨云訪問數(shù)據(jù),并同時追求經(jīng)濟性。由于數(shù)據(jù)在公有云和私有平臺間的傳輸價格非常昂貴,企業(yè)需要平衡分布算力和數(shù)據(jù),在利用這一環(huán)境來構(gòu)建AI算法。
德勤的研究指出,企業(yè)采用生成式AI的最大障礙是合規(guī)風(fēng)險和治理問題。隨著企業(yè)開始在本地或公有云中運行私有AI模型和應(yīng)用,混合數(shù)據(jù)管理平臺的需求日益增長。這類平臺集成了本地與云數(shù)據(jù)源,因此具備更高的靈活性且支持更廣泛的數(shù)據(jù)訪問,在保障模型端點安全和治理的同時,賦予企業(yè)更強的控制力。
最后一個預(yù)測是私有大語言模型(LLM)將逐漸取代公有大語言模型,成為企業(yè)優(yōu)選!八接写笳Z言模型將成為企業(yè)的優(yōu)選,從合規(guī)到隱私保護,這是不可回避的趨勢!眲㈦`放點明未來企業(yè)的人工智能發(fā)展過程中,將會聚焦合規(guī)與隱私需求。
預(yù)計到2025年,企業(yè)將加快定制AI解決方案的步伐,包括AI聊天機器人、虛擬助手和專屬代理應(yīng)用等,以滿足特定行業(yè)或業(yè)務(wù)的需求。越來越多企業(yè)將采用企業(yè)級LLM,這將對GPU的高性能支持提出更高要求,以比傳統(tǒng)CPU更快的速度運行,同時確保數(shù)據(jù)管理系統(tǒng)具有更高的安全性和隱私保護。RAG技術(shù)將得到更廣泛的應(yīng)用,將通用LLM轉(zhuǎn)化為行業(yè)或組織專屬的數(shù)據(jù)倉庫,從而為現(xiàn)場支持、人力資源和供應(yīng)鏈等領(lǐng)域的終端用戶提供更加精準(zhǔn)、可靠的數(shù)據(jù)支持。