數據編織技術:“一張網”聯通跨系統數據
◎本報記者 張佳星
數據是數字時代的基礎性資源和戰略性資源,也是數字經濟的關鍵生產要素。今年發佈的《全國數據資源調查報告(2023年)》指出,我國數據資源管理和利用整體處於起步階段,數據資源“產—存—算”規模優勢基本形成,數據“供—流—用”各環節主體逐漸豐富,海量數據和豐富場景優勢潛力亟需釋放。
如何進一步挖掘數據資源價值,釋放海量數據潛力?數據編織技術提供了一種解決方案。11月27日,在數智技術社區DataFun與浙江大應科技有限公司(以下簡稱“大應科技”)聯合主辦的數據編織價值評估研討會上,行業專家齊聚一堂,探討數據編織技術的發展前景。
利用數據編織技術,可以編織一張虛擬的數據網,它能夠將企業內部分散在不同系統和平臺上的數據連接起來,形成一個統一的數據生態系統。這張網不是點對點的連接,而是基於網絡架構的虛擬連接,使數據可以在網上迅速流動,並統一對外提供服務。
“企業對數據資產進行價值挖掘時,如果依託傳統的數據解決方案,首先需要建設‘數據倉庫’。”大應科技技術副總裁餘俊說,然而,“數據倉庫”建設投入大、週期長,會導致數據價值收益不確定。因此,對一些傳統企業來說,數據利用門檻較高。
此外,隨着數據規模擴大,傳統模式也難以滿足數據資源挖掘的要求。“在數據規模不太大情況下,‘數據倉庫’可以方便地滿足業務需求。但隨着企業數字化程度日益提升,其數據規模會越來越大,數據要支持的業務場景不斷擴展,數據需求形式多樣、要求繁雜。在這種情況下,企業對於數據資源利用的技術體系將有更復雜要求。”餘俊說。
降低企業的數據利用門檻,是企業數據與業務深度融合,更好地以數據賦能日常經營的關鍵。業內人士認爲,數據編織技術作爲一種新的數據管理和集成方法,可將數據生態系統的複雜組件整合到一起,提供完整的數據管理方案。
餘俊說,數據編織技術對數據庫、數據池等數據基礎設施要求不高。這是因爲該技術的核心理念是通過優化跨源異構數據的發現與訪問,將可信數據以靈活且可理解的方式交付給所有相關數據消費者,實現自助服務、高效協作和敏捷數據交付。
此外,與傳統數據中臺體系相比,數據編織技術無需將數據移動到集中位置,而是依靠強大的數據虛擬化技術及數據治理策略實現統一的數據管理。通過創建邏輯數據層,數據編織技術可將分散在不同系統中的數據匯聚在一個“邏輯點”上,爲數據使用者提供一個統一、抽象、封裝的邏輯數據視圖。用戶可通過這個視圖查詢和操作存儲在異構數據源中的數據,把多個異構數據源當成一個同構數據源使用,無需在意數據位置、數據類型和數據格式。
“這樣使用數據就免去了事前搬運、事中運維、事後治理的麻煩,數據編織技術有望爲企業利用數據資源帶來巨大便利。”大應科技副總裁劉靚說,衆多企業已經開始積極探索數據編織的應用場景和落地路徑。不過,由於該技術缺乏清晰可參考的實踐方法論與價值評估標準,落地之路面臨許多挑戰。
研討會上,《數據編織價值評估指南》發佈。它爲企業提供了一套全面、系統的數據編織價值評估框架,有望爲數智化業務創新提供標準化支撐。
據介紹,該指南在深度解析數據編織價值主張、實現機制、數據價值評估方法與量化指標的同時,還通過多個實際案例,闡述了數據編織技術在不同行業、不同場景下的最佳實踐。結合指南,企業可以清晰瞭解數據編織在提升數據響應速度、降低存算成本和管理成本方面的實際效果。
業內專家認爲,隨着企業數字化轉型深入推進,數據編織正逐漸展現出巨大潛力和價值。國際信息技術研究和分析公司Gartner發佈的《2024年中國數據、分析和人工智能技術成熟度曲線》認爲,數據編織在數據、分析和人工智能成熟度曲線中處於創新驅動的快速上升期,是一種具有前瞻性的技術。該報告預測,數據編織技術在未來2—5年內將實現廣泛應用。
來源:科技日報