國內及全球信息系統經過多年的運行,沉淀了海量的視頻、圖片、圖表、文字等相關數據。這些數據具有量大、高維、多源、異構、動態、時效、連續、無限等特點。由于種種原因這些數據大多只存在于垂直業務和單一應用中,數據過于分散,并未被充分整合加以利用和挖掘。隨著信息化系統的不斷建設,相關的數據量級已從TB級別躍升到PB級別,足以支撐起行業應用大數據來解決相關問題。經過多年的發展也積累了大量的大數據處理分析的應用需求,具備基于海量數據進行相應數據挖掘的基礎。
數據是一種寶貴的資源。利用新技術新方法挖掘現有數據的價值,找到數據間的關聯關系,提高基礎數據的利用率,并預測未來趨勢及行為,是國內面臨的迫切問題。一批新興的數據處理、挖掘與分析技術不斷涌現,使分析處理海量數據變得更加容易、更加便捷。
通過建設大數據基礎平臺,對已有海量數據進行整合、挖掘和分析,由傳統的經驗決策模式逐步轉變為數據決策模式,可以進一步提升國內管理水平以及決策效率,并充分挖掘數據資產的重要價值。大數據基礎平臺采用模塊化結構,模塊高內聚、松耦合,應滿足高可靠、實時響應快、安全性好、開放性好,系統應易于操作、易于維護、可擴展性好。
近年來,數據挖掘理論及其技術研究和開發取得了較為快速的發展,其在各個領域應用有著非常廣闊的空間和潛力。數據挖掘成為解決數據處理難題的有效武器,并顯示出強大的生命力。數據挖掘主要依賴兩項技術:一是對某個領域各部門產生的各種業務數據進行整理和集成,搭建支持決策的數據分析環境,即數據倉庫;二是發現隱藏在各種監測數據之中的有用知識,即數據挖掘。
基于沃達德大數據平臺,通過對海量數據采集、處理、存儲、分析和數據挖掘,根據數據的特性,采用合適的可視化方式,將數據直觀地展現出來,以幫助人們認識數據、理解數據,同時找出包含在海量數據中的規律或者信息,預測未來發展趨勢,進行智能化決策分析,使得數據資產成為核心競爭力。