數據挖掘平臺從海量數據中,通過算法搜索隱藏于其中信息。平臺通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現目標。通過數據挖掘平臺,將海量數據轉化為寶貴的“數據資產”。
以一家銀行為例,銀行擁有客戶相關的很多數據,包括客戶 ID、年齡、性別、婚姻狀況、職業、賬齡、儲蓄存款戶頭、是否使用信用卡、平均余額、信用交易數量、借記交易數量等。在銀行日常業務中,我們經常需要回答下面的問題:如何將客戶進行細分,便于從中找出有價值的部分客戶?在現有客戶中那些客戶對銀行具有有潛在風險?哪些客戶與眾不同,是否存在商機?哪些客戶是信用卡業務的潛在客戶,如何進行預測?
采用數據挖掘中的分群、預測、孤立點識別等方法,基于銀行客戶基本信息數據、交易數據構建數據挖掘模型,進行客戶分群、孤立點識別以及分類預測等挖掘分析,從而找出有價值的客戶、規避潛在風險、找出商機、找到潛在客戶,真正將海量數據轉化為寶貴的“數據資產”。