網路資訊/駕馭海量資料優化儲存率先行
我們很常收到本地店家送的折價券,但筆者發現店家總是亂槍打鳥,不知道哪種商品的折價券該給誰,促銷效果纔是最好;這樣的問題在海量資料的年代有了新解法。
消費者有機會獲得常購商品的升級版,或是受邀試用同類但更高價的商品,這些判斷都來自於店家分析消費者購物紀錄後的結果。
筆者相信很快地,我們就可以根據自己的身高和體重、就診紀錄,買到客製化的止痛藥,而不會與其它藥物發生牴觸,這就是海量資料(Big Data)的真義。
什麼是海量資料?每一天,我們大約要產生「萬兆(百萬的三次方)」位元的資料,其中有90%產生在過去2年間。資料來源無所不在,從收集氣象資訊的感測設備、社交媒體的貼文、數位相片與影音、購物紀錄到手機定位訊號等等。
海量資料有四大面向:數量、速率、種類以及真實性。海量資料的數量增長以TB或PB爲單位起跳,企業面臨的挑戰有可能是要把每天產生12TB的推特(Twitter)推文,轉換成有用的產品意見分析,或是把每年3,500萬則量測數值轉換成更好的電力使用預測。
在速率方面,若需等待2分鐘纔有所迴應將遭人唾棄,因爲企業可能需要檢視每天產生的500萬筆交易事件,以找出詐欺嫌犯;或是即時分析每天5億通電話的細部紀錄,以更快速地預測用戶可能變心離去的原因。
在種類方面,海量資料形形色色,有結構式和非結構式,包括文字、量測資料、影音、點擊串流、登入檔案等;而綜合分析這些資料,將獲得嶄新的洞察。例如,分析100支監控攝影機的影片,找出特徵點;或是挖掘最近在影像、影音與文件當中新增的80%資料,有助於改進客戶滿意度。
至於真實性,有1/3商業領袖並不相信他們做決策的參佐資訊;既然不信任,又該如何做出正確的決策呢?因此,對海量資料建立信賴度的挑戰,會隨着資料來源越趨複雜、數量爆炸成長而顯得困難重重。
海量技術會影響企業的供應鏈、客戶,還有本身的維運。即使你不是產生海量資料的那一方,也是這些資料產生過程的某個環節,例如客戶滿意度調查、Twitter和Facebook的貼文、沒有如期交貨的紀錄等,你的一舉一動都被觀察、衡量和盤算。
然而,龐大多元的資料卻面臨一個現實:儲存預算停滯不增,這也是企業面臨的艱難挑戰。既然增加經費並不容易,就從優化儲存基礎設施的層面切入。
爲了打造一座穩固的儲存設施,IBM提出Storage Infrastructure Optimization(SIO)架構,採用的「Easy Tier」資料分析技術能更妥善利用快取、固態磁碟和容量以優化磁碟,降低儲存的成本,同時加速儲存的效能。
這麼一來,客戶將能有效管理成本、減輕風險,同時增強服務,而這些作爲旨在爲明日的海量資料應用做足準備。
儲存減重 投資花在刀口上
企業要優化儲存基礎設施的目的,在於追求卓越的組織營運成效,藉以打造企業的競爭優勢。這個過程就像是蓋房子,底層要降低儲存的成長,頂層要提升敏捷性與優化成本。透過IBM的SIO架構,企業能因應未來的需求,打造真正的營運優勢,讓儲存架構轉換成商業需求與計劃。
而企業最終目的在於降低成本、提高服務等級並管理風險,展現整體的商業競爭優勢。降低企業的資料儲存挑戰並沒有特效藥,最優先要做的三件事就是:停止儲存過多資料、提高儲存坪效、儲存在對的地方。
企業的儲存主管、資訊長或執行長在認清環繞在海量資料應用的儲存挑戰後,不要遲疑,趕快行動,爲貴公司的資料量瘦身減重。當企業能在儲存端獲得高效率與低成本後,就有足夠的資金能投入在智慧運算上。
終極效益:挖掘商業新洞察
值得一提的是,海量資料並不只是數量大小的議題,還要能讓企業有機會從不斷衍生的各種資料中,找出新的商業洞察,增強營運的敏捷度,延伸到前所未有的新觸角。這種需求其實一直都存在,只是以前缺乏實際駕馭這類機會的方法。
此刻,你採取了什麼行動?傳統的應用資料,與來自各種關聯式和非關聯式的資料來源,其數量龐大、甚至混亂,或許也會越長越大,但它們蘊含對企業發展的重要洞察。這些資料的生命可能非常短暫,因此企業必須加快挖掘速度,儘早從砂礫中找到珍珠。