IBM針對海量資料即時分析需求推出InfoSphere Streams系統,強調因應動態變化的大量資料提供快速的資料分析。

隨著社交網路、物聯網、線上影音等服務興起,企業對各種結構化、非結構化海量資料(Big Data)處理需求增加,針對企業分析海量資料需求,IBM在資料倉儲的關聯性資料庫分析及Hadoop架構的InfoSphere Biginsights平行分析技術之外,推出新系統InfoSphere Streams,強調可對動態變化的海量資料快速分析,加速企業市場反應速度。

台灣IBM軟體事業處副總經理林世偉表示,企業面對的海量資料不只資料量大(Volume)、資料結構多元(Variety),許多動態資料更需要快速分析才有價值,這些動態的大量資料需要高時效性,快速回應才具有價值。InfoSphere Streams即因應海量資料快速分析需求,不需等待資料倉儲即時處理。

InfoSphere Streams分析技術源於IBM和美國國土安全單位為反恐需求所開發,原先的目的在第一時間分析大量資料評估安全風險,以快速作出反恐決策,後來經美國政府申請,得以將該技術商品化推向企業市場。

該技術以Stream Process Language的特殊語言開發,搭配多節點X86伺服器組成叢集系統,將匯入的大量資料分流,以分工合作的方式交各個處理單元分析,因以記憶體作大量的資料處理,速度要比網路處理來得快,分析反應速度強調可控制在微秒之間。分析後的資料可匯入資料倉儲、資料庫,或是Biginsights作後續的分析處理。

IBM指出,Hadoop是以Java語言開發,利用分散式檔案系統(HDFS)及Map/Reduce作的大量資料的平行處理,適合大量且資料結構複雜的海量資料分析,而InfoSphere Streams利用資料分流、記憶體處理提昇分析速度,適合大量變動資料在儲存前進行即時分析。

林世偉表示,InfoSphere Streams在國外已有實際使用案例,例如從事風力發電的Vestas Wind,過去天氣、風向等複雜、隨時變化的大量資料分析需2至3週,採用InfoSphere Streams後分析縮短至3小時至15分鐘不等。台灣將與產業夥伴合作,鎖定金融、電子、醫療及政府等產業。

熱門新聞

Advertisement