繼2013年初推出英特爾專屬版Hadoop軟體,英特爾的大資料布局繼續加碼壓寶Hadoop,今年3月更宣布重金入股Hadoop企業版發行商Cloudera,且和Cloudera同時宣布,英特爾的股權投資使英特爾成為Cloudera的最大戰略股東,以及成為Cloudera董事會的成員之一。

據國外媒體報導,英特爾注資7.4億美元買下Cloudera 18%的股權。Cloudera近期也推出支援記憶體式(In-memory)大資料技術的Hadoop企業發行版。

IDC企業應用市場分析師高振偉表示,這是英特爾策略性的投資,不管是在伺服器和資料中心都是有幫助的。無論在大資料或是資料儲存的需求,英特爾此舉有助於資料中心在儲存上的發展,或是一種促成的投資。

精誠Etu團隊負責人蔣居裕認為,英特爾在投資Cloudera後,已經宣布原本獨立發展的IDH/IDP(Intel’s Distribution for Apache Hadoop/Intel Data Platform)在今年3月底發行v3.1後,就會併入建置Hadoop運算平臺的CDH(Cloudera Distribution Including Apache Hadoop),而後續不再獨立發展。也就是說,原本IDH/IDP的用戶,後續若要升級,未來可能將被迫採用CDH。

同時,蔣居裕也表示,另一方面,可以視英特爾此一投資舉動,是在Cloudera與Hortonworks兩大競合的Apache Hadoop開源陣營中,投下了象徵性的一票,Cloudera又得一分。往後CDH的發展,可以預期會加入更多善用英特爾晶片特性的功能。

Hadoop新發行版可幾近即時全文搜尋

Cloudera近期釋出Cloudera Enterprise 5正式版,此版本包含用來建置Hadoop運算平臺的CDH 5.0,以及管理平臺Cloudera Manager 5.0。

蔣居裕表示,CDH 5.0可以做到幾近即時(Real-time)的全文索引與搜尋,也提供記憶體式大資料處理技術。

新版的Cloudera Enterprise加強整合企業資料管理系統,包含提供企業資料中心的安全性、管理權,以及資料保護和管理等。

在安全性上,Cloudera Enterprise 5包含Cloudera Manager和Cloudera Navigator提供集中式安全性,來確認授權和第三方增設的安全性。

在資料管理上,Cloudera Enterprise 5提供YARN架構管理多重來源(Multiple Resources),讓以Hadoop為基礎的企業資料中心便於使用、瀏覽和管理。

另外,Cloudera Enterprise 5也內建審查管理,能夠提供企業關於使用者存取資料的相關記錄報告。

蔣居裕表示,相較於前一版本的CDH 4.6,CDH 5.0內建更多的Hadoop Ecosystem功能模組,例如,Cloudera搜尋引擎(Cloudera Search)整合Apache Solr的搜尋功能,可以達到幾近即時全文索引與搜尋的效果。

此外,他也表示,Cloudera Impala讓儲存在Hadoop上的大資料也可以有MPP(Massively Parallel Processing)SQL的互動查詢功能。

蔣居裕認為, 隨著Cloudera Search與Cloudera Impala而來的簡易使用性,讓Hadoop藉由具有普遍需求性的搜尋與SQL查詢功能進到企業市場,將讓企業擁抱大資料應用的門檻大為降低。為此,也將帶動企業在Hadoop新工具教育訓練與導入顧問服務的需求。

CDH 5.0提供In-memory大資料處理技術

在功能元件上,CDH 5.0也新增Apache Spark,提供記憶體式大資料處理技術。

另外,CDH 5.0除了包含Hadoop 2版本(MapReduce v2 over YARN)外,也可以讓使用者啟動往前相容的MapReduce v1模式,但是新舊模式並不能夠同時執行於同一叢集節點上。

蔣居裕表示,整體而言,所有內建的Hadoop Ecosystem模組均有版本更新,在效能、安全性,以及強固性上,也都有進步。

蔣居裕也表示,精誠Etu團隊預計會在2014年年底推出新一代產品,且在其中整合CDH 5.0。

熱門新聞

Advertisement