為了增強大資料應用方案的實力,Dell在2014年3月併購1984年成立的StatSoft,該公司旗下產品洋洋灑灑,有30套之多,當中包含資料採礦、文字採礦、資料倉儲、平衡計分卡、決策管理平臺、文管系統,也有企業級的應用伺服器,都冠上Statistica系列名稱,因此也可統稱為Statistica,目前全球採用這套方案的公司或單位,已超過1百萬個。去年5月Statistica推出12.7版之後,到了10月,Dell正式發表了13版。

與同類型產品相比,Statistica的特色,不僅訴求簡單易用,更在於整合了R語言,而且使用者不需要撰寫程式碼,就能運用這個在大資料分析界相當知名的開放原始碼程式語言,因此,可便於測試全新開發或用途非常專屬的演算法;再加上,有不同領域的專家在R語言上面,貢獻了許多分析套件,使得支援R的Statistica也就因此能順勢使用這些工具。

除此之外,Statistica還可支援許多資料應用,例如混合不同資料、內容的探查,以及提供進階分析、預測性分析的工具,協助用戶預先掌握未來趨勢、新興客戶與銷售商機,並可運用假設性的情境模擬功能,來探索各種決策的可能性,也能用來預防受到有心人士詐騙的機率與其他業務風險。

而在新推出的13版中,Statistica主要的變化在於圖形使用者介面全部重新設計,力求大幅降低操作複雜度,並改良呈現方式。例如,將8種主要功能類型,像是分析、資料來源、建模、發行等操作項目,都配置了不同顏色的專用圖示。同時,Statistica全系列產品還內建圖形化的工作區,透過節點設置與拉線連結,協助使用者管理分析流程。此外,Dell也更新了當中的R語言程式碼使用介面,以及Statistica Visual Basic節點,對於工作區當中的節點物件,系統也提供許多參數欄位,使用者想要檢視與修改裡面的設定值,也變得更為容易。

Statistica 13提供圖形化程度相當高的工作區,分析人員可用滑鼠即拖即放指定的功能圖示,建立工作流程。

這套商用進階分析系統的新版,也進一步整合近期新增的互動圖形化與儀表板引擎(Interactive Visualization and Dashboard),協助資料的使用者彼此溝通。

想要掌握產品的年收入狀況,分析師可透過Statistica產生矩形式樹狀結構圖,即可檢視不同區域的表現;同時,還可以搭配分布圖,檢視是否達到銷售目標。

針對不同的投資組合,Statistica能用多張圖表來顯示績效走勢。

使用者能在這套系統上,產生堆疊圖來呈現長期持有股票市值的績效。

這套系統也提供地理位置分布圖的資料內容呈現形式。

Statistica系統可將股市資訊以熱力圖的形式呈現。

分析人員可在Statistica系統中,產生組合圖(Combination Graph)。圖中所呈現的資料是燭臺、針的統計資訊,以及它們的分布範圍與參考線。

現在Statistica與R語言的整合,也更為緊密,使用者想要藉此分享程式碼,或是透過程式碼來控制資料的處理,將更為簡便。

這套產品同時提供新的建模工具,用戶可逐步設定操作,透過一個個步驟的項目引導,推薦出最佳的資料分析模型。

另一個13版所不能忽略的特色是,Statistica新增了名為原生分散式分析(Native Distributed Analytics,NDA)的功能,又稱為資料庫內分析(In-database analytics),顧名思義,使用者可直接在資料庫中,就地執行分析,這有助於Statistica系統面對大型且不斷成長的資料集時,也能具有很不錯的工作效率。

在NDA架構下,使用者可以直接到資料所在地,套用預測性的演算法和評分機制,原本需將資料傳送到中央儲存庫的時間和費用,現在能以這種作法來降低,等於是把資料推送到分析機制的傳統處理方式,改成將分析機制推送到資料所在的中繼伺服器或個人電腦當中,而企業也可以因此更充分地運用Hadoop叢集、資料庫應用設備,以及其他高效能系統平臺的功能。而在系統的邊緣端就做好分析的工作,就能夠因應極大規模的資料處理需求。

至於NDA所支援的資料庫系統類型,以Statistica 13版而言,目前主要針對的是微軟SQL Server,其他資料庫系統的支援將會在後續版本當中提供。

具備更多資料分析功能

在其他資料分析功能上,新版Statistica系列也針對旗下三套產品,新增更多特色,分別是Stability & Shelf Life Analysis、Big Data Analytics、Web Data Entry。

以Stability & Shelf Life Analysis為例,它新增了殘留離群偵測、更多輸出選項,可指定輸出圖表X軸與Y軸的最小值、最大值與成長量,並對穩定性模型提供更多參數,可作為下游分析的表格之用。

而Big Data Analytics能夠在用戶建立資料模型時,新提供了一鍵部署到Hadoop系統的作法,而這個部署的選項,是在PMML(Predictive Model Markup Language)節點所在的工作空間頁面中

至於Statistica Web Data Entry,能為使用者提供以網頁瀏覽器登錄資料的作業方式,新版可複製既有範例資料,進而產生新的範例資料,並可允許修改、回存內容。同時,新版也加入了屬性資料(Attribute data)的支援。

此外,Statistica還提供逐步建模(Stepwise Modeling)的功能,使用者可一個個步驟執行,便於在過程中進行評估;文字探勘(Text Miner)能支援Unicode的文字資料,以及16種語言(包含簡體中文)。

在Statistica Data Miner的產品中,新版支援LASSO迴歸分析,對於最終的建模程序中最重要的預測點(predictors)子集,可協助辨識。同時,這套產品也擴增新的階層式演算法Tree Clustering──通常這項作法稱為聚合式階層分群法(Agglomerative Clustering)。

產品資訊

●原廠:Dell 00801-863-051

●建議售價:廠商未提供

●作業系統需求:Windows XP~8, Windows Server 2003~2008

●伺服器端硬體需求:1 GHz處理器、2 GB記憶體、2.5 GB硬碟空間

●個人端硬體需求:500 MHz處理器、512 MB記憶體

熱門新聞

Advertisement