SAS揭露創新實驗室3大重點,其一是延續去年強調的數位雙生,整合了智能助理Copilot,使用者可用自然語言提示,來獲得模擬預測的可能狀態。

圖片來源: 

攝影/王若樸

在今年度Innovate 2024年會最後一日上,SAS揭露創新實驗室發展亮點,包括數位雙生、實體整合(Entity resolution)和量子運算等3大主軸。其中,數位雙生就像是企業的分身,可透過數位方式預測特定情境下的運行變化,實體整合則指將零散、有缺失的資料歸戶到同一個實體,量子運算則可用來加速複雜運算,如腎臟移植匹配。同時,SAS也說明新產品合作生態系,像是聯手英特爾提供硬體加速,來更快執行SAS平臺服務,包括已使用英特爾最新發布的AI晶片Gaudi 3來與客戶進行PoC驗證,以及整合至微軟去年推出的Fabric資料分析平臺,來提供原生的SAS資料處理功能。

鎖定數位雙生、實體整合和量子運算3大創新方向

SAS近年產品策略聚焦AI,不只在主力產品雲端資料分析平臺Viya上添加AI模型生命周期管理功能和服務,今年更深化AI產品線,揭露合成資料生成器、AI應用開發工具和更多生成式AI功能,同時也擴展AI監管工具和治理顧問服務,要讓AI產品線更完善。

在創新部分,他們延續2023年提出的數位雙生主軸,今年也將數位雙生納入發展重點。SAS執行長辦公室執行副總裁Gavin Day表示,數位雙生是將實體物件虛擬化模擬的作法,可用來預測特定條件下的可能變化。現場以一家大型零售廠商為例,使用者可在SAS平臺儀表板上檢視物流、供應鏈和整體表現數據,還能透過Copilot智能助理,來詢問、模擬不同決策的可能狀況,比如分部工廠將關廠30天,可能帶來的收益和服務影響(如下圖)。

另一創新重點是實體整合,這是一種將分散的資訊歸戶到同一個實體(Entity)的作法,又可稱為數據匹配。Gavin Day指出,實體整合很重要,對AI發展尤是如此,因為透過數據匹配、將零散的資料清理乾淨,就能降低「Garbage in,garbage out」的窘境。SAS資深資料科學家Charles Cavalier舉例,實體整合可用於資料歸戶,比如在教育資料、駕照、醫療資料等各種政府資料中,從眾多類似人名的資料卡中正確歸納出特定民眾資訊,甚至能因此補足原本單一類別缺失的資料。(如下圖)

在實際應用上,就有機構用來偵測稅務詐欺,透過實體整合來分析稅務紀錄,進而避免大量損失。

至於實體整合的下一步,Charles Cavalier透露,SAS AI建模團隊打算建置Transformer小型語言模型,作為基礎模型,接著對模型做實體整合任務微調,讓模型學會實體分類。

他也表示,這類實體整合應用適用於企業、服務商或醫療機構。團隊目前正研究生成式資料處理技術和深度嵌入,搭配這些技術,就能用來在不同資料集中找出同一個實體的描述紀錄,就像是資料歸戶,另也能用於搜尋任務。之後,SAS計畫將這些能力整合到既有產品中。

最後一項創新主軸是量子運算。SAS以腎臟捐贈配對為例,通常三分之一的捐贈者和受贈者無法第一次就配對成功,為解決這個問題,他們使用圖學,用點來代表捐贈者,以邊(點與點之間的直線距離)代表捐贈者與受贈者的匹配程度,並從這些點與邊形成的網路中,找出最合適的腎臟移植配對(如下圖)。

這需要大量複雜的運算,就算是傳統優化過的運算,得要180秒才能得出99.4%的最佳解,但用量子運算加速,30秒就能找出100%的最佳解(如下圖)。

與英特爾、微軟合作生態系新方向瞄準硬體加速和軟體整合

另一方面,SAS也揭露支撐自家產品線的合作生態系,包括聯手英特爾,使用其硬體來加速分析平臺執行時間,甚至也開始使用最新發布的Gaudi 3處理器,來與進行PoC驗證。再來,已成為策略合作伙伴4年的微軟,在今年進一步整合軟體服務,SAS自家的決策建立器Decision Builder可在微軟去年上線的資料分析平臺Microsoft Fabric中使用,尤其使用者可使用SAS原生功能,一站式快速建模、處理資料和管理邏輯。(如下圖)

熱門新聞

Advertisement