生成式AI應用已成各科技大廠技術年會的標配,除了它,還有哪些技術能讓人耳目一新?
轉型為AI工具供應商的老牌數據分析大廠SAS在今年度Innovate 2024大會上,不意外地力擁生成式AI,發表智能開發助理、合成資料產生器、AI應用開發工具和更多生成式AI功能,同時也擴展AI監管工具和治理顧問服務,來鞏固AI產品線。
但在年會最後一天,他們揭露創新實驗室發展亮點,瞄準未來趨勢,包括數位雙生、實體整合(Entity resolution)和量子運算等3大主軸。
其中,數位雙生就像是企業的分身,可透過數位方式預測特定情境下的運行變化,實體整合則指將零散、有缺失的資料歸戶到同一個實體,量子運算則可用來加速原本耗時的複雜運算,如腎臟移植匹配。
創新亮點1:數位雙生
數位雙生並非第一次出現在SAS年會上。2023年,SAS技術長Bryan Harris在該年年會上就強調數位雙生,透過建置企業的數位身分,包括組織人事、營運細節、進銷貨、物流等關鍵數據,就能用來模擬「假如......會怎樣?」的情境,尤其是企業業務中斷的模擬,或供應鏈發生問題時的衝擊預測,來加速企業的反應能力。
今年,SAS執行長辦公室執行副總裁Gavin Day延續這個主軸,進一步說明,數位雙生是將實體資產虛擬化模擬的作法,如建築、人、組織等,可用來模擬、預測特定條件下的可能變化。現場以一家大型零售廠商為例,該廠使用者可在SAS平臺儀表板上,檢視物流、供應鏈和整體表現數據。甚至,SAS本次揭露的Viya Copilot智能助理,還整合數位雙生,能在平臺上自動提示使用者營收和生產變化,比如根據最新資訊預測,整體營收可達到89萬美金,但某項產品可能無法達到預期生產量,並給出具體的缺失數量。接著,使用者可詢問這個缺失何時會發生,助理就會給出詳細月份,供企業預先準備。
另一方面,使用者也能透過智能助理,來詢問、模擬不同決策的可能狀況,比如決策者接受公司訊息通知,分部工廠將關廠30天,此時就能詢問智能助理,關廠30天可能帶來的收益和服務衝擊。又或是,這個關廠對某項產品的買一送一促銷活動,有何影響。
在這些問題背後,系統會進行一連串模擬運算,並在給出智能助理文字回答的同時,也會在平臺儀表板上,顯示各項指標的預測數字,如獲利、營收、服務水準和生產單位等。
創新亮點2:實體整合
實體整合(Entity resolution)是指將來自不同系統的資料,整合、歸戶到同一實體上,比如將州政府各個系統的人物資料,彙整為完整的單一檔案。(圖片來源/SAS)
另一創新重點是實體整合,這是一種將來自不同系統的分散資訊,歸戶到同一個實體(Entity)的作法,又可稱為數據匹配。Gavin Day指出,實體整合很重要,不只能獲得一個完整的實體數據,對AI開發來說,更能達到資料清理的效用。因為透過數據匹配、將零散的資料歸戶清理乾淨,就能降低「Garbage in,garbage out」的窘境。
SAS資深資料科學家Charles Cavalier現場舉例,實體整合可用於資料歸戶,比如美國各個州政府系統中,有著各式各樣的民眾資料,如教育資料、駕照、醫療資料、稅收資料等,同一位民眾在不同系統的資料,可能以不同姓名寫法呈現(如縮寫),或可能缺失某些重要資訊(如電話中間碼、車牌號碼等)。但透過深度學習等方法,從不同系統中、眾多類似人名的資料裡,正確歸納出特定個人的完整資訊,這就是實體整合。實體整合使用到的技術,則包括機器學習、深度學習和圖類神經網路等,Charles Cavalier強調,原本在單一類別或系統中缺失的資料(如電話、教育程度等),甚至能因實體整合而補足。
在實際應用上,就有國家政府機關,使用SAS Viya平臺和實體整合功能,來進行網路分析,進一步揪出稅務詐欺模式,他們也因此補足了60億筆稅務紀錄,也因抓出逃漏稅、獲得了額外的6.35億美元稅收。
至於實體整合的下一步,Charles Cavalier透露,SAS AI建模團隊打算建置Transformer小型語言模型,作為基礎模型,接著對模型做實體整合任務微調,來讓模型學會實體分類,進一步提高實體整合的能力。他也表示,團隊目前正研究生成式資料處理技術和深度嵌入,搭配這些技術,就能用來在不同資料集中找出同一個實體的描述紀錄,就像是資料歸戶,另也能用於搜尋任務。之後,SAS計畫將這些能力整合到既有產品中。
創新亮點3:量子運算
最後一項創新主軸是量子運算。早在年會開幕式上,Bryan Harris就揭露量子運算將是接下來SAS創新實驗室的重點發展,而且,「我們實驗發現,透過結合量子運算和傳統運算的混合運算架構,能大幅改善運算結果。」他也表示,量子運算在未來1、2年的發展,就會像是生成式AI之於AI一樣,帶來翻天覆地的變化。
而SAS應用AI暨建模部門總監Jinxin Yi現場以腎臟捐贈配對為例,來說明量子運算加速後的運算結果。
他表示,就腎臟移植配對來說,通常三分之一的捐贈者和受贈者無法第一次就配對成功。為解決這個問題,常見的做法是使用圖學,用點來代表捐贈者,以邊(點與點之間的直線距離)代表捐贈者與受贈者的匹配程度,並從這些點與邊形成的網路中,找出最合適的腎臟移植配對候選組,這個候選組可由好幾個點(即捐贈者與受贈者)組成。SAS團隊就採這種方法來計算。
但這種方法,這需要大量且複雜的運算,就算是用SAS本身優化過的運算方法,也得要180秒才能得出99.4%的最佳解。但使用SAS打造的量子解算器,30秒就能找出100%的最佳解。
SAS創新實驗室力推量子運算,以腎臟移植為例,為找出最合適的移植配對組,用量子解算器加速後,取得最佳解的時間可縮短為30秒。(圖片來源/SAS)
熱門新聞
2024-12-27
2024-12-24
2024-11-29
2024-12-22
2024-12-20