圖片來源: 

洪政偉攝

零售系統解決方案商91APP產品長李昆謀回顧了近8、9年來,他們如何利用一系列數據技術來打造零售應用。尤其是,如何打造專屬臺灣零售業的生成式AI,並將技術應用打造成可規模化的商用產品。

利用統計方法與傳統AI/ML來應用數據

自2017年來,他們陸續推出NAPL、DCIU、PAVO等統計與機器學習模型,來分析會員數位足跡,進而強化零售業會員經營。在生成式AI時代到來的如今,這些模型依然是有效且重要的會員經營工具。

NAPL最早推出,是以交易數據為基礎的數據分析模型,將一年內有消費的會員分為不同活躍度分類,包括首購(New) 、 活躍(Active) 、沈睡(Potentiall),以及流失(Lost)。至於如何定義N、A、P、L的會員分類,他們根據回購周期、回購貢獻金額、整體活躍度等指標算出,以3倍購買周期時間為調整會員分類的分水嶺,對於分眾行銷效果最佳。

李昆謀表示,這種分類方法下,通常一年內有消費的會員,也就是NAPL類會員,只有品牌約30%。其他會員包括超過一年沒有購物的封存會員(Sealed),占人數40%,還有註冊後未消費的會員(Ready to buy),占總人數30%。業績占比來說,NAP三類會員只占2成人數,卻能帶來80%業績。「有效辨別出活躍、高貢獻分類的會員,對精準行銷幫助很大。」他說。

DCIU則是以行為數據為基礎的ML模型。91APP會蒐集一系列顧客旅程中的行為,用ML演算法將顧客購買意圖分類為最高購買意圖 (Decided)、高購買意圖(Considering)、低購買意圖(Interested),以及無購買意圖(Un-interested)。

DCIU模式下,D類會員人數不到2%,卻能貢獻5成業績,C類會員則占5%人數,貢獻近2成業績。李昆謀說,理論上,零售業者能鎖定僅7%的高消費意圖會員人口,來集中行銷資源。

他並將NAPL和DCIU分別比喻為CRM模型和CDP模型。前者是在顧客購物後,用歸納的方法來觀察顧客位於「整體生命周期」的哪個階段,後者則是在顧客購物前,根據行為模式預測顧客位於「單次購買周期」的哪個階段。兩者交叉運用,還能更細緻的分析顧客族群,並找出更精準的行銷方法。

舉例來說,流失會員挽回是一件困難的事,但透過NAPL和DCIU模型,可以鎖定較有可能挽回的族群。利用NAPL模型找出即將流失的會員(L),再放到DCIU模型來看,找出少數具備高購買意圖(D或C)的族群。

隨著OMO零售浪潮到來,他們還推出分析OMO足跡來判斷會員類型的PAVO統計模型,把會員分類為單通路、跨通路,以及線下瀏覽線上購物、線上瀏覽線下購物等,為會員購物模式分析增加更多維度。

開始發展零售業專屬生成式AI技術

2022年底,ChatGPT橫空出世,91APP緊急重寫2023年度計畫,決心在3個月內做出GAI應用。初期做法是,串接OpenAI API,打造商品文案生成、行銷訊息文案生成、Email生成、數據洞察報告生成、消費者商品評論模板生成等,一系列基礎的生成式AI應用。

儘管客戶對於這些GAI應用的回饋良好,李昆謀仍希望能打造專屬91APP的零售GAI技術。2023年6月,他看到OpenAI將文章轉成嵌入向量(Embedding Vector),來進行關聯性比較,進而強化搜尋和資料整理等功能,決定如法炮製,將零售商品特徵轉成向量。初步實驗發現,「我們原本分群模型有幾十個辛苦抽取的特徵維度,結果用Embedding Model(嵌入模型)一口氣提取出上百個數據維度之後,不用改其他技術,馬上提升了效果。」

於是,數據科學家團隊捨棄原本打造傳統ML模型的計畫,開始從頭研究生成式AI技術,嘗試打造一個ChatGPT外掛,結合嵌入向量來搜尋出高相關性資訊,再讓ChatGPT來生成零售相關問題的回應。

歷時3個月,研究2、30篇論文,資料科學家團隊打造出ChatGPT外掛商店中,第一個來自亞洲的電商類外掛Jooii能提供購物推薦。年底,檢索增強生成(RAG,Retrieval-Augmented Generation)技術獲得更多關注時,李昆謀才驚覺,這正是他們過往幾個月在做的事情。

確定技術發展方向正確後,他們打算將Jooii從ChatGPT外掛,升級為一整套建構在自家環境的零售生成式AI機制,搭配可用自然語言操作的對話介面,串接91APP不同電商系統和資料庫,以及公有雲平臺上Gemini、GPT及Claude系列的LLM。

為了讓LLM能利用RAG來更準確檢索數據,並應用於各式各樣的推薦場景,91APP數據科學團隊自行打造出一個「三塔模型」。

傳統的推薦系統,常常使用雙塔模型,比較兩個分類的特徵值,找出相似性較高的配對。以零售業而言,兩座塔的數據分類通常是「顧客」與「商品」。三塔模型則增加一個了「標籤」分類,讓RAG機制可以檢索出更符合購物情境的標籤數據,來生成回答。

李昆謀進一步解釋,「標籤」分類包含語言以及商品產業別等情境標籤。舉例來說,「巧克力」在食品產業的語境是食物,在服飾業的語境則是顏色,這些資訊需要用標籤來告訴模型。91APP於向量空間中濃縮了2、3千種特徵維度,來輔助人與商品的配對。他坦言,產生這些標籤,是相當繁雜的半人工作業,多是根據零售專業知識和統計學做法,或者是根據一條條規則式算法,從顧客與商品數據計算出具有情境意義的標籤。

產出這些標籤,還不能直接放進三塔模型中比較。這是因為,標籤量太龐大、種類又多元,會導致計算時間過長,且雜訊過多。經過一番研究,他們才成功將不同維度有效整合到3座塔的向量空間。再經過反覆實驗,研發出一套降維演算法,在幾乎不影響準確度的情況下,將3座塔的標籤統一降到512維度,再進行相似度比較。李昆謀表示,這套算法已經超出零售專業知識,而是他們在數學領域努力實驗出的成果,目前已經用專利保護。

將生成式AI技術化為商品來規模化經營

李昆謀表示,91APP有著許多大型零售客戶,把應用設計成可以承受大規模瞬間流量,已經是標準開發做法。打造生成式AI應用時,當然不例外。

突然有幾萬人要呼叫Jooii背後的推薦模型時,系統如何撐住?李昆謀直言:「通常撐不住。更何況,模型也需要時間計算,很難給出毫秒等級的回應。」

「標準解法是,預先產生資料來讓系統快取。」91APP的做法是,預先產出大量的三塔模型配對成果,儲存在數據倉儲中,用來回應較為常見的購物推薦情境,以消化瞬間大量請求。同時,模型會根據新匯入的顧客行為數據,不斷重新運算配對結果,回傳到資料倉儲中。

也就是說,當顧客看到預處理的推薦結果後,會產生點擊或未點擊等反應。模型則會根據反應重新運算。至於一名顧客要多久才能看到最新運算、更符合自己近期行為的推薦結果?這取決於顧客本身活躍程度。

這是因為,模型必須排續重新運算配對結果的優先程度,當顧客最近來訪頻率高,模型會優先重算。反之,當顧客不常到站,優先度就會較低。李昆謀坦言,重算優先度的規則,確實不容易掌握,他們仍在不斷調整。

現在,他們已經將Jooii用於許多不同應用,包括行銷受眾圈選、商品貼標、個人化推薦、商品文案生成等。他們更用Jooii來支援RMN的廣告業務,根據廣告行銷所需情境,來配對顧客、商品及標籤。

舉例來說,根據顧客和標籤數據,對已知顧客推薦特定類型商品。或是當廣告主希望獲得新客,Jooii會根據顧客和商品數據,配對出情境標籤,再根據這些標籤,匹配外部通路的顧客數據,找到相似受眾(Look-alike),並估算出受眾的消費力、愛用金流、價格敏感度等特徵。

也正因為他們擅長將技術打造成可規模化的商品,未來,他們計畫把Jooii作為一個IaaS產品,開放零售業客戶上傳自家訓練數據,來支援各自的GAI零售應用。

熱門新聞

Advertisement