91APP如何自建大數據模型與生成式AI，來強化會員經營和商品推薦機制

圖片來源:

洪政偉攝

零售系統解決方案商91APP產品長李昆謀回顧了近8、9年來，他們如何利用一系列數據技術來打造零售應用。尤其是，如何打造專屬臺灣零售業的生成式AI，並將技術應用打造成可規模化的商用產品。

利用統計方法與傳統AI/ML來應用數據

自2017年來，他們陸續推出NAPL、DCIU、PAVO等統計與機器學習模型，來分析會員數位足跡，進而強化零售業會員經營。在生成式AI時代到來的如今，這些模型依然是有效且重要的會員經營工具。

NAPL最早推出，是以交易數據為基礎的數據分析模型，將一年內有消費的會員分為不同活躍度分類，包括首購（New）、活躍（Active）、沈睡（Potentiall），以及流失（Lost）。至於如何定義N、A、P、L的會員分類，他們根據回購周期、回購貢獻金額、整體活躍度等指標算出，以3倍購買周期時間為調整會員分類的分水嶺，對於分眾行銷效果最佳。

李昆謀表示，這種分類方法下，通常一年內有消費的會員，也就是NAPL類會員，只有品牌約30%。其他會員包括超過一年沒有購物的封存會員（Sealed），占人數40%，還有註冊後未消費的會員（Ready to buy），占總人數30%。業績占比來說，NAP三類會員只占2成人數，卻能帶來80%業績。「有效辨別出活躍、高貢獻分類的會員，對精準行銷幫助很大。」他說。

DCIU則是以行為數據為基礎的ML模型。91APP會蒐集一系列顧客旅程中的行為，用ML演算法將顧客購買意圖分類為最高購買意圖（Decided）、高購買意圖（Considering）、低購買意圖（Interested），以及無購買意圖（Un-interested）。

DCIU模式下，D類會員人數不到2%，卻能貢獻5成業績，C類會員則占5%人數，貢獻近2成業績。李昆謀說，理論上，零售業者能鎖定僅7%的高消費意圖會員人口，來集中行銷資源。

他並將NAPL和DCIU分別比喻為CRM模型和CDP模型。前者是在顧客購物後，用歸納的方法來觀察顧客位於「整體生命周期」的哪個階段，後者則是在顧客購物前，根據行為模式預測顧客位於「單次購買周期」的哪個階段。兩者交叉運用，還能更細緻的分析顧客族群，並找出更精準的行銷方法。

舉例來說，流失會員挽回是一件困難的事，但透過NAPL和DCIU模型，可以鎖定較有可能挽回的族群。利用NAPL模型找出即將流失的會員（L），再放到DCIU模型來看，找出少數具備高購買意圖（D或C）的族群。

隨著OMO零售浪潮到來，他們還推出分析OMO足跡來判斷會員類型的PAVO統計模型，把會員分類為單通路、跨通路，以及線下瀏覽線上購物、線上瀏覽線下購物等，為會員購物模式分析增加更多維度。

開始發展零售業專屬生成式AI技術

2022年底，ChatGPT橫空出世，91APP緊急重寫2023年度計畫，決心在3個月內做出GAI應用。初期做法是，串接OpenAI API，打造商品文案生成、行銷訊息文案生成、Email生成、數據洞察報告生成、消費者商品評論模板生成等，一系列基礎的生成式AI應用。

儘管客戶對於這些GAI應用的回饋良好，李昆謀仍希望能打造專屬91APP的零售GAI技術。2023年6月，他嘗試將文章轉成嵌入向量（Embedding Vector），來進行關聯性比較，進而強化搜尋和資料整理等功能，決定如法炮製，將零售商品特徵轉成向量。初步實驗發現，「我們原本分群模型有幾十個辛苦抽取的特徵維度，結果用Embedding Model（嵌入模型）一口氣提取出上百個數據維度之後，不用改其他技術，馬上提升了效果。」

於是，數據科學家團隊捨棄原本打造傳統ML模型的計畫，開始從頭研究生成式AI技術，嘗試打造一個ChatGPT外掛，結合嵌入向量來搜尋出高相關性資訊，再讓ChatGPT來生成零售相關問題的回應。

歷時3個月，研究2、30篇論文，資料科學家團隊打造出ChatGPT外掛商店中，第一個來自亞洲的電商類外掛Jooii能提供購物推薦。年底，檢索增強生成（RAG，Retrieval-Augmented Generation）技術獲得更多關注時，李昆謀才驚覺，這正是他們過往幾個月在做的事情。

確定技術發展方向正確後，他們打算將Jooii從ChatGPT外掛，升級為一整套建構在自家環境的零售生成式AI機制，搭配可用自然語言操作的對話介面，串接91APP不同電商系統和資料庫，以及公有雲平臺上Gemini、GPT及Claude系列的LLM。

為了讓LLM能利用RAG來更準確檢索數據，並應用於各式各樣的推薦場景，91APP數據科學團隊自行打造出一個「三塔模型」。

傳統的推薦系統，常常使用雙塔模型，比較兩個分類的特徵值，找出相似性較高的配對。以零售業而言，兩座塔的數據分類通常是「顧客」與「商品」。三塔模型則增加一個了「標籤」分類，讓RAG機制可以檢索出更符合購物情境的標籤數據，來生成回答。

李昆謀進一步解釋，「標籤」分類包含語言以及商品產業別等情境標籤。舉例來說，「巧克力」在食品產業的語境是食物，在服飾業的語境則是顏色，這些資訊需要用標籤來告訴模型。91APP於向量空間中濃縮了2、3千種特徵維度，來輔助人與商品的配對。他坦言，產生這些標籤，是相當繁雜的半人工作業，多是根據零售專業知識和統計學做法，或者是根據一條條規則式算法，從顧客與商品數據計算出具有情境意義的標籤。

產出這些標籤，還不能直接放進三塔模型中比較。這是因為，標籤量太龐大、種類又多元，會導致計算時間過長，且雜訊過多。經過一番研究，他們才成功將不同維度有效整合到3座塔的向量空間。再經過反覆實驗，研發出一套降維演算法，在幾乎不影響準確度的情況下，將3座塔的標籤統一降到512維度，再進行相似度比較。李昆謀表示，這套算法已經超出零售專業知識，而是他們在數學領域努力實驗出的成果，目前已經用專利保護。

將生成式AI技術化為商品來規模化經營

李昆謀表示，91APP有著許多大型零售客戶，把應用設計成可以承受大規模瞬間流量，已經是標準開發做法。打造生成式AI應用時，當然不例外。

突然有幾萬人要呼叫Jooii背後的推薦模型時，系統如何撐住？李昆謀直言：「通常撐不住。更何況，模型也需要時間計算，很難給出毫秒等級的回應。」

「標準解法是，預先產生資料來讓系統快取。」91APP的做法是，預先產出大量的三塔模型配對成果，儲存在數據倉儲中，用來回應較為常見的購物推薦情境，以消化瞬間大量請求。同時，模型會根據新匯入的顧客行為數據，不斷重新運算配對結果，回傳到資料倉儲中。

也就是說，當顧客看到預處理的推薦結果後，會產生點擊或未點擊等反應。模型則會根據反應重新運算。至於一名顧客要多久才能看到最新運算、更符合自己近期行為的推薦結果？這取決於顧客本身活躍程度。

這是因為，模型必須排續重新運算配對結果的優先程度，當顧客最近來訪頻率高，模型會優先重算。反之，當顧客不常到站，優先度就會較低。李昆謀坦言，重算優先度的規則，確實不容易掌握，他們仍在不斷調整。

現在，他們已經將Jooii用於許多不同應用，包括行銷受眾圈選、商品貼標、個人化推薦、商品文案生成等。他們更用Jooii來支援RMN的廣告業務，根據廣告行銷所需情境，來配對顧客、商品及標籤。

舉例來說，根據顧客和標籤數據，對已知顧客推薦特定類型商品。或是當廣告主希望獲得新客，Jooii會根據顧客和商品數據，配對出情境標籤，再根據這些標籤，匹配外部通路的顧客數據，找到相似受眾（Look-alike），並估算出受眾的消費力、愛用金流、價格敏感度等特徵。

也正因為他們擅長將技術打造成可規模化的商品，未來，他們計畫把Jooii作為一個IaaS產品，開放零售業客戶上傳自家訓練數據，來支援各自的GAI零售應用。

熱門新聞