攝影/王若樸
現今每個人幾乎都與智慧裝置不離身,不論是智慧型手機、平板電腦、筆電還是傳統桌電,都是如此。但不管是打開手機還是電腦,在瀏覽App商店、網購網站或其他網頁時,總會希望頁面呈現的是自己有興趣的項目。而目前能滿足這個需求的技術之一,就是推薦系統(Recommendation Systems)。Google AI首席研究員紀懷新於7月4日訪臺時,分享了自己在Google研究推薦系統的心得。
建立個人化推薦系統的困難
紀懷新表示,個人化是建立推薦系統的首要條件,因為每個人喜好不同,會瀏覽的項目也就不同,如果給兩個興趣截然不同的人推薦相同商品,那推薦就沒意義了,因此個人化是打造推薦系統的第一要件。但是,要推薦什麼樣的產品給使用者,對開發人員來說是一大挑戰。
首先,龐大的產品數量就是一個問題,紀懷新以Google Play商店的應用程式推薦為例,他說,在Google Play中的應用程式超過100萬個,而且有上億個來自190國的使用者,光是去年就有820億的下載次數,這樣龐大的資料要做到個人化推薦,不只需要複雜的演算法,還需要能應付這些運算的硬體設備。不過他表示,就方法來說,深度學習正好能處理龐大的數據,而在Google研發推薦系統的研究人員,也採用這個方法來精進推薦系統。
再來,個人化推薦系統的另一個問題,就是情境(Context)。情境不同,使用者想要的推薦內容也就不一樣。紀懷新舉例,有些人喜歡用平板裝置看電影,手機則用來看YouTube之類的影片,而這些人在不同裝置上想下載的App就會不一樣,而對於推薦需求,也會有所不同。
但紀懷新認為,個人化推薦系統將情境因素納入考量後,最困難的部分就在於「時間」。比如,一個人在白天時,較常用新聞或理財類的App,晚上則喜歡用遊戲類App來放鬆;又或者今年流行精靈類的遊戲App,明年流行策略性質的戰爭遊戲。這種動態性的變化,讓打造個人化推薦系統的難度又更高了。
建立個人化推薦系統的關鍵
綜合以上三點,紀懷新表示,Google用來建立個人化推薦系統的方式,就是將使用者與情境、App項目和時間點來配對。而他也強調,要提升推薦品質,就必須平衡冪次定律(Power Law)帶來的影響。
冪次定律指的是在一個事件的發展中,其規模與次數成反比,也就是規模越大,次數就越少。而以網路服務的角度來說,冪次定律指的是20%的使用者產生了80%的資料量。也因為冪次定律帶來不平衡的分布狀態,紀懷新表示,Google團隊在做推薦系統時,會重新平衡分布情況(如下圖)。
他指出,重新平衡不同使用頻率的推薦系統,讓Google Play上應用程式的安裝率提高3.3%。
個人化推薦系統的研究方向
紀懷新認為,要精進個人化推薦系統,必須注重「因果關係」,而不是只考量變數與變數之間的相關性(Correlation)。他解釋,許多統計和計算研究員,常將焦點擺在相關性,但在推薦系統裡,應該要思考因果關係,也就是事件B是否由事件A造成。如果某人因為推薦系統的建議,而做了某些動作,「這就是我們要知道的。」
不過他也提到,在過去4、5年裡,自己一直在思考如何解決因果關係的難題,後來發現「重複出現」(Recurrence)是關鍵。他表示,重複出現在自然界中很常見,不論是空間還是時間,而從神經網路的模型來看,也有類似概念,比如Recurrent units,也就是將輸入-輸出的值,再當作輸入的值,重複使用,就像時鐘一樣。紀懷新舉例,這就好像一個使用者固定每天晚上九點看新聞,而開發人員只要掌握這一點,就能了解因果關係,做出更好的推薦系統。
熱門新聞
2025-01-06
2025-01-07
2025-01-08
2025-01-08
2025-01-06