【AI藍圖8大方向首度公開】LINE如何轉型成一家AI公司？

LINE首度揭露自家AI藍圖，主要聚焦8大類AI領域：自然語言處理（NLU）、語音辨識（Speech）、電腦視覺（Vision）、OCR、臉部識別（Face）、影音處理（Video）、資料分析（Data），以及語音合成（Voice）。從這八大類再延伸一層就是該類的主要AI技術（綠色字）。圖片來源／LINE

「現在，LINE已經是一家AI公司。」今年6月，LINE共同執行長慎重熩（Jungho Shin）在年度大會中，揭露了LINE下一階段發展的新定位。LINE不只是一家大量使用AI技術的公司，更開始要轉型成銷售AI，甚至未來要靠AI產品獲利的公司。甚至在11月中，日本雅虎與日本LINE正式宣布經營權整併計畫的記者會上，Line社長出澤剛更訂出了新的戰略目標，未來要成為日本，甚至是亞洲領先的AI公司。

但是，LINE要如何實現這個目標？單從6月年度大會中，令人驚艷的AI餐廳訂位服務DEUT實際展示，或是7月開始上路銷售的商用AI計畫LINE Brain描述，還不足以證明LINE的AI實力，直到11月20日的LINE開發者大會，終於揭露了更詳細的AI戰略藍圖，甚至是各項LINE自家AI技術、相關產品、內部應用的AI火力大展示，連這次開發者大會3千人的報到過程，也採用了LINE Brain自家的臉部辨識服務，來進行報到入場。

不同於去年主打區塊鏈架構和代幣經濟，朴懿彬強調，LINE的新發展策略是「LIFE with LINE」，要讓使用者生活與LINE平臺有更多連結，包括了金融科技、商務、O2O生活、內容與娛樂領域，都可以提供更便利的數位生活，也希望利用AI，讓他們所提供的服務形式更自然、更人性化。

例如在與生活息息相關的金融服務上，LINE已有多項成果，包括保險服務上路半年就取得17萬張保單，LINE Score達成百萬用戶註冊只用了19天、家計簿服務用戶數在9月時超過了4百萬人。金融服務類型也正式新增了證券服務、電子錢包和加密貨幣交易所。LINE Pay日本用戶規模更達到了3,700萬人，若加上了臺灣、韓國、中國、泰國等市場，全球用戶合計是5千萬人，全球交易總額已經超過1兆日圓。LINE全球每月活躍用戶數，在今年11月時也達到了1.85億人。

從即時通訊軟體、內容平臺到App生態系

LINE從2011年問世，前幾年以擴大市場、支援平臺、搶攻用戶為主要發展目標，2016年開始轉而聚焦內容服務，以智慧入口（Smart Portal）為新的戰略目標，也開始開放自家平臺，陸續釋出API供外部服務串連，先從LINE Login機制開始，後續如Messaging API、LINE Beacon、Rich menu API、Flex Message、Quick Reply、LINE Things等，2018年甚至開始推出通用型的開發框架工具，例如2018年6月推出第一版的LIFF（LINE Front-end Framework）、遊戲開發框架Quick Game、物聯網開發框架LINE Things，而今年10月，LIFF也升級為第二版。

為了與生活場景有更多連結，朴懿彬表示，今年進一步推出了LINE MINI App應用程式發布平臺。這個發布平臺，讓LINE不只是第三方服務串連的集散地，更成為了部署和執行各種第三方平臺的新App生態圈。

原先用LINE API開發的服務，現在都可以直接整合到LINE上，用戶也可以透過搜尋找到這些第三方提供的App服務，還新增了免費官方帳號系統通知功能，舉凡出貨通知、到貨通知等，現在都可以直接推播到與使用者溝通的官方帳號中。

2017年開始全力布局AI

這些與生活息息相關的服務和功能，都需要大量的AI相關技術來優化。擁有龐大用戶和資料量的LINE，很早就開始擁抱大數據技術和機器學習技術，例如在搜尋、推薦、廣告等。到了發展智慧入口網站，更是大力擁抱各種AI技術，來改善自家的服務或產品。

2017年3月，LINE從內容平臺，正式跨入了AI市場，和母公司Naver聯手開發，在MWC大會上發表了自家第一款雲端AI平臺Clova，名稱取自Cloud Virtual Assistant的縮寫組合，意指LINE從智慧助理技術和產品切入火紅的市場競爭，當年隨後也推出了智慧喇叭，頗受好評，但受限於支援語言初期先以日語、韓語為主，遲遲難以推向海外市場。但，這只是LINE日後新AI布局的藍圖一角。

不只是新AI平臺產品的登場，LINE更在內部，大力揭露未來的戰略方向就是AI，提供大量線上課程，來培養內部人力的AI能力。例如，LINE臺灣工程團隊也是因此開始接觸AI技術，找來種子成員，自行摸索、建置、設計了第一套AI聊天機器人的應用來練兵。2018年4月更設立了LINE研究實驗室，專供未來科技的基礎研究，最初的研究主題都環繞在AI處理相關的領域上。

在2018年LINE開發者大會上，儘管最亮眼的主題是區塊鏈和代幣經濟，但LINE其實也揭露了自家AI布局的初步成果，並將原本聚焦語音助理的Clova品牌，擴大成為了一個泛AI技術產品線，正式發表了OCR、NLU的成果。

在去年開發者大會上，LINE還推出了一個AI技術示範網站，也透露出所聚焦的AI研發方向，包括如開車語音控制用的語音識別技術、智慧喇叭對話的語音生成技術、用於商品圖像搜尋的電腦視覺技術、自動特寫影片人物的影片自動剪輯能力、OCR文字識別、雲端機器學習平臺NSML、即時串流影片中的人臉偵測技術等，另外，不用寫程式的Clova Chatbot Builder開發工具也首次公開畫面，一亮相，現場開發者響起熱烈的掌聲。不過，去年只開發少數合作對象，或共同研發的企業試用，這些AI技術仍舊沒有商品化。

直到今年，LINE在今年6月的年度大會上，一舉宣布了商用AI計畫LINE Brain，將自家AI技術變成了企業商用產品，開始進軍企業AI的B2B市場，甚至發表了一個代表性產品，AI餐廳訂位專案DUET，可以讓AI代替真人，來負責接聽餐廳的訂位電話。從這時候起，LINE開始對外以AI公司來介紹自己。LINE Brain從7月開始，初期先推出像是如Chatbot、OCR和語音識別STT，未來還計畫推出語音合成TTS、影像識別等服務。

LINE Brain部門主管Shinichiro Isago也在今年開發者大會上宣布，DUET成為正式產品，也改名為LINE AiCall服務，LINE和日本知名餐廳預約系統ebica合作，在原有電話訂位系統（IVR），串接了AiCall，來接聽預約電話。

東京已有家牛排館「俺のGrill&Bakery 大手町店」，展開AI電話訂位服務的實測，第一波開放預約的實驗為期約一周。Shinichiro Isago還打趣說，可以打電話去試試看，但要記得去吃，因為這是真實的AI訂位服務。目前AiCall也只支援日語。

AI語音訂位專案DUET成為正式產品，改名為AiCall服務，LINE也和日本知名餐廳預約系統ebica合作，在原有電話訂位系統（IVR），串接了AiCall，來接聽預約電話。東京有家牛排館「俺のGrill&Bakery 大手町店」，在11月底展開了為期一周多的AI電話訂位服務實測。圖片來源／LINE

臺灣LINE也有近30位開發工程師到東京開發者大會向四國開發者分享，涵蓋AI、UI/UX、專案管理、資料及API應用的開發成果，例如攤位展示中，有位臺灣LINE工程師就展示了用於LINE購物的商品推薦技術架構，如何運用LINE的資料叢集、搜尋引擎、推薦服務，再結合臺灣LINE購物開發的機制來對臺灣用戶提供產品推薦，在場解說的臺灣工程師解釋，原本總部的推薦引擎，對中文內容的推薦品質較差，後來，由臺灣團隊協助強化了中文斷詞等中文NLP技術，才能順利在臺灣LINE購物中，推出更適合臺灣用戶習慣的推薦內容。

首度揭露AI未來藍圖，聚焦8大類領域

不只開始大秀AI產品化成果，朴懿彬也首度用一張AI藍圖，清楚地描述出LINE的AI產品和技術最新發展。這是第一次，LINE清楚地展示出自家AI發展架構的全貌。

朴懿彬沒有進一步解釋細節，但從這張藍圖，可以看到LINE主要聚焦8大類AI領域：自然語言處理（NLU）、語音辨識（Speech）、電腦視覺（Vision）、OCR、臉部識別（Face）、影音處理（Video）、資料分析（Data）、語音合成（Voice）。

從這八大類再延伸一層就是該類主要的AI技術（綠色字）。例如口說下面，包括了讀唇語技術（Lip Reading）、謄稿技術（Transcription）和電話網路語音辨識。或像視覺AI（Vision）涵蓋了食物影像辨識、產品影像辨識、唇語辨識、時尚影像辨識（Fashion Image）、特色分群技術（Spot Clustering）等。

例如在OCR下已有多項綠色字的AI技術，包括了手寫字型生成（Handwritten Font）、收據OCR、信用卡OCR、帳單OCR。

有些技術是單獨使用在LINE自家服務，但也有些技術會組合成一項對外提供的產品。例如相關OCR技術已經用於文件智慧（Document Intelligence）和eKYC（可直接辨識照片中的身分證上的文字）。LINE現場也展示自動生成手寫字型的設備，透過繪圖筆直接把AI生成的手寫日文字，自動畫出來，幾乎跟原始手寫字一樣。

從綠色字再延伸出來的亮白色項目，就是更進一步的AI服務元件，例如時尚影像辨識搭配特色分群技術，就變成了視覺搜尋服務（亮白色的Visual Search），LINE也將這項服務用於LINE的商品查詢（LINE Shopping Lens）、成人影像過濾器（Adult Image Filter）、場景分類（Scene Classification）、廣告影像過濾器（Ad Image Filter）等。

不只可以從AI藍圖看到LINE在AI服務和產品化的架構，也可以看到LINE目前正在發展中，還沒有商品化的新應用技術，包括臉部AI之下有自動剪輯（Auto Cut）和自動攝影（Auto Cam）。Shinichiro Isago進一步以今年新推出的Smart Channel（個人化訊息推播）中所用的推薦機制為例，來解釋LINE如何將大量從用戶蒐集來的資料，變成產品AI功能。

這是Smart Channel推薦機制的開發流程，從使用者蒐集到的原始資料，會經過使用者特徵抽取和內容特徵抽取，將這兩類內容各自轉換成數值的特徵向量，也會進行混淆工程的去識別化處理，才提供給ML演算法訓練之用，來打造出個人化推薦ML引擎，也會運用到其他服務上。圖片來源／LINE

用來打造個人化推薦的資料來源有兩大類，包括了使用者的行為記錄（Logs）和所看的內容。LINE再透過使用者特徵值和內容特徵矩陣，將這兩類內容各自轉換成特徵向量，也會進行混淆工程的去識別化處理，才提供ML演算法訓練之用，來打造出三個與個人化推薦相關的3個ML引擎，包括了推薦引擎、相似度引擎（Lookalike）和人口基礎變項數據預測引擎（Demographic prediction），結合這三者就可以來塑造出個人化推播服務，把AI推薦的內容提供給用戶。同一套ML推薦引擎，也會運用到其他服務，包括了貼圖、新聞、數位漫畫或數位廣告服務上。

資料治理原則：隱私優先、避免資料孤島

為了強化資料治理，避免資料孤島，LINE剛完成了一個統一管理的自助式資料大平臺（Unified Self-Service Data Platform），可以統整內部高達100PB的大數據資料，採取單一帳號，可供跨部門的資料科學家和機器學習工程團隊，有一套共同的資料作業平臺和流程。圖片來源／LINE

為了全力發展AI，朴懿彬也提出了LINE的2大資料治理原則。第一是隱私優先（Privacy First），系統預設就考慮隱私設計，也就是「設計預設隱私」（Privacy-By-Design）原則。第二是徹底避免資料孤島（Data Silo），要避免資料分散帶來的風險。

在上述提到的Smart Channel推薦機制開發流程中，從資料蒐集、特徵向量抽取、機器學習引擎處理到變成服務，其中，特徵向量抽取的目的是，將真實用戶的資料，轉換成數值向量，再提供給資料科學團隊設計和訓練模型之用，對資料工程團隊而言，他們只會看到不同的抽象數字，而非原始的圖片、文字內容，LINE透過這樣的混淆工程，來進行所有用戶資料的去識別化，以避免個資和隱私問題。

LINE臺灣資深技術總監陳鴻嘉也補充，LINE要設計一項產品時，都需要由資安部門和法務部門，進行資訊審查和資安審查，審核各種資料的利用情況，尤其要考量使用者資料的隱私問題。光在產品設計階段，就會進行第一次審查，來確定日後蒐集的資料是否合規，是否可供分析之用。當產品上線後，蒐集到了資料後，要儲存到大數據平臺時，會進行第二關的特徵抽取、混淆工程處理，將原始資料轉換成特徵數值的矩陣資料，來進行去識別化，才開放給資料分析團隊使用。最後，要取出資料時還會再進行第三關的審查和權限控管。就算將模型套用到實際產品上，也是由程式自動將用戶發布的文章套用推建模型，來提供推薦清單，資料工程師同樣不會接觸到實際資料。這就是LINE的「設計預設隱私」原則的實際運用。

未來，LINE Brain發展新服務的模式時，Shinichiro Isago指出，也同樣會從用戶或現有服務蒐集而來的資料，透過同樣的資料工程和隱私處理，結合ML技術和演算法，來設計新的服務與友善的UX，再提供給第三方，如企業使用。

LINE也剛完成了一個統一管理的自助式資料大平臺（Unified Self-Service Data Platform），可以統整內部高達100PB的大數據資料，來支援資料科學和機器學習工程之用。另外，內部私有雲Verda也有翻新，要打造出一個可以提供快速生命週期服務的基礎架構，以便統一管理LINE在全球的4萬臺實體伺服器，滿足每天平均41億則訊息的發送，用戶尖峰流量超過每秒1TB的需求。甚至，LINE基礎架構團隊，開始大力擁抱K8s，來建置雲端原生架構的私有雲，提高自動化維運的效率，另外也開始擁抱微服務架構，就是為了因應承載更多Mini App後的大量運算擴充彈性和高可用需求。

「過去2年，我們招募了大量AI人才來發展AI，現在終於到了可以揭曉成果的時候。」朴懿彬認真的說，唯有發展出頂尖的AI技術，才能挑戰全世界的市場。

相關報導 LINE全面進攻AI

熱門新聞