Line旗下AI公司執行長砂金信一郎展示一項開發中的新功能Clova Dubbing(配音功能)編輯畫面,不只能將輸入文字轉成語音,還可以搭配虛擬人像表情變化,彷彿由虛擬人像唸出這段文字。(圖片來源/Line)

在商用AI競爭上,和國外科技巨頭如Google、臉書相比,Line仍舊是新進的挑戰者。Line在2017年開始跨入AI市場,去年才正式定位自己是一家AI公司,推出商用AI計畫LINE Brain,將AI視為下一階段的發展重心。在去年開發日也揭露了更詳細的AI戰略藍圖,包括了8大發展方向,但細數這些技術方向,自然語言處理、語音辨識、電腦視覺、OCR、臉部識別、影音處理、資料分析到語音合成,大多是核心、基礎的AI技術領域,而非更應用面的前瞻AI發展趨勢。

今年中,Line旗下AI公司執行長砂金信一郎在一場AI日線上研討會中,透露進軍商用AI市場一年來的成果,過去1年已有280家企業採用了Line商用AI產品,也再度精簡發展重心,將優先聚焦語音辨識合成、自然語言處理以及OCR三項技術的產品研發。

年中他也揭露了13項開發中的AI新功能,第一類新AI功能是與聊天機器人和語音訂位助手AiCall有關的功能,包括了通用對話管理機制(Unified Dialog Manager)、AiCall Console、擴充式語義條件(Slot Extension)、插播支援(Barge-in Support)、Line官方帳號VoIP支援、對話分析,以及細節不明的Streaming NEST。另有2項則是與eKYC服務有關的新功能,包括帳號開設自動審查,以及偽造身分的檢查機制(Fake-check),以及4項OCR第二版的新功能,包括了特定收據形式的辨識、特定發票形式的辨識、表格辨識(Table Recognition)和地址校正。

商用AI策略先聚焦3項技術的企業級服務

在今年年底這場2020開發者大會上,Line進一步宣布,將去年發表的商用AI產品線Line Brain,併入Clova品牌中,但會繼續提供企業級商用AI服務,也就是NLP、OCR、語音辨識這三項的企業級服務。換句話說,Clova品牌下將包括了AI產品(Chatbot、OCR、語音、影音、文字分析、臉部辨識等),AI解決方案(智慧助理OCR、AiCall、eKYC)和AI裝置(Clova智慧喇叭、Clova桌面裝置和Wave裝置)。Line資料實驗室和資料平臺負責人池邊智洋強調:「Line的AI發展目標是讓AI成為日常生活中到處可用的技術。」

砂金信一郎預告,將會逐漸釋出更多AI產品讓Line開發者社群先試用。他在開發者大會中,展示了一項正在開發中的新功能Clova Dubbing(配音功能)編輯畫面,將文字語音生成結合虛擬人像(Avatar)的表情動作,可以針對一段動畫來進行配音,只要需要輸入文字,就會自動產生這段文字的聲音,而且還可以搭配虛擬人像表情自動生成功能,在動畫中,彷彿由虛擬人像唸出這段文字的動畫。不過,他沒有透露,何時會推出這項功能。

Line更首度揭露4大AI研發趨勢和潛在應用場景

Line旗下AI公司資料實驗室技術顧問Minoru Etoh揭露Line未來四大AI研發趨勢,更可以一窺,Line未來數年在AI產品的發展方向。圖片來源/Line

在這次開發者大會上,除了產品發展新策略之外,Line更首度在今年開發者大會中,公布了長期AI研發願景和方向。Line旗下AI公司資料實驗室技術顧問Minoru Etoh表示,Line未來將聚焦四大AI研發趨勢,包括了數位我(Digital Me)、生成式AI(Generative Intelligence)、值得信任的AI(Trustworthy AI)和暗資料(Dark Data)。從Minoru Etoh對這四大趨勢的潛在發展特色,更可以一窺,Line未來數年在AI產品的發展方向。

數位我就是利用各種數位世界的個人化資料,來打造出個人在線上的數位分身,可強化各種個人化服務。Minoru Etoh指出,數位我發展架構上,最底層是一個分散式的信任平臺,再用來發展出一個線上的數位身分平臺(KYC),可以用於健康照護、智慧程式、旅遊、e政府、金融服務和電商服務上。這個架構也點出為何Line同時力推eKYC平臺和區塊鏈平臺的背後思考。以健康照護應用為例,有了數位我的機制,就可以用來結合更多個人資料,打造更貼近個人需求的預先照護,個人化的治療等。

第二項生成式AI是則是當前熱門AI研發話題之一,Line希望研發各種類型內容的自動生成,不只是影音、聲音、影像、文字、音樂,甚至還包括程式碼自動生成。Minoru Etoh補充,應用場景上,生成式AI可以用來打造更多靠AI自動化的工作場所(Autonomous AI Workforce),例如提供多功能AI、複雜任務的簡化、垂直產業AI等。也可以用於發展可理解相依脈絡的語音辨識,來辨識出噪音或未知的用詞。在數位學習上,也能用來自動產生符合不同學習者能力的適性學習內容。而用於即時通訊情境下,也能用來自動生成強化雙向溝通的內容,來提供更高互動的虛擬經驗。從Line在另一場演講中透露,準備將貼圖功能、有表情的虛擬角色圖像等整合到視訊通話功能,就可一窺這個研發趨勢的影響。

另一項也是當紅AI議題的研發趨勢是值得信任的AI。Minoru Etoh強調,這是必須做的事,而不是選項。其下有3項重點目標,使用的自由、公共安全、隱私保護。在隱私保護上,可以透過聯合學習、加密式AI服務來將隱私資訊保留在用戶端,而不用上傳給服務提供者。另外在資料、模型和評估上都要考量AI公平性,避免造成偏差。

促進龐大暗資料利用,可發展非標記資料交換市集

最後一項暗資料,則是指目前仍有大量AI技術還沒有運用到的資料,如何建立一套工具或技術,可以用來處理大量非結構化、無標記或隱藏的資料,例如Open AI的語言模型GPT-3就是一個暗資料可用的技術。Line也計畫和母公司Naver聯手打造一個用了100億頁日文語料訓練的超大型語言生成模型。

另外,暗資料研發趨勢上,Minoru Etoh認為,需要發展一個非標記資料的資料交換市集,這個市集可以提供隱私法遵規範,或將使用者行為資料碎片化來達到去識別化的作用等。儘管沒有透露更多研發重點,但Line強調,Line的AI產品將持續投入與這四大類趨勢相關的研發專案。

熱門新聞

Advertisement