雲林科技大學資訊工程學系許正欣副教授

華碩電腦具備「菁英級」NVIDIA 解決方案整合合作夥伴(Elite NPN - Solution Provider)最高等級資格,致力於結合技術專業與服務,提供 NVIDIA GPU 運算解決方案,以滿足客戶的業務和技術需求,提升附加價值。日前更協助雲科大許正欣副教授研究團隊優化新世代人工智慧數位語音助理系統,為臺灣產學合作貢獻一份心力。

受惠於半導體製程持續進化,加上自然語言處理(Natural Language Processing,NLP)技術日益成熟,讓語音技術應用範圍日益廣泛,如Apple iPhone 的Siri 等。綜觀現今語音應用範疇仍局限於單次溝通,欠缺多次連續對話的能力,促使全球各方技術團隊積極投入此領域研發,而身為資訊科技大國的臺灣自然不能缺席。在產學合作計畫成績亮眼的雲林科技大學,由資訊工程學系許正欣副教授帶領的研究團隊,即投入新世代人工智慧數位語音助理系統 (AI Digital Voice Assistant System),日前在華碩電腦協助下運用 NVIDIA DGX 平臺進行驗證,在辨識率、語音合成能力等都獲得大幅提升。

雲林科技大學資訊工程學系副教授許正欣說,迎合教育部的產學合作計畫,從5~6 年前我們與民間企業合作,共同投入新世代人工智慧數位語音助理系統研發,團隊在研發AI、ML 演算法過程中,希望引進 NVIDIA DGX 平臺針對AI 模型進行驗證,加快後續商業化的步驟。這次在華碩電腦協助下,使用NVIDIA DGX 平臺進行研究,讓研究團隊了解現有演算法、AI 模型等不足之處,讓此產學合作專案有長足的進展。

改善AI 語音專案 仰賴高效能NVIDIA DGX 平臺

身為為技職教育高等學府之一的雲林科技大學,以「產學一體、創新設計」為主軸,推動互惠型的產學教育合作多年,成為培育中臺灣產業人才的校園,且在國際舞臺上享有盛譽。近10 年,在教育部發展典範科技大學計畫、獎勵科技大學及技術學院教學卓越計畫等補助下,全力運用產學合作、創新教學等優勢,打造「產學一體、創新設計」務實致用的科技大學。

擔任雲林科技大學行動寬頻暨音訊與語音處理實驗室(Broadband Radio and Audio and Speech Processing Lab,BRAS Lab)指導老師的許正欣,專長在通訊理論、無線行動寬頻接取系統、語音訊號處理、語音情緒辨識、深度學習等領域。看準市面上語音辨識服務功能有限,且難以進行多次性連續性對話,於是決定與產業合作,全力開發新世代人工智慧數位語音助理系統,期盼讓語音辨識技術有全新的應用模式。

許正欣指出,新世代人工智慧數位語音助理系統涵蓋五大模組,分別是DSP Frontend(數位訊號處理)、Speaker Recognition(語者辨識)、Distant ASR (遠距語音辨識)、NLP(自然語言處理)、TTS( 語音合成),這五大模組可獨立運作,也能相互搭配使用。

DSP、NLP 市面上應用非常多,而 Speaker Recognition 是可辨識說話者的身份,能用於智慧家庭、智慧工廠等需確認身份的應用情境。Distant ASR 則可大型會議空間或開放空間中,辨識人聲、背景聲,TTS 則是可模擬人說話。過往研究團隊是利用個人電腦上的NVIDIA RTX 系列顯示卡,搭配GPU 伺服器進行訓練,至今此專案的辨識率、正確率等都已逐步達到商業化的水準。

BRAS Lab 研究團隊一直很想嘗試使用 NVIDIA DGX 平臺,最後在合作多時的華碩電腦協助下,提供 NVIDIA DGX 平臺進行測試,並由技術團隊協助建置。許正欣副教授帶領的研究團隊得以重新訓練新世代人工智慧數位語音助理系統的AI 模型,讓整體研究專案帶來莫大幫助。

專為AI 專案量身打造 NVIDIA DGX 受全球用戶肯定

由華碩電腦經銷的 NVIDIA DGX 平臺,是全球首款以 NVIDIA 晶片打造的人工智慧系統,這是款適用於所有 AI 工作負載的通用系統,具備極致運算效能,能為各種 AI 專案提供極佳的運算密度、效能和彈性,助專案團隊快速完成AI 模型訓練、推論,以及分析整合等複雜工作。

NVIDIA 合作夥伴經理楊博欽指出,NVIDIA DGX 系統平台具備最新最強大的 GPU,協助開發者以及研究人員用更短時間完成 AI 模型訓練,尤其 NLP 相關的 AI 模型訓練資料量非常龐大,演算法相對複雜,需要相當強大的 GPU 進行平行運算。此外,在DGX 系統平台應用上,NVIDIA 同步提供非常豐富的 SDK、library 工具來協助開發者及研究人員進一步簡化 AI 開發流程,以及提供預訓練模型(Pre-trained Model),可加速落地 AI 專案。

「考量到與華碩電腦合作的專案時程非常緊湊,所以研究團隊沒有針對NVIDIA DGX 平臺特性重新調整 AI 演算法,而是直接在該平台上訓練AI 模型,最終呈現結果,模型訓練時間並沒有縮短」許正欣解釋:「但重新訓練完成的AI 模型,在語者辨識方面的辨識率、辨識速度上都有不少進步,讓研究團隊感到非常驚艷,對於此專案後續研究帶來很大幫助。」

華碩電腦具備「菁英級」NVIDIA 解決方案整合合作夥伴(Elite NPN - SolutionProvider) 最高等級資格

許正欣說,華碩電腦此次是以專案型式提供給我們使用,華碩電腦技術團隊事前依然仔細評估研究團隊的需求,並提供完整的建置建議等,讓我們能在最短時間熟悉 NVIDIA DGX 平臺的操作方式。我們非常感謝華碩電腦的技術支援,未來有更多合作機會。

目前許正欣與研究團隊持續投入新世代人工智慧數位語音助理系統的優化工作,包括發展臺灣文化,預發展閔南語的智慧數位語音助理系統,現今持續與各領域產業接觸,尋找各模組的最合適應用領域,期盼讓更多民眾享受到新世代語音服務帶來的全新體驗。

華碩電腦憑藉多年於AI 領域的豐富專案經驗,致力於結合技術專業與服務,提供 NVIDIA GPU 運算解決方案,華碩電腦技術團隊會仔細評估各種研究領域的需求,規劃合適的導入與部署建議,並協助後續完整的建置服務。

熱門新聞

Advertisement