Nvidia正式發佈遷移學習工具套件TLT 3.0,是自家AI開發平臺TAO的重要元件,內含多種預訓練模型。

圖片來源: 

螢幕截圖

Nvidia推出遷移學習工具套件TLT 3.0,內含多種新版預訓練模型,範圍包括電腦視覺和自然語言領域,像是車牌辨識、心率監測、情緒辨識、人臉特徵點和語音辨識等,要來加速企業採用AI的過程。

進一步來說,預訓練模型和遷移學習能降低AI模型的開發門檻,使用者不必從零開始大規模收集訓練資料、標註資料,而是以少量資料來微調預訓練模型即可。因此,Nvidia表示,自家遷移學習工具套件可加速企業採用AI的時間,並對剛踏入電腦視覺和語音服務的企業來說,不必仰賴龐大的AI團隊,也能使用部署生產級的AI。

TLT 3.0包含的預訓練模型有2大類,一是電腦視覺,新版特色包括比熱門姿勢預測模型OpenPose推論速度快9倍、支援邊緣即時推論的BodyPostNet模型,還有用來偵測人員的語義分割網路PeopleSemSegNet,以及車牌偵測和辨識、手勢偵測、情緒辨識、人臉特徵點等。(如下圖)

另一類是自然語言相關的對話式AI,新版特色有全新的語音辨識模型CitriNet、用於問答的新模型Megatron Uncased,以及數款可支援語音轉文字、命名實體辨識 (Named-entity recognition)、標點符號和文字分類的預訓練模型。

Nvidia指出,這些AI模型都可免費從Nvidia雲端平臺目錄NGC上下載,也能在公有雲平臺上訓練這些預訓練模型,像是AWS、GCP和Azure。Nvidia也補充,TLT 3.0是自家AI開發平臺TAO的重要元件,甚至可縮短10倍開發時間。

 

熱門新聞

Advertisement