Nvidia發布遷移學習工具套件TLT 3.0，多種新預訓練模型要加速企業部署AI

Nvidia正式發佈遷移學習工具套件TLT 3.0，是自家AI開發平臺TAO的重要元件，內含多種預訓練模型。

圖片來源:

螢幕截圖

Nvidia推出遷移學習工具套件TLT 3.0，內含多種新版預訓練模型，範圍包括電腦視覺和自然語言領域，像是車牌辨識、心率監測、情緒辨識、人臉特徵點和語音辨識等，要來加速企業採用AI的過程。

進一步來說，預訓練模型和遷移學習能降低AI模型的開發門檻，使用者不必從零開始大規模收集訓練資料、標註資料，而是以少量資料來微調預訓練模型即可。因此，Nvidia表示，自家遷移學習工具套件可加速企業採用AI的時間，並對剛踏入電腦視覺和語音服務的企業來說，不必仰賴龐大的AI團隊，也能使用部署生產級的AI。

TLT 3.0包含的預訓練模型有2大類，一是電腦視覺，新版特色包括比熱門姿勢預測模型OpenPose推論速度快9倍、支援邊緣即時推論的BodyPostNet模型，還有用來偵測人員的語義分割網路PeopleSemSegNet，以及車牌偵測和辨識、手勢偵測、情緒辨識、人臉特徵點等。（如下圖）

另一類是自然語言相關的對話式AI，新版特色有全新的語音辨識模型CitriNet、用於問答的新模型Megatron Uncased，以及數款可支援語音轉文字、命名實體辨識 (Named-entity recognition)、標點符號和文字分類的預訓練模型。

Nvidia指出，這些AI模型都可免費從Nvidia雲端平臺目錄NGC上下載，也能在公有雲平臺上訓練這些預訓練模型，像是AWS、GCP和Azure。Nvidia也補充，TLT 3.0是自家AI開發平臺TAO的重要元件，甚至可縮短10倍開發時間。

熱門新聞