圖片來源:
Google上周開源了語音命令資料集( Speech Commands Dataset),可望加速開發人員打造支援語音命令的各種應用。
此一語音命令資料集是由數千名不同的使用者唸出30種命令文字,迄今總計蒐集了6.5萬個只有1秒的語音檔。這些文字涵蓋了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及數字等,方便開發人員用來訓練應用程式的基本語音介面。
迄今Google已開源多項人工智慧專案,包含機器學習技術TensorFlow、自造者AI專案—AIY,以及用來蒐集語音片段的Open Speech Recording網路程式。
此外語音命令資料集是由TensorFlow與AIY團隊共同建立,以用它來增加TensorFlow的訓練與介面樣本程式,Google預期開源後的資料集數量將會持續成長,以帶來更多不同的口音。
熱門新聞
2025-01-26
2024-04-24
2025-01-25
2025-01-27
2025-01-26
2025-01-24
Advertisement