美國商務部成立國家AI諮詢委員會,正招募來自產學界AI專家,要給總統和聯邦政府AI發展策略建議。

圖片來源: 

螢幕截圖

重點新聞(0910~0916)

AI國力     國家AI諮詢委員會     競爭力  

深化AI國力,美國正組成AI委員會來給總統和聯邦機構建議

美國商務部最近宣布成立國家AI咨詢委員會(NAIAC),要針對美國AI競爭力現狀等一系列議題,來向總統和聯邦機構建議。NAIAC是根據美國2020年發布的《國家AI倡議法案》,連結了商務部部長、白宮科技政策辦公室、國防部長、能源部長、國務卿、司法部長和國家情報總監共同成立。

NAIAC鎖定的AI議題不只有美國AI競爭力現狀,還包括落實國家AI計畫的程度、AI就業情況和AI倫理等,以及AI可解釋性、安全性等。該組織目前正招募來自產學界、聯邦實驗室和非營利組織的AI專家成員。(詳全文)

  臉書      語音合成    原始音檔  

語音合成新成就!臉書新NLP模型不需文本和標籤、單靠音檔就能合成語音

臉書AI再進擊!臉書最近揭露一款生成式語音模型GSLM,單靠原始音檔就能合成語音,完全不需要文本資料。臉書直指,這個研究開啟了無文本NLP的新時代。

近年來,GPT-3、BERT這類基於文本(Text)的NLP模型帶來不少突破,可根據輸入文字產生逼真的文本,還能作為預訓練模型,讓使用者用少量標籤或表徵(Representation)就能解決多種NLP任務,如情感分析、翻譯、摘要生成等。但這類模型有個缺點,也就是只適用於擁有龐大文字資料集的語言。

臉書打造的GSLM可解決這個問題。GSLM透過表徵學習來處理原始音檔訊號,完全不需文本資料和標籤,也不必先打造傳統語音合成所需的自動語音辨識ASR系統,就能以原始音檔的語音產生新話語。也就是說,即便是沒有大量文字資料集的語言,GSLM也能照常生成。

該模型由3大部分組成,一是將原始語音切割為聲音單位的編碼器,二是用來預測下個單位的語言模型,最後是將聲音單位轉換為單字的解碼器。臉書用6千小時的語音資料集Libri-Light和Librispeech來訓練編碼器和語言模型,過程中也不用文本資料和標籤。臉書將現有的GSLM語音合成成果公開在AI研究院官網上,團隊表示,GSLM研究還在持續中,未來將開源程式碼,也要將GSLM發展為預訓練模型,讓使用者用少數標註資料,就能有效訓練下游任務,比如口語摘要、資訊檢索。(詳全文)

  程式碼生成     Salesforce     CodeT5  

又有程式碼生成工具問世!Salesforce開源可即時產生程式碼的模型

Salesforce近日開源一套即時程式碼生成模型CodeT5,這是繼GitHub的Copilot、微軟CodeBERT之後,另一個程式碼生成工具。Salesforce指出,程式碼生成技術雖然越來越成熟,但仍有其挑戰,比如這些生成模型不是極度仰賴編碼器(如BERT)就是解碼器(如GPT),因此不是最有效的方法。

為解決這個問題,Salesforce打造一套具備編譯器和解碼器功能的預訓練模型CodeT5。該模型架構與Google的文字生成預訓練模型T5相似,但它改寫了文字轉換架構,讓輸入值和輸出值都是文字串,因此對程式碼的理解力更好。

團隊用835萬個範本來訓練AI,包括使用者在GitHub上的書寫評論。在訓練時,最大版本的CodeT5具2.2億個參數,花了12天才訓練好。不過測試後,CodeT5在各種下游程式碼任務都展現SOTA水準,不論是生成還是理解部分,比如自然語言轉程式碼(NL-PL)任務、程式碼轉自然語言(PL-NL),甚至是不同程式語言間的轉換。(詳全文)

  Google    胸腔X光片       異常  

更通用了!Google新模型能揪出訓練資料集未見過的肺部異常

Google開發一套新模型,能從去識別化資料集中,區分正常和異常的胸腔X光片,而且,對沒有出現在訓練資料集的肺結核病和COVID-19,還能發現其異常之處,對於未見過的案例具有通用性。

目前的醫療AI,已有大量演算法可用來偵測特定疾病,如肺癌、肺結核和氣胸,但這些模型在臨床上仍有所限制,像是氣胸偵測器就無法顯示癌症的病徵,而肺結核偵測器可能無法辨識出肺炎。

因此,Google開發一套深度學習系統來解決這個問題。他們使用EfficientNet-B7架構的深度學習系統,在ImageNet上進行預訓練,接著用來自印度阿波羅醫院的20萬張去識別化胸腔X光片訓練模型。後來,Google使用各種資料集來測試這套系統,發現該系統能夠精確地區分常見的胸腔異常,同時還能偵測未遇過疾病,能以非常高比例的發現肺結核病,也能揪出COVID-19病徵。(詳全文)

  智慧製造     華碩     品質檢測  

瞄準智慧製造!華碩推出兩大AI產品

華碩進攻智慧製造市場,旗下華碩IoT團隊推出兩大AI產品「人工智慧視覺軟體工具包」和「人工智慧波形異常分析應用軟體」,要來加速製造業AI化腳步。

其中,AI視覺軟體工具包瞄準金屬沖壓、塑膠射出及電子零件組裝等產業,利用零件光學和物理元件表現特性資料來訓練AI模型,進一步辨識瑕疵產品,如刮痕、壓傷、髒污等,甚至還能分辨藏在同心圓、髮絲紋中的微小瑕疵。華碩指出,該工具包還導入異常偵測(Anomaly Detection)技術,能將原本耗費數小時的模型訓練時間,縮短為數分鐘。另一方面,AI波形異常分析應用軟體則鎖定動件產線業者,利用機器運轉產生的震動波形資料訓練模型,來判斷馬達、風扇等產品品質。(詳全文)

  Uber     大數據分析     開源平臺  

Uber大數據省錢術(上):開源分析平臺效率優化3大關鍵

Uber坐擁數百PB資料,全都靠開源平臺分析,但這樣的大數據分析平臺,卻是內部最燒錢的工具。為此,Uber先是制定了三大大數據分析平臺省錢方向:供應、需求、平臺效率,接著,Uber並進一步從平臺效率,說明團隊如何透過大數據檔案瘦身、HDFS抹除碼、YARN排程優化等方法,來提高開源平臺效率。

檔案瘦身第一步是格式優化。Uber內部Hadoop檔案系統(HDFS)空間大都被Hive表格佔據,這些表格以Parquet或ORC格式儲存,這些格式是基於區塊的列式格式,每個區塊包含大量的行數(約1萬)。為進行瘦身,團隊研究出幾個格式優化方法,比如用 GZIP Level 6演算法壓縮Parquet檔案,或是定期刪除從Kafka抽取的日誌列,或是手動調整行的排序,來減少表格大小,最高可降低50%。</p>

再來,Uber利用Hadoop 3.0 HDFS抹除碼,來進行瘦身第二步。HDFS抹除碼是一種資料容錯技術,可大量取代大小檔案中的重複性資料,大幅釋放容量。接著,Uber設計一套動態MAX演算法,來優化YARN容量排程,來應付佇列尖峰時段的負載。

此外,Uber還嘗試其他方法來提高平臺使用率,比如他們雖使用Hive-on-Spark、Spark、Presto等三種查詢引擎,但團隊正將所使用的檔案格式改為Parquet;另一方面,他們也利用Apache Hudi頂級專案,來保持數據新鮮度,不必每天掃描好幾天份量的舊資料。(詳全文)

  EdTech     語言學習     Birdbrain  

語言學習App大廠Duolingo揭露內部AI應用

擁有5億使用者的語言學習App業者Duolingo近期舉辦教育科技大會Duocon,分享了自家App使用的AI技術,包括動態出題、語音合成、AI調整動畫角色。Duolingo公司由卡內基美隆大學研究員於2009年成立,目前提供了40種語言共100多種自學課程和測驗,這些課程能根據使用者程度出題,也會在題目中提供例句、單字朗讀。

Duolingo表示,他們打造一套最新的AI題目排程系統Birdbrain,來預測使用者答對下一個題目的機率,進而動態調整、提供相對應程度的題目,讓使用者保持學習興趣。此外,他們也正部署優化過的語音合成演算法,來提供更像人類的發音。另一方面,團隊也用AI輔助設計一系列的卡通人物,來直接與使用者對話,讓需要死背硬記的課程不再單調。(詳全文)

圖片來源/臉書、Salesforce、Google、Uber

 AI趨勢近期新聞 

1. 中鋼啟動AI挑戰賽、鎖定字元辨識,廣邀各路AI好手參賽

2. 交通部用無人機、影像辨識技術維護路口安全

資料來源:iThome整理,2021年9月

 
 
 
 

熱門新聞

Advertisement