Meta重整組織要去中心化,將多個AI技術研發團隊納入產品部門,要加速技術落地。

重點新聞(0527~0602)

AI落地一直是企業擁抱AI的初衷,但就連Meta這樣的科技巨頭,也面臨技術落地最後一哩路難行的困境。最近他們調整組織,往去中心化發展,將研發團隊分派到產品部門中,加速技術落地。說起AI落地,也是Line臺灣Data Dev團隊的工作之一,他們在線上徵才日中,公開徵求有經驗的ML工程師和CLOVA產品工程師,來落地更多AI技術。至於AI應用,最近則出現一款可自動核准GitHub PR請求的AI工具,引起開發者正反兩極討論;Google近日也展示最新文生圖AI工具Imagen,生成的圖片比DALL-E 2還要逼真。

Meta     組織重整     去中心化  

Meta AI大風吹,重整組織要讓新技術更快落地

Meta旗下AI研究院大風吹,Meta CTO Andrew Bosworth指出,採用集中化的作業方式,只會讓下游任務團隊更難實現目標。因此,為進一步將組織結構去中心化、快速擴展新AI技術,Meta把AI研究院內部的團隊,如AI平臺、AI產品、AI4AR等團隊,重新分配到Meta的產品部門,來將AI技術落實到產品上。而這些原本負責技術研發的團隊,就改名為AI創新中心。

更細緻的組織調整,包括將AI技術研究團隊FAIR整合至元宇宙部門的現實實驗室,重新定調為基礎AI研究,而AI產品團隊,則會整合至產品工程團隊,至於AI4AR團隊,則納入現實實驗室中的XR團隊。最後,Meta還會成立一個跨職能的AI團隊,來評估整間公司的AI進展。(詳全文)

  Codeball      GitHub     Pull Request  

新AI審查工具自動核准GitHub PR,誤報率不到1%

最近GitHub上出現一款新工具Codeball,可自動核准GitHub上的開源專案修改請求(Pull Request),而且誤報率不到1%。PR是指,當有人想貢獻一己之力、修改開源專案時,發送給原作者的請求通知,作者得人工看過、同意才行。

為自動化這個過程,幾位開發者開發了Codeball核准工具。該工具採用了一套深度學習模型,經百萬個公開和私人貢獻訓練而成。在模型的輸入層中,模型採納數百個輸入值,並有2層隱藏層,最後有個輸出層來評估RP核准的機率。每個PR雖有數百個特徵,但可歸類為基本值、衍生值和類別變數等3大類。其中,基本值是指PR的詮釋資料,像是可能新增或移除的行數,而衍生值是指PR相關的數據,如檔案最近更新的天數。類別變數則是指,PR衍生而來的分類,像是檔案型別的分類。

後來,開發者用非訓練資料來測試Codeball,發現準確率高達99%以上。也有開發者在Ycombinator論壇上表示,Codeball準確率為99%、召回率25%,有些開發者認為這是個好工具,但也有人擔心它會影響程式碼審查的文化,把不好的程式碼帶入程式碼庫中。(詳全文)

  Google     Imagen     Transformer  

比DALL-E 2更逼真!Google揭露最新文生圖AI系統

Google Brain發表最新文生圖AI系統Imagen,可根據使用者的文字輸入,產出寫實的圖像,比如在撒哈拉沙漠、戴著草帽和霓虹太陽眼鏡的小仙人掌。與其他主流圖像生成演算法相比,如VQ-GAN、LDM和DALL-E 2等,受試者皆認為Imagen產生的圖像更真實,也更符合輸入的文字描述。

Imagen以大型Transformer語言模型為基礎,因為,研究員發現,用純文字語料庫預訓練過的通用大型語言模型,在圖像合成的文字編碼上表現非常好。也就是說,增加Imagen中語言模型的大小,就可提高樣本真實度和圖像文字描述的一致性,比單純增加文生圖的擴散模型大小還有效。就效能來說,Imagen雖沒利用COCO資料集來訓練,但獲得了目前最低的7.27 FID分數(越低越好)。不過,Google暫不對外開放Imagen。(詳全文)

  TensorFlow    oneDNN       Keras  

TensorFlow 2.9版釋出,主打oneDNN函式庫強化

機器學習開源平臺TensorFlow 2.8版釋出才短短三個月,5月下旬就又釋出2.9版,主打函式庫oneDNN的強化、新DTensor API,以及Keras優化器API的新實驗版本。進一步來說,oneDNN是用來改善英特爾CPU效能的函式庫,在TensorFlow 2.5版時首次出現,並陸續優化。在最新的2.9版中,oneDNN優化會在Linux x86上預設為開啟,遇到具神經網路硬體功能的CPU,也會預設開啟。

至於DTensor,則是一款用於分散式模型處理的新TensorFlow API,可讓模型無縫從資料平行化遷移到單程式多資料(SPMD)的模型平行化。該API的特點是與裝置無關,使用者可在CPI、GPU或TPU上使用相同的模型程式碼。此外,DTensor也允許多使用者執行。最後,2.9版還釋出一個新的Keras優化器API,可讓開發者更容易客製化和擴充優化器。(詳全文)

  Line     資料工程     徵才  

Line臺灣Data Dev團隊徵2類資料工程好手

Line臺灣日前在徵才日中,揭露多項服務發展藍圖和AI職缺,以主力開發內部AI應用和服務維運的Data Dev團隊來說,他們將團隊成員分為4類,包括資料科學家、ML工程師、資料工程師,以及CLOVA產品工程師。其中,資料科學家負責資料驅動決策,比如,廣告團隊發現分眾模型標籤不準,資料科學家就要找出問題,像是團隊過去可能使用其他區域的標籤,套用到臺灣區域。

此時,就需要ML工程師來找尋新的訓練資料,或是開發新演算法來訓練新模型。如果資料量大,就需要資料工程師,來進行資料處理的流程優化。訓練完分眾模型後,資料科學家還得制定模型成功通過的標準,並設定AB測試。如果需要模型定期更新,就需要資料工程師來制定定期的優化策略,也就是MLOps相關工作。最後,如果要做客製化應用系統,就需要CLOVA產品工程師,來協助進行系統開發。這次,Line臺灣要尋找的是,有經驗的ML工程師和CLOVA產品工程師,來挖掘更多資料價值。(詳全文)

  AI2     GRIT     電腦視覺  

AI2釋出專門評估電腦視覺模型的基準測試GRIT

基準測試(Benchmark)是用來衡量AI模型的重要工具,可提供量化結果,來比較不同模型的表現。最近,知名AI研究機構AI2發表一款更強健的電腦視覺基準測試GRIT,能以7項任務,來完整評估電腦視覺模型的能力。

這7項任務包括物件分類、物件定位、參考表達基礎、視覺問答、分割、人體關鍵點偵測和表面法向量估算。GRIT可用來評估3個面向,包括通用視覺模型、強健專業模型和高效學習。另外,GRIT也提供受限與不受限制的類別,在受限制的測試中,GRIT將訓練資料限制在一組特定但豐富的資料源中,使模型研究聚焦在更科學的比較上,來鼓勵研究人員開發有效的學習方法,而非追求大量訓練資料的大模型範式。(詳全文)

  Deepfake     Colab     DeepFaceLab  

Google AI服務禁止了Deepfake的影片訓練

據外媒報導指出,Google提供AI模型訓練的服務Colab禁止使用者用來製作Deepfake影片。進一步來說,Deepfake影片製作網站DeepFaceLab用戶發現,在Colab上執行DeepFaceLab程式時,會觸發警告,告知用戶執行不被允許的程式碼,並可能限縮用戶未來使用Colab的權限。不過,其他較小的Deepfake網站用戶,則尚未接獲類似警告。(詳全文)

  PyTorch     微軟     Azure  

Meta聯手微軟,要繼續擴大Azure AI專案

微軟在自家Build 2022大會上,與Meta聯合宣布,將繼續擴大Azure雲端部署AI應用。這是雙方繼去年聯手後,又一次擴大應用,Meta今年將繼續讓AI部門使用專屬Azure叢集,來執行大規模AI研究任務。這個叢集採用了NDm A100 v4 系列虛擬機器,執行5400顆Nvidia A100 Tensor Core 80GB GPU,每個VM之間GPU對GPU頻寬,號稱是其他公有雲業者的4倍,可用於分散式AI訓練。

不只給自家AI團隊使用,Meta也將擴大PyTorch on Azure服務,為PyTorch用戶提供NDv4及InfiniBand硬體及完整軟體堆疊。未來幾個月內,微軟也將打造新的PyTorch開發加速器,讓用戶更容易在Azure上部署PyTorch框架。(詳全文)

圖片來源/Codeball、Google Brain、AI2、Line臺灣

  AI近期新聞 

1. 專家呼籲國際社會應該創立AI專利制度

2. AI開源公司Hugging Face也新添Endpoints on Azure服務

3. 特斯拉AI日延期至9月,馬斯克推文暗示人形機器人將出場

資料來源:iThome整理,2022年6月

熱門新聞

Advertisement