成大製造資訊與系統研究所副教授蔡佩璇團隊開發消防輔助AI系統,可即時預測室內火勢走向,並根據當場情況,提供最佳逃生路徑。

圖片來源: 

國科會

重點新聞(1111~11117)

 消防輔助   火災逃生    成大  

成大打造消防AI即時預測火勢,還能整合現有系統

成大製造資訊與系統研究所副教授蔡佩璇團隊打造一款消防輔助AI系統,可用來輔助室內消防安全檢測、即時預測室內火災走勢、加速指引民眾緊急逃生等3大層面,而且,這套系統可直接與現有消防系統並行,使用者不必重新建置整套系統。

一般來說,消防系統應要有指引逃生、收集火場資訊和環境安全評估的功能,但傳統消防系統常見3種問題,一是逃生路徑是事先規畫的,無法根據火災當下來動態調整逃生路徑。再來是,火場即時資料大多來自感測器,但感測器網路設備容易受到高溫燃燒、氣體擾動影響,進而干擾資訊收集。第3是,目前的環境消防檢測大多仰賴專業人力實地評估檢驗,難以根據最新變動(如大型家具移動)來給予建議。

因此,成大團隊先針對火場逃生,開發一套建築數位雙生逃生演算法,來規畫室內逃生路徑。他們利用建築物的資訊,如室內定位系統、室內地圖和火災偵測系統(感測器資訊)來建模,進而算出最安全的動態逃生路徑,並將資訊發送到手機等行動裝置上,協助民眾避開危險區域。團隊實驗發現,與其他現有方法相比,該方法的逃生生存率能有效提高。此外,他們還開發一套快速火災預測方法,可透過火災模擬,快速評估室內環境,也能在火災當下補強即時資訊,規畫出更安全的逃生路徑。

為防範未然,成大團隊也打造一套自動化環境檢測工具,透過AI快速地將室內環境虛擬化並自動產生模型,結合火災模擬和物件、材質辨識,來找出引發火災或影響逃生的危險因子。在他們的模擬中,AI系統能根據不同材質,準確推算出不同時間的溫度和煙霧濃度變化值。而整套消防AI輔助系統,可加強現有公寓大樓、廠房倉庫等的消防安全不足之處,也能與現有消防系統並行。(詳全文)

  DeepMind     點追蹤    物件追蹤 

如何準確追蹤移動中物體?DeepMind開源點追蹤基準測試

對自駕車、監控AI來說,準確辨識移動中物體的表面變化很重要,如旋轉、變形等,DeepMind最近開源一款TAP-Vid基準測試(Benchmark),包含4個資料集,皆由人工標註的追蹤點真實影片和模擬合成影片組成,可用來衡量AI模型對移動物件的辨識準確率。

發展基準測試的同時,DeepMind也打造一款物件點追蹤模型TAP-Net,並開源程式碼供開發者使用。團隊指出,以TAP-Vid基準測試結果來看,TAP-Net的表現比傳統點追蹤方法要好,包括光流法和3D重建的運動恢復結構法(SfM)。不過,DeepMind也坦言,他們的研究成果仍有局限,比如仍無法處理液體或透明物體。(詳全文)

  台電     智慧電表     微電網  

台電智慧電表大數據發展產業動態指數,目前正打造微電網平臺

台電公司日前揭露發、輸、配、售等電力系統的轉型應用成果,像是在全臺安裝173萬具AMI智慧電表的基礎上,結合HEMS居家能源管理系統,發展出新應用,將用電異資訊常搭配智慧音箱,來調控家中的家器用電。

此外,台電也用AI搭配智慧電表,來發展產業動態指數,也就是以台電用戶用電數據、帳單資訊和產業資料來訓練模型,產生產業動態指數,作為未來各產業發展參考。甚至,這些產業動態指數可透過數據介接,交由資料經銷商來販售,如提供給金融業、政府或其他利害關係人,作商業使用。

在配電端部分,台電也已在部分配電變電所部署巡檢機器人,不只可預設巡檢目標、排程,由機器人自動執行外,中控中心也能從遠端遙控機器人至特定點檢测,取代部分維運人力。另一方面,台電也正在樹林區打造微電網平臺,包含儲能系統、主變電站,還有跟市電連結的控制系統,以及PV智慧變流器、電動車與各式儲能。台電表示,透過這座微電網,已可提供計畫性和非計畫性的微電網併網與孤島運轉,未來可打造成虛擬電廠,提供台電更多電能調度。(詳全文)

Meta     蛋白質     ESMFold  

Meta釋出6億個微生物蛋白質結構,要揪出蛋白質界的「暗物質」

Meta在11月初發表一套用AI預測的微生物蛋白質結構資料庫,數量高達6億個,是現有最大的高解析度蛋白質預測結構,Meta也提供API,來供研究者取用所需的蛋白質結構。同時,他們也開源用來預測蛋白質結構的大型語言模型ESMFold,預測速度比時下SOTA模型快上60倍。

近年來,AI用於蛋白質結構預測有不少突破,比如DeepMind打造AlphaFold2模型,解決50年來的蛋白質折疊預測難題,今年更進一步開源2億個蛋白質結構,幾乎涵蓋地球上所有已知的生命體基因庫。不過,Meta從另一面下手,鎖定總體基因體,也就是來自土壤、海洋、人體內部的微生物蛋白質,要來預測這些蛋白質的結構。因為,這些蛋白質可幫助人類解開進化之謎,也有可能治癒疾病、淨化環境或生產乾淨能源。

他們用來預測蛋白質的網路是ESMFold,主要2019年開發的語言模型ESM為基礎。這個模型是自監督模型,能自動在一段話中,填入被遮住的空白處,如To __ or not to __, that is the ________.他們利用這個原理,來讓模型填補空白的蛋白質序列,如GL_KKE_AHY_G,進而探索新結構。這個模型由上百萬個蛋白質序列訓練而成,後來,他們進一步將模型擴展為ESM-2,參數量從800萬增加至150億個。該模型也加速蛋白質結構的預測時間,可比傳統方法快上60倍;Meta指出,他們用2,000顆GPU叢集,2周就完成6億個蛋白質結構預測。(詳全文)

  語音壓縮    MP3       元宇宙  

Meta新AI語音壓縮技術效果比MP3好10倍

Meta日前發表一款AI音訊壓縮技術,效果比MP3好10倍,方便使用者在低頻寬網路傳送語音或音樂檔案。Meta表示,使用串流多媒體、傳送高品質音樂仍需大頻寬和儲存空間,但若發展元宇宙,就需要更有效的壓縮技術。

於是,Meta AI研究部門開發一款AI音訊超壓縮技術,先建立一款包含編碼器、量化器和解碼器的EnCodec模型系統。其中,編碼器可將原始資料轉為高維度和低幀率的格式,量化器則將這格式資料壓縮。量化器經訓練,能將資料壓縮為所需大小,同時保留最重要的資訊。而解碼器,可將壓縮訊息重建為類似原始音訊的波形,FAIR也用GAN的鑑別器,來提升生成樣本的永久品質。

在一項1.5kbps到12kbps低位元速率語音壓縮測試中,Meta發現,EnCodec在各種頻寬及音訊品質上,都能在單一CPU核心系統上即時編碼及解碼。而且, EnCodec(6kbps)壓縮率是MP3(64kbps)的近10倍。Meta也將EnCodec技術的程式碼和樣本公布在GitHub上,並發表技術白皮書。(詳全文)

  微軟     電腦視覺     Vision Studio  

微軟推出圖形介面電腦視覺工具Vision Studio

微軟發布圖形介面電腦視覺工具Vision Studio,用戶就算沒有技術基礎,也能探索電腦視覺功能,甚至採用微軟提供的客戶端函式庫和REST API,來部署電腦視覺應用。

在Vision Studio中,每個電腦視覺功能都有一個或多個試用功能,用戶可用自己的圖像,或微軟提供的範例圖像來測試。Vision Studio還提供光學字元辨識(OCR)功能,供用戶從圖像和文件中,擷取印刷或手寫文字,另,Vision Studio也能進行空間分析,辨識影片裡的人物和人物的移動,並產生其他系統可回應的事件。至於圖像分析功能,則能從影像中擷取視覺特徵,如物件、臉部、成人內容,甚至是自動生成文字描述(圖說),來改善無障礙功能。(詳全文)

  抖音     推薦系統     Monolith  

抖音為何推這支影片?字節跳動揭露推薦系統架構

抖音母公司字節跳動前陣子發表論文,揭露抖音使用的即時推薦系統Monolith主要架構,具參數同步和高容錯兩大優勢。團隊表示,即時推薦對許多有時效性的業務很重要,如線上廣告、短影片排序,但現有的通用深度學習框架如TensorFlow、PyTorch,仍難以滿足推薦業務需求。因為,這些基於密集運算和靜態參數的調整系統,利用動態參數來推薦,因此影響模型品質。而且,這些框架的設計,並未整合批次訓練和正式上線這2階段,無法即時根據顧客需求來修正模型。

於是,團隊首先設計一套無碰撞嵌入表格(Collisionless embedding table)並進行優化,以可終止嵌入和頻率過濾來降低記憶體用量;再來,他們打造高容錯性、隨時可正式上線的線上訓練架構,而且,他們的設計,可透過系統穩定性來換取即時的模型學習,更貼近即時回應的業務需求。字節跳動表示,這個推薦系統現已用於自家產品BytePlus Recommend上。(詳全文)

  Google     機器人     CaP  

機器人也能寫程式!Google揭露新AI模型

Google日前在AI大會上展示一款模型,可讓機器人寫程式,而且不需大量資料訓練。這款模型叫做Code as Policies(CaP),也就是將語言模型產生的程式,以實體機器人執行。CaP是以Google先前開發的幫手機器人模型PaLM-SayCan為基礎,根據Python通用語言少量、簡單的說明,就能讓語言模型撰寫機器人程式碼,並由機器人精準執行。Google的目的,是要讓單一系統執行多種複雜任務,不需特別訓練。

研究人員解釋,CaP使用一種程式碼撰寫模型,在提供了暗示(如告知它有哪些API)及範例(如命令該如何轉成程式碼)後,就能為新命令撰寫新程式碼,像是重寫API呼叫、合成新函式,表達回饋循環,以程式語言表達出來,在runtime組成新行為。目前,Google也將CaP的程式碼及技術白皮書在GitHub上開源。(詳全文)

  Gartner     自適應     即時  

Gartner預測2023年:自適應AI更為重要

Gartner揭露2023年十大科技趨勢預測,強調自適應AI(Adaptive AI)將越發重要,模型得根據不斷變化的環境,來調整預測。進一步來說,自適應AI要求系統要能根據即時回饋,來修正輸出值,適應不斷變化的環境,甚至邁向線上訓練、線上推論的方向。

另一方面,Gartner認為,接下來將出現更多超級App(Superapps),也就是一款集應用、平臺和生態體系的應用程式。它不只有自己的功能,也提供平臺給第三方開發和發布自己的微應用程式,如微軟Teams、Slack等。他們預測,到2027年,全球50%以上的人口將成為超級App的日活躍用戶。不過,Gartner也點出,AI信任、風險和安全會是明年的重要課題,企業需確保模型的可靠性、可信度和數據保護,且需不同部門來聯手落實。(詳全文)

圖片來源/成大、DeepMind、Meta、字節跳動

攝影 / 余至浩

  AI近期新聞 

1. Google優化BigQuery文字分析能力,正式推出高效搜尋功能

2. IBM發布433量子位元的新一代量子處理器Osprey

資料來源:iThome整理,2022年11月

熱門新聞

Advertisement