圖片來源: 

微軟

微軟上周宣布,包括Windows版、macOS版與Linux版的Microsoft Edge都已內建「替代文字」(Alt Text)功能,可自動替網路上缺乏標籤的圖像或圖表產生文字敘述,並透過螢幕閱讀器讀出,以嘉惠視障人士。

螢幕閱讀器可用來替視障人士讀出網頁上的內容,包括文字以及含有替代文字的圖像/圖表,然而,微軟的數據顯示,螢幕閱讀器所遇到的圖像中,有超過半數都缺乏圖像標籤或替代文字。

當Microsoft Edge用戶透過設定允許微軟替使用者創造圖像描述(Get image descriptions from Microsoft for screen readers)之後,只要螢幕閱讀器遇見缺乏標籤的圖像,Edge就會自動把圖像送至Azure Cognitive Services的電腦視覺API進行分析,進而創造5種語言的文字摘錄,亦能辨識嵌入於圖像中的逾120種語言。該API支援包括JPEG、PNG、GIF及WEBP等常見的圖片格式。

圖片來源/微軟

此一自動化圖說服務有某些限制,例如被網站作者標示為裝飾用的圖像,或者是檔案小於50 x 50畫素的圖像(如圖示),也無法分析太大的圖像,此外,電腦視覺API也會排除色情或血腥圖像。

不過,微軟強調,最了解圖像所要企圖表達意象的一定是網站作者,再加上以機器學習演算法來描述圖像並不那麼完美,而且品質不一,因此,最好的方式還是由作者親自撰寫圖說,但當缺乏圖說或圖像標籤時,由AI產生的替代文字還是優於什麼都沒有。

目前Microsoft Edge的替代文字功能只支援桌面版作業系統,尚未支援Android及iOS等行動平臺。

熱門新聞

Advertisement