供企業以OCR(Optical Character Recognition)技術快速處理文件的Google人工智慧套件Document AI,Google現在更新其OCR引擎,加入三個預覽功能,使Document AI現在可評估文件光學品質,支援數位PDF,還讓用戶能夠控制OCR版本。

Document AI為一個人工智慧套件,能夠理解和組織文件,該套件由Document AI Workbench、Document AI Workbench Warehouse和一組預訓練文件處理器所組成,使用戶能夠利用OCR技術,從各種類型的文件擷取文字。Document AI使用來自Google雲端以及Google研究院團隊所開發的機器學習模型,能夠處理非結構化文件擷取文字和段落等布局,並涵蓋200多種語言。

Document AI OCR引擎第一個更新功能,是針對頁面層級的智慧文件品質(IDQ)評估。官方提到,OCR引擎讓使用者以程式開發方法,擷取重要文件特徵,包括詞頻、項目相對位置、文件的主要語言等,使其能夠用於下游業務處理,而新的智慧文件品質評估功能,更提供了另一個重要的文件評估訊號。

IDQ含模糊、小字體、眩光等八個維度頁面品質指標,Google提到,透過辨識文件的光學品質,將有助於用戶根據文件品質進行不同處理,進而使整個文件處理流程更加高效。

第二個新功能,是Document AI開始支援數位PDF檔案。PDF格式常被用於採購、貸款和合約等應用程式,PDF分為證件掃瞄等影像形式,以及可供複製貼上和突出顯示文字的數位形式。而現在Document AI OCR完全支援數位PDF檔案,代表著該服務能夠擷取和來源文件完全相同的文字和符號。

由於Google會定期升級Document AI OCR所使用的機器學習模型,雖然新模型帶來新功能,但也可能改變OCR行為,因此Google現在加入了OCR版本控制,讓用戶能夠凍結OCR模型行為,確保OCR的行為一致。對於有嚴格法遵要求的產業,OCR版本控制也有助於維持相同的模型版本,最大程度減少版本間重新認證堆疊的工作量,透過OCR版本控制讓企業可以靈活選擇適合業務需求的版本。

熱門新聞

Advertisement