Google強化Document AI OCR引擎，加入文件光學品質評估功能

供企業以OCR（Optical Character Recognition）技術快速處理文件的Google人工智慧套件Document AI，Google現在更新其OCR引擎，加入三個預覽功能，使Document AI現在可評估文件光學品質，支援數位PDF，還讓用戶能夠控制OCR版本。

Document AI為一個人工智慧套件，能夠理解和組織文件，該套件由Document AI Workbench、Document AI Workbench Warehouse和一組預訓練文件處理器所組成，使用戶能夠利用OCR技術，從各種類型的文件擷取文字。Document AI使用來自Google雲端以及Google研究院團隊所開發的機器學習模型，能夠處理非結構化文件擷取文字和段落等布局，並涵蓋200多種語言。

Document AI OCR引擎第一個更新功能，是針對頁面層級的智慧文件品質（IDQ）評估。官方提到，OCR引擎讓使用者以程式開發方法，擷取重要文件特徵，包括詞頻、項目相對位置、文件的主要語言等，使其能夠用於下游業務處理，而新的智慧文件品質評估功能，更提供了另一個重要的文件評估訊號。

IDQ含模糊、小字體、眩光等八個維度頁面品質指標，Google提到，透過辨識文件的光學品質，將有助於用戶根據文件品質進行不同處理，進而使整個文件處理流程更加高效。

第二個新功能，是Document AI開始支援數位PDF檔案。PDF格式常被用於採購、貸款和合約等應用程式，PDF分為證件掃瞄等影像形式，以及可供複製貼上和突出顯示文字的數位形式。而現在Document AI OCR完全支援數位PDF檔案，代表著該服務能夠擷取和來源文件完全相同的文字和符號。

由於Google會定期升級Document AI OCR所使用的機器學習模型，雖然新模型帶來新功能，但也可能改變OCR行為，因此Google現在加入了OCR版本控制，讓用戶能夠凍結OCR模型行為，確保OCR的行為一致。對於有嚴格法遵要求的產業，OCR版本控制也有助於維持相同的模型版本，最大程度減少版本間重新認證堆疊的工作量，透過OCR版本控制讓企業可以靈活選擇適合業務需求的版本。

熱門新聞