臺灣軟體業的市場大都侷限在大中華地區,即使有再好的領域知識(domain know-how),套裝軟體的商機仍有限。由於外商搜尋軟體在雙字元組的華文市場仍有技術瓶頸,臺灣廠商在這方面將有很大的優勢,以搜尋引擎起家的龍捲風科技,去年起也轉入資訊檢索(Information Retrieval,IR)軟體元件市場,將多年的領域知識包裝成軟體元件銷售,與其他解決方案廠商共同分工。彌補DBMS不足,加強非結構性資料處理能力
IRMS R2(Information Retrieval Management System R2)使用元件化和鬆散偶合(Loosely)的架構平臺,希望協助軟體開發商、系統整合商和經銷商將資訊檢索技術整合進企業應用平臺,進而提供企業內異質資料更有價值、更即時及更具相關性的搜索服務。IRMS的目標客戶不是一般的企業,而是軟體開發商和系統整合廠商。
若企業就像是一部電腦,應用程式是處理器,那整個IRMS技術平臺就像一張主機板,包含虛擬資料庫層(Data Virtualization Layer)和資料檢索元件槽(IR Component Slots)兩個主要部分,可以隨時增加元件或外掛程式。
在企業內部存在許多非結構化資料,由於一般DBMS(Database Management System,資料庫管理系統)缺乏良好的演算法,處理非結構化資料不但效能低落,也會耗費大量時間。IRMS正好可以彌補DBMS的不足,系統特別加強非結構性資料的處理能力,在虛擬資料庫層包含多種資料轉接器(Data Adapter),能分析各種結構化(數字)、半結構化(試算表)和非結構化(文件)的資料。
其中Extractor元件主要針對各種不同的檔案,包括HTML、TXT、ASP、Word、Excel、PDF及DynaDoc等文件。而Composer元件則能分析各種文件管理系統、內容管理系統或訊息中介軟體(IBM Notes、資料庫、FileNET),包含Local File(本機或網路芳鄰)、Remote File(遠端網站)、資料庫和Lotus Notes等。
為了提高查詢的效率和相關性,IRMS使用自然語言處理(Natural Language Processing)技術,包括相關檢索詞建議、內容彙整和摘要及相關文件檢索等,能夠動態執行檢索功能。系統並支援XML訊息傳遞,可即時檢視最新異動的資料,更靈活地同步索引、群組權限及文件資料的設定,增加資訊使用和管理的效率。
自製元件,各種格式難不倒
一般的搜索引擎往往只支援一種語系,如果要檢索中文、日文及韓文等不同語系文字,就必須建立各種語系文字的索引,IRMS R2使用Unicode核心的索引機制,可以支援多國語系文件。
由於IRMS是一個元件平臺而非套裝軟體,所以我們在測試時是使用龍捲風知識檢索4.2版的操作介面。目前產品已經整合進EIP、KM、PKI等系統。在功能上,除了一般常見的文件檢索功能,也可以依不同的檔案客製化所需的Extractor元件。MP3和ZIP是電腦內常見的檔案格式,但要從眾多的檔案中找到所需的歌曲或壓縮檔卻不容易,假如使用Windows搜尋功能,可能有80%的資料不是你所想要的。我們需要能擷取重點又節省時間的工具。
龍捲風展示MP3和ZIP這兩個Extractor元件,在檢索資料前需先建立索引,系統會擷取出Metadata的資料,並建成索引資料庫。只要以該首MP3的歌手或歌名為關鍵字,就可以找到所要的歌曲;ZIP檔案則不只檢索檔案名稱,系統也會搜尋壓縮檔案內的文件,尋找與關鍵字相關的檔案文件,使用者不需再一個個解壓縮尋找。若有特定格式的檔案,也只要以簡單的程式寫出Extractor元件即可。文⊙陳世煌
龍捲風科技的套裝軟體產品
除了IRMS之外,龍捲風的相關套裝軟體也都持續的進行更新,並加以模組化,再整合其他解決方案。目前龍捲風有知識檢索、BI Radar 商情雷達及知識分類系統等3款產品。
知識檢索系統
平常我們使用入口網站搜索資料,常常會遇到找不到資料,不然就是找出一堆不相關的東西,知識檢索系統運用自然語言技術,透過人工智慧學習、分析功能,自動為龐雜的資料建立關聯系統,讓使用者可以從單一辭彙或資料找到相關資訊。
使用者只需以一般入口網站的操作方式,就能找到符合需要的資訊。在檢索的主頁中,除了輸入搜索字串外,還可以設定每頁顯示的筆數、檔案的屬性,以及是否啟動中同音功能、同義詞庫、相關文件功能……等功能,讓使用者精確定義查詢辭彙。
BI Radar 商情雷達系統
BI Radar 商情雷達系統(Business Information Radar)讓企業依照自己的需求,主動監控網路上的市場情報和專業訊息,即時彙報給企業成員,讓員工充分掌握外部資訊。資訊的收集能達到完全個人化,針對不同的專業需求,提供專屬的資訊內容,提高企業整體反應的效能。
商情雷達採用IIA(Intelligent Information Agent)技術,模擬人在瀏覽網路資訊的行為,再從網頁中過濾出有用的資訊,進而儲存與追蹤。即使一些需要登入的網頁,或是遇到錯誤狀況時,系統也都能自動登入及排除問題,持續收集資訊。
知識分類系統
我們上網查詢資料,最常利用入口網站的搜尋功能,鍵入關鍵字進行比對,尋找到符合的資料;假如要搜尋的資料是個概念,就不適合用全文檢索,建議使用分類導覽的方式,例如不知看哪部電影,可以到電影分類找新上映的電影。對應至企業內部,存在著相同的使用習慣與需求,在Delphi Group調查報告中指出,「搜尋引擎」和「自動分類」都是一般人最需要的知識管理工具。
知識分類系統採用Enhanced SVM分類演算法,會根據文件上下文的語意自動將文件歸類,取代主觀、耗時的人工分類。利用多維度分類法則,同一份文件可被分類至各個相符的類別中,讓資料能有效的運用。經過分類的文件,都採超連結方式對應至實體文件的位置,不會重覆儲存,避免造成資源浪費。
金石網絡用KM帶來等比效益
金石網絡協理郭柏晴認為知識管理是一個名詞,從有商業就有知識管理,以前叫做流程,隨著時空背景的改變,現在只是套個新名詞。知識管理本身就一個流程,類似流程的專業化,就像ISO流程,讓供給和需求這兩端快速配對。
在金石堂成立時就有知識管理,只是一開始是以口頭說明或訓誡,到了一定規模後才建立公司準則,然後再與績效和獎懲「掛勾」。到了前年,因為整個硬體環境成熟,建置KM系統能快速反應,縮短標準處理步驟的時間。
金石網絡建置知識管理系統的動機是讓權則更精確,知識管理可以說是問題處理準則,有問題該找誰,例如採訪當天,報紙刊登線上訂書免運費,但該單位負責人不在,郭協理可以馬上找到代理人,立即處理問題,在這背後要有一套完整的處理流程。
在尚未採購龍捲風知識檢索系統前,金石網絡自行開發相關的系統,但搜尋速度不儘理想,希望採購新系統來滿足消費者的需求。金石網絡總共評估過4家廠商,最後選定龍捲風知識檢索系統。整個系統建置時並沒有太大的問題,因為他們並不是龍捲風知識檢索系統的第一隻「白老鼠」,加上相信專業,經過半天的安裝和2天的測試調整,一個星期就讓系統上線。
在成效上,郭柏晴認為好的工具能帶來等比的效益,他以外科開刀為例,當工具進步後,不僅醫生開刀更準確,一天也能動更多的手術。更換系統後,金石網絡的業績也提升2到2.5倍,現在每個月營收約1500萬元,更重要的是能滿足客戶的需求。
另外,在建置KM系統時,郭柏晴認為資訊人員必須與使用者充分的溝通,需要有很強的系統分析師才能了解使用者的需求,又能與程式設計師溝通,他以金石網絡為例,程式設計師知道什麼叫訂單,但卻不一定了解相關的銷售結款流程,所以他將使用者訓練成系統分析師,可以寫需求書給程式設計師。而且即使該員工離職後,也有良好的文件管理,可以留給代理人參考。文⊙陳世煌
熱門新聞
2025-02-08
2025-02-10
2025-02-08
2025-02-08
2025-02-10
2025-02-08