企業不論規模大小,絕大部分可供系統檢索的資料來源,多以非結構性資料為主,企業所需的資料,散落在網路的檔案分享上,說是大海撈針一點也不為過,然而這還是已具現成網頁、文件檔案等形式的部分的顯性知識,而隱性知識更需要特殊的方式,才能予以擷取、分析。

檢索是知識管理系統的基礎,SmartKMS除了承受使用者上傳的各式資料以外,更能主動蒐集特定的內外資料來源,不限於網站的各種網頁,還包括現有網路上的各種應用系統,有別於其他搜尋引擎或分類目錄服務,SmartKMS可以做到個人式而非網站式的代理搜尋。至於以Java開發,遵循J2EE標準,文字處理採用Unicode,資料庫能平移到Microsoft SQL Server及 Oracle,能在IBM WebSphere、BEA WebLogic等跨平臺環境使用,都是目前臺灣廠商對KM普遍的做法。
多種資料來源的整合

網頁擷取元(WebSpider)的功能,極類似網頁離線瀏覽軟體,這類軟體的用途往往僅限於離線使用,或當作加速網頁瀏覽速度、保存網站資料等用途,從點擴充到線的網頁保存與聚集,從線到面的搜尋結果俯瞰綜覽,對企業經常存取的網站資源,持續性的鎖定內容的更動變化。

檔案系統擷取元(FolderSpider),則以檔案系統存取的路徑為範圍,可以是網路芳鄰裡,具有存取權的目錄,這很符合企業內部網路最常使用(或是最浮濫的分享,導致難以將資料結構化)的檔案分享方式,使用者並不需要刻意上傳檔案,來充實KM系統內的資料。

資料庫擷取元(DatabaseSpider)把觸角伸進企業系統內的各種資料庫中,定期撈取新進資料。因為資料庫是容納企業內部運作的所在,所有的流程必定在此留下記錄,以作為各式報表統計用,所以資料庫內必定蘊含了許多對企業深具意義的數據與文字。

電子郵件擷取元(EmailSpider),直接到郵件伺服器內,蒐集特定的帳號內的信件內容,予以分析。電子郵件是企業網路資源的一部分,也是最廣泛運用的一種溝通方式,以公用帳號的觀點來看待郵件擷取元的功能,它能夠處理產品建議、客戶投書或售前售後的服務;以整體帳號資源而論,如果暫且拋下員工隱私權不管,企業電子郵件帳號裡面的往返溝通、資料與檔案交換、事宜的確認與約定,及業務窗口的對應、人員的動態,幾乎都能在電子郵件裡面找到答案,也就是說企業實際經營面的瑣碎與無所不包,都全在員工的電子郵件信箱裡。對於e化程度不足,尚缺乏ERP系統的中小企業來說,甚至已經使用KM系統的企業,員工電子郵件的內容,仍是權力與IT技術,無法趨近的灰色地帶。相關文章推薦與自動摘要

SmartKMS的自動相關連性引擎,使用統計的方式,自動分析相關文章、關鍵字、分類、作者。它不受語言的限制,然而多國語言的斷字斷詞方式畢竟各自有所差異,仍需要針對特定的語言調校,另行客製化完成。

全文檢索包含常見的布林檢索、作者/標題/日期、排序能力,及KM系統內最重要的部分-知識地圖;而模糊搜尋能使用同義字詞庫來對應,如果不在預設的同義字詞內時,就透過以文找文的方式,來找到包含同義字詞的文章。

自動摘要功能的由來是,因為SmartKMS的多重資料來源架構,並不一定有固定的上傳者,逐份文件地做出人工的摘要與描述,因此需要這個功能替所有的資料,自動建立摘要。在單篇文件上,以句子為單位摘錄大綱,多篇文件則以段落為單位摘錄,另外可以擷取多篇文章的共同關鍵詞組成「描述資料的資料」(Meta Data)。

檢索結果,普遍的做法是全數列出,頂多做到自動分頁,依主題自動分群的卻不多,SmartKMS把搜尋結果分群叢集,列出共同關鍵詞與文件連結,使用者將較快搜尋到文件。

由於資料來源的存取排程時間不一,系統內資料經常是新舊夾雜的,因此必須安排時間定時計算相關性,索引也需定期重建。以文找文的功能則是相關性引擎的延伸,可以讓使用者以一段文字敘述的輸入,讓系統比對分析出相關性較高的資料連結。後臺的管理介面,能依需求自行定義資料同步存取的時間點,及資料相關性的定期計算時間。
知識樹自動分類

以搜尋引擎網站為例,關鍵字搜尋資料是一種批次性的檢索動作,藉由解析出來的結果與關鍵字、詞與段落,撿取使用者想要的結果,相對地主題式瀏覽是另一種找到資料的方式,在KM系統內,知識地圖的樹狀結構分類就是支援這一類層次的搜尋。

SmartKMS分類的方式有兩種,依據語意(Relevance-based)和規則(Rule-based)來分類,同時也能夠跨類別存取單一文件。自定類別以外,亦具有全自動分類的能力,不過還是需要專家介入做出符合需求及個別差異的調整,彈性極高。

目前SmartKMS仍無法在前端系統管理介面,提供備分與還原系統資料的功能,而產品組態修改,例如管理、監聽、HTTP等埠、郵件伺服器的設定與變更,只有在安裝時提供了介面設定,系統安裝後,如果想要更動上述網路設定的話,就必須深入底層修改設定檔;使用者電子郵件帳號則只提供一組。

在使用者介面上的用心與細緻,值得讚賞。例如搜尋結果裡的文件,滑鼠游標一經過該連結,就可以直接預覽內容,完全不用點選;圖示也不會太花俏,操作介面很直覺易用,互動性也很好。系統管理者只要設定好資料來源的擷取方式,終端使用者在未上傳與分享自己的知識前,就能夠輕易地使用這項工具的便利性,進而習於運用SmartKMS的系統。文⊙李宗翰
相關新聞自動到位的國會圖書館nplnews

立法委員上call-in節目或上臺質詢行政官員時,大都手懷一疊的新聞、法律資料等各種文件,意氣風發、飛揚跋扈地口誅筆伐;這些資料一部分來自立委的助理們的蒐集,立法院國會圖書館的國會新聞系統,也能幫助提供這方面的服務,而最新即將正式上線的新聞知識管理系統,正是知識管理應用的樣貌之一。

立法院是一個知識密集性很高的組織,國會圖書館館長顧敏,本身對知識管理的需求有極深的體認,為了提升資訊服務能力,因此投入這項系統。館方開出一份很完整的徵求需求建議書,並評估過五家廠商的專業技術、價格、大型系統的開發經驗,最後選擇了碩網資訊的SmartKMS,作為新聞KM的主架構,並針對國會圖書館的需求展開客製化設計。

主要挑戰是各大新聞報社。固然報社對每則新聞需要配合意願,複雜的是,多達13家的報紙,各自未經處理資料(Raw Data),格式差異極大,解析與定義的方式無法採用共通的規則,資料規模龐大,館方估計一年約有150萬條新的新聞被收錄,但卻無法強制上游統一格式;加上從報社FTP回來的新聞檔,內容並不是百分之百保證見報,原因是報社內部在製稿、審稿中,資料回填機制一旦不完全,就會產生誤差,資料的正確性因此降低,必須再安排館內人力做驗證。

舊的國會新聞系統,館方須剪輯報紙後掃描成圖檔,然後再依照各則新聞,加上影像檔的備註與分類性質,然而影像是無法用作檢索的,只能靠備註、分類關連,且不能讀取影像內文,並不能算是全文檢索。另外極度依賴剪刀、漿糊的新聞剪輯,好處是正確率高。目前的例行工作,需每日閱讀所有報紙,然後與系統比對,做資料驗證,館長稱之為「畫龍點睛」的任務。新系統會發生的狀況是,會遇到內容與標題牛頭不對馬嘴,須向報社反應;假如報社文件格式更動,系統需要修改,這的確是無可奈何。

目前館方須同時維護新舊系統,等到新系統確實能夠支撐起現有服務,館方才能放手讓新系統正式獨當一面。屆時人員的維護,除了手動增加資料與其他主題、關鍵字的關聯性,會更有餘裕去耕耘更多的分類。

導入KM系統的成效
1.為立法委員量身定做個人化專區,透過新聞資料庫的累積,更可以作為長期問政的回顧與依據。
2.單一閱報窗口,可以廣閱所有報紙新聞,更包含了選區的地方新聞,讓委員們,也能很清楚選區當地動態。
3.剪報能力大幅提升,平均一天的處理量,過去須一個月完成。
4.可整合現有的資料來源,並能夠製作成相關專題,可呈現於報表、電子郵件、網頁形式,甚至供作實體印刷品用。

熱門新聞

Advertisement