碩網SmartKMS Express 4.0

企業不論規模大小，絕大部分可供系統檢索的資料來源，多以非結構性資料為主，企業所需的資料，散落在網路的檔案分享上，說是大海撈針一點也不為過，然而這還是已具現成網頁、文件檔案等形式的部分的顯性知識，而隱性知識更需要特殊的方式，才能予以擷取、分析。

檢索是知識管理系統的基礎，SmartKMS除了承受使用者上傳的各式資料以外，更能主動蒐集特定的內外資料來源，不限於網站的各種網頁，還包括現有網路上的各種應用系統，有別於其他搜尋引擎或分類目錄服務，SmartKMS可以做到個人式而非網站式的代理搜尋。至於以Java開發，遵循J2EE標準，文字處理採用Unicode，資料庫能平移到Microsoft SQL Server及 Oracle，能在IBM WebSphere、BEA WebLogic等跨平臺環境使用，都是目前臺灣廠商對KM普遍的做法。
多種資料來源的整合

網頁擷取元（WebSpider）的功能，極類似網頁離線瀏覽軟體，這類軟體的用途往往僅限於離線使用，或當作加速網頁瀏覽速度、保存網站資料等用途，從點擴充到線的網頁保存與聚集，從線到面的搜尋結果俯瞰綜覽，對企業經常存取的網站資源，持續性的鎖定內容的更動變化。

檔案系統擷取元（FolderSpider），則以檔案系統存取的路徑為範圍，可以是網路芳鄰裡，具有存取權的目錄，這很符合企業內部網路最常使用（或是最浮濫的分享，導致難以將資料結構化）的檔案分享方式，使用者並不需要刻意上傳檔案，來充實KM系統內的資料。

資料庫擷取元（DatabaseSpider）把觸角伸進企業系統內的各種資料庫中，定期撈取新進資料。因為資料庫是容納企業內部運作的所在，所有的流程必定在此留下記錄，以作為各式報表統計用，所以資料庫內必定蘊含了許多對企業深具意義的數據與文字。

電子郵件擷取元（EmailSpider），直接到郵件伺服器內，蒐集特定的帳號內的信件內容，予以分析。電子郵件是企業網路資源的一部分，也是最廣泛運用的一種溝通方式，以公用帳號的觀點來看待郵件擷取元的功能，它能夠處理產品建議、客戶投書或售前售後的服務；以整體帳號資源而論，如果暫且拋下員工隱私權不管，企業電子郵件帳號裡面的往返溝通、資料與檔案交換、事宜的確認與約定，及業務窗口的對應、人員的動態，幾乎都能在電子郵件裡面找到答案，也就是說企業實際經營面的瑣碎與無所不包，都全在員工的電子郵件信箱裡。對於e化程度不足，尚缺乏ERP系統的中小企業來說，甚至已經使用KM系統的企業，員工電子郵件的內容，仍是權力與IT技術，無法趨近的灰色地帶。相關文章推薦與自動摘要

SmartKMS的自動相關連性引擎，使用統計的方式，自動分析相關文章、關鍵字、分類、作者。它不受語言的限制，然而多國語言的斷字斷詞方式畢竟各自有所差異，仍需要針對特定的語言調校，另行客製化完成。

全文檢索包含常見的布林檢索、作者/標題/日期、排序能力，及KM系統內最重要的部分－知識地圖；而模糊搜尋能使用同義字詞庫來對應，如果不在預設的同義字詞內時，就透過以文找文的方式，來找到包含同義字詞的文章。

自動摘要功能的由來是，因為SmartKMS的多重資料來源架構，並不一定有固定的上傳者，逐份文件地做出人工的摘要與描述，因此需要這個功能替所有的資料，自動建立摘要。在單篇文件上，以句子為單位摘錄大綱，多篇文件則以段落為單位摘錄，另外可以擷取多篇文章的共同關鍵詞組成「描述資料的資料」（Meta Data）。

檢索結果，普遍的做法是全數列出，頂多做到自動分頁，依主題自動分群的卻不多，SmartKMS把搜尋結果分群叢集，列出共同關鍵詞與文件連結，使用者將較快搜尋到文件。

由於資料來源的存取排程時間不一，系統內資料經常是新舊夾雜的，因此必須安排時間定時計算相關性，索引也需定期重建。以文找文的功能則是相關性引擎的延伸，可以讓使用者以一段文字敘述的輸入，讓系統比對分析出相關性較高的資料連結。後臺的管理介面，能依需求自行定義資料同步存取的時間點，及資料相關性的定期計算時間。
知識樹自動分類

以搜尋引擎網站為例，關鍵字搜尋資料是一種批次性的檢索動作，藉由解析出來的結果與關鍵字、詞與段落，撿取使用者想要的結果，相對地主題式瀏覽是另一種找到資料的方式，在KM系統內，知識地圖的樹狀結構分類就是支援這一類層次的搜尋。

SmartKMS分類的方式有兩種，依據語意（Relevance-based）和規則（Rule-based）來分類，同時也能夠跨類別存取單一文件。自定類別以外，亦具有全自動分類的能力，不過還是需要專家介入做出符合需求及個別差異的調整，彈性極高。

目前SmartKMS仍無法在前端系統管理介面，提供備分與還原系統資料的功能，而產品組態修改，例如管理、監聽、HTTP等埠、郵件伺服器的設定與變更，只有在安裝時提供了介面設定，系統安裝後，如果想要更動上述網路設定的話，就必須深入底層修改設定檔；使用者電子郵件帳號則只提供一組。

在使用者介面上的用心與細緻，值得讚賞。例如搜尋結果裡的文件，滑鼠游標一經過該連結，就可以直接預覽內容，完全不用點選；圖示也不會太花俏，操作介面很直覺易用，互動性也很好。系統管理者只要設定好資料來源的擷取方式，終端使用者在未上傳與分享自己的知識前，就能夠輕易地使用這項工具的便利性，進而習於運用SmartKMS的系統。文⊙李宗翰
相關新聞自動到位的國會圖書館nplnews

立法委員上call-in節目或上臺質詢行政官員時，大都手懷一疊的新聞、法律資料等各種文件，意氣風發、飛揚跋扈地口誅筆伐；這些資料一部分來自立委的助理們的蒐集，立法院國會圖書館的國會新聞系統，也能幫助提供這方面的服務，而最新即將正式上線的新聞知識管理系統，正是知識管理應用的樣貌之一。

立法院是一個知識密集性很高的組織，國會圖書館館長顧敏，本身對知識管理的需求有極深的體認，為了提升資訊服務能力，因此投入這項系統。館方開出一份很完整的徵求需求建議書，並評估過五家廠商的專業技術、價格、大型系統的開發經驗，最後選擇了碩網資訊的SmartKMS，作為新聞KM的主架構，並針對國會圖書館的需求展開客製化設計。

主要挑戰是各大新聞報社。固然報社對每則新聞需要配合意願，複雜的是，多達13家的報紙，各自未經處理資料（Raw Data），格式差異極大，解析與定義的方式無法採用共通的規則，資料規模龐大，館方估計一年約有150萬條新的新聞被收錄，但卻無法強制上游統一格式；加上從報社FTP回來的新聞檔，內容並不是百分之百保證見報，原因是報社內部在製稿、審稿中，資料回填機制一旦不完全，就會產生誤差，資料的正確性因此降低，必須再安排館內人力做驗證。

舊的國會新聞系統，館方須剪輯報紙後掃描成圖檔，然後再依照各則新聞，加上影像檔的備註與分類性質，然而影像是無法用作檢索的，只能靠備註、分類關連，且不能讀取影像內文，並不能算是全文檢索。另外極度依賴剪刀、漿糊的新聞剪輯，好處是正確率高。目前的例行工作，需每日閱讀所有報紙，然後與系統比對，做資料驗證，館長稱之為「畫龍點睛」的任務。新系統會發生的狀況是，會遇到內容與標題牛頭不對馬嘴，須向報社反應；假如報社文件格式更動，系統需要修改，這的確是無可奈何。

目前館方須同時維護新舊系統，等到新系統確實能夠支撐起現有服務，館方才能放手讓新系統正式獨當一面。屆時人員的維護，除了手動增加資料與其他主題、關鍵字的關聯性，會更有餘裕去耕耘更多的分類。

導入KM系統的成效
1.為立法委員量身定做個人化專區，透過新聞資料庫的累積，更可以作為長期問政的回顧與依據。
2.單一閱報窗口，可以廣閱所有報紙新聞，更包含了選區的地方新聞，讓委員們，也能很清楚選區當地動態。
3.剪報能力大幅提升，平均一天的處理量，過去須一個月完成。
4.可整合現有的資料來源，並能夠製作成相關專題，可呈現於報表、電子郵件、網頁形式，甚至供作實體印刷品用。

熱門新聞