龍捲風科技推出的Tornado Search 5.0版,主要新增Lotus Notes及搜文通模組,目的是解決Lotus Notes搜尋不易,及紙本文件掃描成圖檔後不易檢索的問題。

可建30個索引庫,以利資訊的分類Tornado Search包括管理中心及搜尋入口兩個網站,必須在管理中心建立索引庫,系統才能檢索到其中的內容。Tornado Search中可建置30個以內的索引庫,區分索引庫的好處是,可以針對使用者設定不同的類別,縮小檢索的範圍,並提升搜尋的速度。應用時,可以在不同網站中,嵌入特定索引庫的搜尋框,提供專屬用途的搜尋機制。

為了強化搜尋的精準度,Tornado Search在建立索引庫時,會轉換文字的編碼、格式及字型。

Tornado Search索引的資料來源類型,包括網站、檔案系統或者資料庫。

檔案的部分,Tornado Search是結合Windows系統的NTLM身分驗證機制,套用企業原先透過Windows設定的存取權限,進而針對不同使用者呈現授權的搜尋列表。至於其他非Windows的檔案系統,只要能透過Windows的網路芳鄰連線,並利用NTLM授權,Tornado Search就可以建立索引,提供搜尋結果。

至於ERP、CRM或KM等需要應用到資料庫的系統,Tornado Search也可以設定資料庫連線建立索引。

使用經驗與Google相同,學習門檻很低
Yahoo!與Google是使用者最常用的搜尋引擎,Tornado Search在操作上延續同樣的使用經驗,以降低學習門檻。例如輸入「搜尋 引擎」,系統會找出文章中有「搜尋」及「引擎」的文章,比較特別的是,如果希望查詢的結果更精確,那麼輸入「”搜尋引擎”」,加上引號,Tornado Search檢索的結果,只會出現完全符合該條件的內容。

另外,搜尋引擎常見的自動完成功能,Tornado Search也運用Ajax技術達成。此外,還有,拼字檢查功能,例如輸入「searchh」,系統會提示「你是不是要查:search」。

上述英文部分的校正,實際上是系統運用詞庫比對;而中文的部分,例如輸入「龍卷風」所提示的「你是不是要查:龍捲風」,則是累積使用者的關鍵字回饋,因此系統的使用時間越久,校正警示的正確性越高。

相關詞與熱門排行,揭示延伸的有用資訊
搜尋結果頁中,Tornado Search會提供一些輔助搜尋的機制,頁面右方有一個小提示框,顯示與搜尋內容有關的相關詞、同音詞及同義詞。

相關詞是與使用者查詢的關鍵字有關的其他關鍵字,例如搜尋「tornado」,由於系統判別出現tornado的文章,常常也會出現「typhoon」所以,就會在相關詞中提示,而使用者可以利用相關詞功能,找到該領域其他的有用知識。

為了因應中文輸入打錯字的機率很高,同音詞功能即幫使用者找到「音同字不同」的關鍵字資料。而同義詞則是在管理介面中設定相同意義的詞彙,由於臺灣與中國的用詞,不僅是繁簡轉換,例如軟體與軟件、印表機與打印機,這些就在同義詞中定義,系統就可以對照檢索相關資訊。

此外,為了幫助使用者了解公司內部檢索的趨勢,可以點選「熱門關鍵字」或「熱門文章」,前者指使用者輸入的關鍵字,後者則是查詢之後,開啟的文件。

另外,類似Google關鍵字廣告,Tornado Search也有「置頂文章」功能,管理者可以在系統中設定100篇以內的置頂文章,只要檢索的文章中包含使用者下的任何關鍵字,該篇文章就會是搜尋結果的第一篇。對企業而言,可以突顯想要強調的重要資訊。

索引庫的更新可以設定成排程執行
另一個重要的功能是索引資料庫的排程。事實上,初次建置索引庫耗時最久,後續更新,Tornado Search是透過「漸進式索引」,只針對變更的部分重建,所以更新索引庫需要的時間,並不會隨資料量的增加而遞增。

不過,企業設定排程時,仍不宜設得過於密集,因為建立索引是耗費系統資源的動作,如果過於頻繁,使用者查詢時的回應速度會受到影響。此外,針對不會再更新的資料,可以設定失效日,系統就不再浪費資源重建索引。

針對檔案系統中存放機密資料的路徑,Tornado Search可以設定排除條件,避免資料被系統擷取而建立索引。若是一時疏忽使機密資料曝光,可以利用「隔離文件清單」功能補救,撤掉特定文件,不讓使用者找到。文⊙李延華


龍捲風Tornado Search 5.0的特色功能


允許自訂搜尋入口及結果呈現的樣式
搜尋框以及搜尋結果的標題、內文、路徑、檔案資訊與關鍵字的反白效果等,可以在管理功能中設定。


透過熱門關鍵字了解別人關心的議題
Tornado Search提供熱門關鍵字、熱門文章及熱門主題等功能,幫助使用者了解最近熱門的議題。


置頂文章突顯站方強調的資訊
針對企業可以將想強調的內容,設為「置頂文章」,只要文中包含使用者輸入的關鍵字,該文就是搜尋結果的第一篇。



搜文通解決紙本內容的搜尋問題

企業間主要往來的承認文件,例如合約、訂單、採購單及公文等,都是紙本的型式,然而不易保存與檢索。企業為了管理這些內容,普遍的作法是將紙本掃描成圖檔,然後結合OCR軟體,解析成文字。

但是中文辨識一直以來有準確率的瓶頸,例如經常將「實」辨識為「貫」,「社」辨識為「祉」,「引」甚至常被誤認為「弓」和「中」兩個字。

龍捲風科技為此推出搜文通模組,可以在不校正內容的情況下,運用搜尋引擎的字形容錯及模糊搜尋的功能,彌補OCR準確率的問題,使用者輸入關鍵字,還是可以找到需要的檔案。

例如使用者查詢「中央研究院」,而OCR產出的內容是「中『天』研究院」,Tornado Search自動判斷「央」和「天」是OCR經常辨識錯誤的字,所以只要符合「中央研究院」和「中天研究院」的內容,都會檢索出來。

此外,搜文通中還有資訊安全的機制,企業可以設定通報條件,當使用者掃描或傳真的文件,包含特定關鍵字,搜文通便發送訊息通知特定人。文⊙李延華



龍捲風Tornado Search 5.0

建議售價:98,000元

龍捲風科技

(02)2790-8831

www.tornado.com.tw

伺服器作業系統需求 Windows XP/2003
Web伺服器需求 IIS 5.1、6.0
資料庫需求 SQL Server 2000/ 2005、Oracle 9i / 10g、MySQL 5.1.4、Access 2003
個人端瀏覽器需求 IE 6.0/7.0
支援的資料格式 HTML、PHP、ASP、ASPX、JSP、CFM、Office、PDF、XML、RSS、TXT、Lotus Notes(選購)

熱門新聞

Advertisement