目錄
目錄X
馬太福音動易全文檢索引擎預(yù)覽版悄然露面
細(xì)心的網(wǎng)友們可能已經(jīng)發(fā)現(xiàn)了,點擊動易官方網(wǎng)站頂部的搜索按鈕,將跳轉(zhuǎn)到一個全新的類似Google的搜索界面——這就是動易廣州研發(fā)中心的最新成果:動易全文檢索引擎!
(圖1:動易全文檢索界面)
(圖2:多關(guān)鍵詞組合檢索)
全文檢索是指計算機(jī)索引程序通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現(xiàn)的次數(shù)和位置,當(dāng)用戶查詢時,檢索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個過程類似于通過字典中的檢索字表查字的過程。其好處是通過對網(wǎng)站數(shù)據(jù)庫的數(shù)據(jù)建立索引,查詢時不訪問數(shù)據(jù)庫,能有效減輕數(shù)據(jù)庫和系統(tǒng)的壓力,從而實現(xiàn)大容量、高速訪問的目標(biāo)。
目前動易全文檢索引擎Ver0.0.0.1Preview版具備有多關(guān)鍵字搜索、關(guān)鍵詞組合搜索、全文檢索(對標(biāo)題與內(nèi)容同時檢索)等功能,能快速準(zhǔn)確地檢索到相關(guān)信息并對關(guān)鍵詞進(jìn)行高亮顯示。
多關(guān)鍵字組合、句子查詢,達(dá)到毫秒級的速度
為了迎合大多數(shù)網(wǎng)民對搜索功能的慣性和依賴性,很多網(wǎng)站只好提供通過SQL語句查詢數(shù)據(jù)庫來實現(xiàn)一些簡單的模糊匹配,但是這種“搜索”功能通常只能匹配一個關(guān)鍵字,匹配的數(shù)據(jù)庫字段也非常有限。而使用動易全文檢索,用戶可以隨便地輸入一個或多個關(guān)鍵詞,甚至輸入一句話,大大提高了用戶操作的友好度。
(圖3:分詞檢索與全文檢索)
查詢不訪問數(shù)據(jù)庫,降低數(shù)據(jù)庫負(fù)擔(dān),減輕系統(tǒng)壓力
當(dāng)用戶直接查詢數(shù)據(jù)庫,不但查詢速度慢,而且會導(dǎo)致數(shù)據(jù)庫的壓力增大,當(dāng)數(shù)據(jù)庫記錄超過一定數(shù)量時,頻繁地查詢數(shù)據(jù)庫,會導(dǎo)致數(shù)據(jù)庫的負(fù)載直線上升,從而波及其它功能的使用,尤其是同時有很多用戶訪問的時候,對數(shù)據(jù)庫和系統(tǒng)會產(chǎn)生較大的壓力,嚴(yán)重時會導(dǎo)致信息塞車,甚至?xí)?dǎo)致系統(tǒng)崩潰。
動易全文檢索引擎則是一套真正的搜索引擎,它通過對數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行索引,在查詢時不訪問數(shù)據(jù)庫,可以實現(xiàn)毫秒級的檢索速度和每秒上百次的并發(fā)訪問,用戶搜索對數(shù)據(jù)庫的壓力為零。
略微遺憾的是,在這個預(yù)覽版里,索引本地文件與索引外站網(wǎng)頁的功能并沒有出現(xiàn);此外,當(dāng)遇到繁體輸入時,系統(tǒng)還無法將其自動進(jìn)行簡繁體轉(zhuǎn)換匹配,而搜索結(jié)果排序以及高級搜索(“完全匹配、與、或、非”等多種組合關(guān)鍵詞的搜索方法)等功能都尚未提供,另外對網(wǎng)站群中的各個網(wǎng)站的分別索引與搜索的管理功能還有待加強(qiáng)。畢竟這是第一個預(yù)覽版,讓我們共同期待下一個版本的面世吧。
用戶登錄
還沒有賬號?
立即注冊