已停用 啟用查詢紀錄
quán wén jiǎn suǒ
在全文資料中找出所需要的單字、語詞或特定字串的系統。全文檢索與一般傳統檢索之最大差異是:全文檢索除了可以檢索到表格化之資料,它也可以檢索到敘述性之資料。不須使用關鍵語,也不須先將語詞分類,完全以自由用語(亦即在全文資料中出現的任何一字、語詞或字串)的方式來查詢資料,在使用上更為便利,更具彈性。因此,舉凡所有文字性的資料,包含書籍、報導、科技文獻、法規條文、商場訊息等皆適合使用全文檢索系統。
從文本或資料庫中,不限定資料欄位,自由地萃取出訊息的技術. 執行全文檢索任務的程式,一般稱作搜尋引擎,它將使用者隨意輸入的文字,試圖從資料庫中,找到符合的內容. *語根處理 (stemming) *符素解析器 (token parser) 1-gram, 2-gram, n-gram *斷詞/分詞 word segmentation * inverted index * 布林式 boolean * 統計模型 Probabilistic model * 向量空間模型 vector base model * 隱性語義模型 Latent semantic model *查全率(recall rate),查準率(precision) * Apache Solr * BaseX * Clusterpoint Server (freeware licence for a single-server) * DataparkSearch * Ferret * Ht-//Dig * Hyper Estraier * KinoSearch * Lemur/Indri * Lucene ...閱讀更多
MD5 | SHA1 |
---|---|
48e5afa8c4a9f869640b409e7e580d05 | ea8fac65b264725b981f05d4d59e165dc5b51e00 |
什麼是雜湊 |