2009年4月24日星期五

Oracle数据库中文全文索引详解(二)

Oracle实现全文检索,其机制其实很简单。 即通过Oracle专利的词法分析器(lexer),将文章中所有的表意单元(Oracle称为term,此处我理解为单词或者一些有意义的词语) 找出来,记录在一组以dr$开头的表中,同时记下该term出现的位置、次数、hash 值等信息。检索时,Oracle 从这组表中查找相应的 term,并计算其出现频率,根据某个算法来计算每个文档的得分(score),即所谓的‘匹配率’。而lexer则是该机制的核心,它决定了全文检索的 效率。Oracle 针对不同的语言提供了不同的 lexer, 而我们通常能用到其中的三个……

点击此处查看全文

没有评论: