Lucene:分词器和索引文件

Lucene系列介绍

Lucene:分词器和索引文件

目录

1、分词器

分词器,对文本资源进行切分,将字符文本串按照一定的规则切分为一个个可以进行索引的最小单位(关键词),服务器空间,以便检索时使用。

建立索引和进行检索时都要用到分词器。为了保证能正确的检索到结果,在建立索引与进行检索时使用的分词器应是同一个。

2、索引文件结构

索引库是一组索引文件的集合。

索引文件的检索:索引表规模相对较小,文档集合规模较大。进行检索时,先从检索索引表开始,美国服务器,然后找到相对应的文档。如果查询中仅包含一个关键词,则在索引表中找到该关键词,并取出它所对应的文档就可以了。如果查询中包含多个关键词,则需要将各个关键字检索出的文档记录进行合并。,美国服务器而在于当时的那份心情。可是旅行的彼时那刻我的心情一直是好的吗?

Lucene:分词器和索引文件

相关文章:

你感兴趣的文章:

标签云: