心理

当前位置 /首页/完美生活/心理/列表

es倒排索引原理

es倒排索引原理

l原理:建立倒排索引最关键的部分就是分词器。分词器会对文本内容进行一些特定处理,然后根据处理后的结果再建立倒排索引

主要的处理过程一般如下: 1、character filter:符号过滤,比如hello过滤成hello,I&you过滤成I and you 2、tokenizer:分词,比如,将hello you and me切分成hello、you、and、me 3、token filter:比如,dogs替换为dog,liked替换为like,Tom 替换为 tom,small 替换为 little等等。 不同分词器的行为是不同的,Elasticsearch主要内置了以下几种分词器:standard analyzer、simple analyzer、whitespace analyzer、language analyzer。

TAG标签:es 倒排 索引 #