查看分词的命令, ES配置完成后需要测试分词,看看分词是否达到预期效果。
curl 命令查看:
1. 使用自定义的分析器查看分词:ansj_index_synonym:自定交分析器名称. pretty :json格式显示
- curl -XGET 'http://localhost:8200/zh/_analyze?analyzer=ansj_index_synonym&pretty' -d '童装童鞋'
2. 使用自定义的分词器(tokenizer)和过滤器(filters)查看分词:
- curl -XGET 'http://localhost:8200/zh/_analyze?tokenizer=ansj_index&filters=synonym&pretty' -d '童装童鞋'
3. 查询某个字段的分词:
- curl -XGET 'http://localhost:8200/zh/_analyze?field=brand_name&pretty' -d '童装童鞋'
“brand_name”:字段名称,如果是字段是nest,object类型,也可以写成"brand_name. name"
除了自定义自己的分析器,ES自己也有内置分析器如:
standard
simple
whitespace
stop
keyword
pattern
language
snowball
custom
需要英文好点在同鞋。
ES还内置了分词器和过滤器:
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-tokenizers.htmlstandard
edge_ngram
keyword
letter
lowercase
ngram
whitespace
pattern
uax_email_url
path_hierarchy
ascii folding
length
lowercase
uppercase
nGram
edge_ngram
porter_stem
shingle
stop
word_delimiter
stemmer
stemmer_override
keyword_marker
keyword_repeat
kstem
snowball
phonetic
synonym
reverse
elision
truncate
unique
pattern_capture
pattern_replace
trim
limit
hunspell
common_grams
normalization
delimited_payload
keep_words
elasticsearch-analysis-mmseg
https://github.com/medcl/elasticsearch-analysis-mmseg
基于 http://code.google.com/p/mmseg4j/
elasticsearch-analysis-jieba
https://github.com/huaban/elasticsearch-analysis-jieba
elasticsearch-analysis-ansj
https://github.com/4onni/elasticsearch-analysis-ansj
elasticsearch-analysis-ik
https://github.com/medcl/elasticsearch-analysis-ik
elasticsearch-analysis-paoding
https://github.com/medcl/elasticsearch-analysis-paoding
中文分词推荐用ik,mmseg,这两个分词器有更新。
ansj,paoding分词器很久没更新了,没有对应比较高的es版本。
相关推荐
elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点: 中文分词:elasticsearch-analysis-ik 是基于...
elasticsearch-analysis-pinyin-7.4.0 es拼音分词器7.4.0
elasticsearch-analysis-ik-6.3.0 分词插件,对应elasticsearch 6.3.0 的版本!
elasticsearch-jieba-plugin 是 Jieba 中文分词插件。试用 Elasticsearch 5.1.2 版本,基于 huaban 开源的的 jieba java 实现。使用checkout tag: v5.1.2git checkout v5.1.2运行gradle buildPluginZip创建 ...
最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip
该插件是elasticsearch拼音分词插件,支持中文,拼音,首字母混合搜索。 在实际搜索需求中,常常需要对中文做拼音搜索,首字母搜索或者中文拼音首字母混合搜索。比如要对 "广发聚财信用" 这几个中文进行拼音搜索,...
elasticsearch-7.14.0+分词器+head插件下载
elasticsearch-ik-7.16.2 分词器
elasticsearch-analysis-ik-5.2.0 分词器 大数据 分析查询
elasticsearch-analysis-ik-5.6.8, 中文分词器analysis-ik官方绿色解压版
elasticsearch-analysis-ik-7.3.2 最新版本(2019.09.15) ES中文分词器:ik分词器
elasticsearch-analysis-pinyin-7.5.1 拼音分词
elasticsearch-analysis-ik-7.17.0
elasticsearch-7.17.6及对应版本IK分词 适合人群:elasticsearch初学者 Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elastic...
elasticsearch-8.11.0的分词器,配合es同版本使用,有粗粒度和细粒度分词
elasticsearch-analysis-ik分词器,最新版本7.10.1
elasticsearch-analysis-ik-7.14.0.zip和elasticsearch-analysis-ik-7.15.2.zip 帮助github速度比较差的同学下载
elasticsearch-analysis-ik-7.4.2,es7.4.2 ik分词
elasticsearch-analysis-pinyin-6.8.2.zip elasticsearch拼音分词插件
Elasticsearch 中文分词包 elasticsearch-analysis-ik-7.8.0.zip 必须和 elasticsearch版本匹配