-
由天性懒惰,则直接用Medcl的即飞的航空模(elasticsearch-rtf),这是elasticsearch中文发行版,针对中文集成相关插件,方便我这些新手菜鸟学习,或者在生产环境中直接使用
-
servicewrapper (by elasticsearch team)
服务器环境下之管理
安装与使用,请参考elasticsearch-servicewrapper
-
analysis-smartcn (by elasticsearch team)
lucene默认的中文分词器
安装与使用,请参考elasticsearch-analysis-smartcn
-
transport-thrift (by elasticsearch team)
使用thrift进行数据传输,速度快
安装与使用,请参考elasticsearch-transport-thrift
-
mapper-attachments
-
analysis-ik (by Medcl)
中国鼎鼎大名的IK分词器,也是我最喜欢的分词器,推荐
安装与使用,请参考elasticsearch-analysis-ik
java API 在下面贴上:
// url test:http://192.168.1.108:9200/twitter/_analyze?analyzer=ik&text=%E6%B5%8B%E8%AF%95elasticsearch%E5%88%86%E8%AF%8D%E5%99%A8%E7%9A%84%E6%95%88%E6%9E%9C&pretty=true//1.create a index client.admin().indices().prepareCreate("index_ik").execute().actionGet();//2.create a mappingXContentBuilder mapping =XContentFactory.jsonBuilder().startObject().startObject("fulltext").startObject("_all").field("indexAnalyzer","ik").field("searchAnalyzer","ik").field("term_vector","no").field("store","false").endObject().startObject("properties").startObject("content").field("type","string").field("store","no").field("term_vector","with_positions_offsets").field("indexAnalyzer","ik").field("searchAnalyzer","ik").field("include_in_all","true").field("boost",8).endObject().endObject().endObject().endObject();PutMappingRequest mappingRequest =Requests.putMappingRequest("index_ik").type("fulltext").source(mapping); client.admin().indices().putMapping(mappingRequest).actionGet();//3.index some docsXContentBuilder builder1 =XContentFactory.jsonBuilder().startObject().field("content","美国留给伊拉克的是个烂摊子吗").endObject();XContentBuilder builder2 =XContentFactory.jsonBuilder().startObject().field("content","公安部:各地校车将享最高路权").endObject();XContentBuilder builder3 =XContentFactory.jsonBuilder().startObject().field("content","中韩渔警冲突调查:韩警平均每天扣1艘中国渔船").endObject();XContentBuilder builder4 =XContentFactory.jsonBuilder().startObject().field("content","中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首").endObject();XContentBuilder builder5 =XContentFactory.jsonBuilder().startObject().field("content","我爱我的中国 我的中国也爱我").endObject();BulkRequestBuilder bulkRequest = client.prepareBulk(); bulkRequest.add(client.prepareIndex("index_ik","fulltext","1").setSource(builder1)).add(client.prepareIndex("index_ik","fulltext","2").setSource(builder2)).add(client.prepareIndex("index_ik","fulltext","3").setSource(builder3)).add(client.prepareIndex("index_ik","fulltext","4").setSource(builder4)).add(client.prepareIndex("index_ik","fulltext","5").setSource(builder5));BulkResponse bulkResponse = bulkRequest.execute().actionGet();if(bulkResponse.hasFailures()){} logger.info("bulk state : {}",bulkResponse.hashCode());//4.query with highlightingSearchResponse searchResponse = client.prepareSearch("index_ik").setTypes("fulltext").setQuery(QueryBuilders.queryString("中国")).addHighlightedField("content")//.setHighlighterPreTags("<tag1>", "<tag2>")//.setHighlighterPostTags("</tag1>", "</tag2>").setFrom(0).setSize(10).setExplain(true)//Page .execute().actionGet();SearchHits hits = searchResponse.getHits();long total = hits.getTotalHits(); logger.info("search result total:{}",total);for(SearchHit hit : hits){Map<String,HighlightField> result = hit.highlightFields(); logger.info("A map of highlighted fields:{}",result);HighlightField titleField = result.get("content");Text[] titleTexts = titleField.fragments();for(Text text : titleTexts){ logger.info("title text: :{}",text);}}
-
analysis-mmseg (by Medcl)
安装与使用 请参考 elasticsearch-analysis-mmseg
java API 请参考上面的analysis-ik,因为类似,不必多贴!
-
analysis-pinyin (by Medcl)
拼音分词器,可为了SEO(mongodb的id不友好)而做友好的拼音url,也可用于拼音搜索中文,也可用于输入拼音提示中文的功能,推荐
安装与使用 请参考elasticsearch-analysis-pinyin
//test url : http://192.168.1.108:9200/medcl/_analyze?text=%E8%B0%AD%E5%BB%BA%E7%BA%B3&analyzer=pinyin_analyzerAnalyzeResponse analyzeResponse = client.admin().indices().prepareAnalyze("twitter","阳光天使").setAnalyzer("pinyin").execute().actionGet(); logger.info("size:{}", analyzeResponse.getTokens().size());List<AnalyzeToken> list = analyzeResponse.getTokens();for(AnalyzeToken token : list){ logger.info("Term:{}", token.getTerm());}
-
analysis-stconvert(by Medcl)
简繁体中文分词器, 中国文化博大精深,中文简体和中文繁体互换分词器
安装与使用,请参考 elasticsearch-analysis-stconvert
-
analysis-string2int (by Medcl)
字符串转整型工具。主要用在facet这个功能上
安装与使用,请参考 elasticsearch-analysis-string2int
-
tools.carrot2
安装与使用,请参考elasticsearch-carrot2
-
segmentspy
安装与使用,请参考elasticsearch-segmentspy
import url : http://192.168.1.108:9200/_plugin/segmentspy/#/
-
elasticsearch-hq
安装与使用,请参考elasticsearch-HQ
import url : http://192.168.1.108:9200/_plugin/elasticsearch-hq/
-
...
- http://ju.outofmemory.cn/entry/83746
相关推荐
分享一套完整版视频课程——分布式搜索引擎Elasticsearch开发实战基础篇 (ElasticSearch、ELK、搜索引擎、Lucene),本教程旨在带领大家进入搜索引擎领域,从无到有,深入浅出的讲解了什么是搜索引擎,搜索引擎的...
而ElasticSearch-head就是一款能连接ElasticSearch搜索引擎,并提供可视化的操作页面对ElasticSearch搜索引擎进行各种设置和数据检索功能的管理插件,如在head插件页面编写RESTful接口风格的请求,就可以对Elastic...
elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组织机构名等来切分词
Elasticsearch是一个基于Lucene库的分布式搜索引擎,它提供了一个可扩展的多租户全文搜索引擎。它是一个开源、分布式、RESTful搜索和分析引擎,可在各种用例中使用,包括文本搜索、结构化搜索、分析和日志分析。...
双击elasticsearch.bat文件,就可以启动elasticsearch,启动成功界面如下:启动成功后,会在解压目录下增加2个文件件,data用于数据存储,logs用于日志记录,可以自己创建plugins目录中用于放置自己的插件。此时可以在...
Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。 我们建立一个网站或应用程序,并要...
Elasticsearch 是一个实时的分布式搜索分析引擎,它能让你以前所未有的速度和规模,去探索你的数据。
ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。像Solr4一样,是基于Lucene构建的。支持时间时间索引和全文检索。官网:http://www.elasticsearch.org 它对外提供一系列基于...
弹性搜索分布式RESTful搜索引擎 Elasticsearch是为云构建的分布式RESTful搜索引擎。 功能包括: 分布式且高度可用的搜索引擎。 每个索引均使用可配置数量的分片进行完全分片。 每个分片可以具有一个或多个副本。 对...
使用Elasticsearch作为存储引擎自动化业务工作流程 使用Elasticsearch作为地理信息系统(GIS)管理,集成和分析空间信息 使用Elasticsearch作为生物信息学研究工具来存储和处理遗传数据 索引和文档能搜索到的场景 ...
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,elasticsearch-analysis-ik中文分词插件
ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。像Solr4一样,是基于Lucene构建的。支持时间时间索引和全文检索。 ElasticSearch作为一个基于Lucene的搜索服务器。它提供了一...
ElasticSearch5之前的版本安装Head插件只需要在bin目录下执行./plugin -install mobz/elasticsearch-head就可以完成安装,5之后改用Node安装运行,所以你需要先安装NodeJS,下面是Window环境: 或者 wget ...
ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。 Sense是一款基于chrome的插件。通过Sense扩展插件我们可以很方便的操作ElasticSearch。
Elasticsearch 是一个基于 Lucene 的开源搜索引擎,它提供了一个分布式、多租户的全文搜索和分析引擎。Elasticsearch 是用 Java 语言编写的,并且提供了 RESTful API 以及丰富的客户端库,能够方便地与其它应用集成...
ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。像Solr4一样,是基于Lucene构建的。支持时间时间索引和全文检索。 ElasticSearch作为一个基于Lucene的搜索服务器。它提供了一...
ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。像Solr4一样,是基于Lucene构建的。支持时间时间索引和全文检索。 ElasticSearch作为一个基于Lucene的搜索服务器。它提供了一...
Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,...
(2)包含市面上几乎没有的所有Elasticsearch高级知识点:包含地理位置搜索与聚合分析,term vector,suggester search,搜索模板定制,query执行剖析,数十种最全面的聚合分析,span query,shard分配定制,es插件...