elasticsearch 批量入库bulk性能测试

`

m635674608

浏览: 4939351 次
性别:
来自: 南京

最近访客更多访客>>

millerchu

xdung

yunnick

lijun4010

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

搜索引擎，爬虫

经过测试不同的分词器性能不能同。

1万条数据

分词器时间

es默认分词器 1秒多

ik 60秒左右

mmseg 1秒多

ansj 未知

paoding 未知

keyword 1秒多

后来更新ik版本发现性能有所提升，但是还是没有mmseg性能高，应该mmseg分词分的比ik少。

插入主要的性能还是分词器的性能

http://my.oschina.net/naqin/blog/347200

分享到：

Lucene5学习之使用MMSeg4j分词器 | ElasticSearch导入测试

2015-11-05 16:32
浏览 2936
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

elasticsearch-bulk-insert-plugin.zip: ETL工具kettle7.1抽取数据目前不支持elasticsearch 2.X以上版本，如果想要支持elasticsearch 6.X以上版本,必须替换elasticsearch-bulk-insert-plugin插件，该资源提供该插件的替换。具体步骤为在spoon kettle\data-...

elasticsearch-bulk-insert-plugin-8.x-es7.x.x.zip: kettle 支持elasticsearch7.x 批量上传的插件,减压后放到data-integration\plugins 目录下即可

elasticsearch-bulk-insert-plugin-8.2.0.0-342.zip: kettle9.1(PDI)连接elasticsearch7.13.2，使用时，直接将原kettle目录下-->plugin-->elasticsearch-bulk-insert-plugin下的文件删除，将该压缩包下的内容解压，放在该目录即可

springBoot整合kafka和elasticSearch,实现批量拉取日志以及批量更新到es里: 从Kafka中批量拉去数据，然后批量更新到es里。一次拉取的数量可以设置，现在是10000，轻松运转，更新到es内部也是，目标是百万日志秒处理

Java做客户端对Elasticsearch服务的增删改查及批量修改操作: Java做客户端对Elasticsearch服务的增删改查及批量修改操作,代码简洁易懂,思路清晰有注释.详情参考https://blog.csdn.net/linhaiyun_ytdx/article/category/7042758

Oracle数据批量导入elasticsearch脚本: Linux环境下使用sqlplus工具将oracle中的数据导入到elasticsearch中。只需要在es_bulk_tool.properties配置sql即可实现数据的批量导入。在elasticsearch6中测试通过。shell脚本需要使用sqlplus。

docker实现elasticsearch批量dump导出导入: docker实现elasticsearch批量dump导出导入，实现es批量导入导出

java语言kafka数据批量导入到Elasticsearch实例: 消费kafka数据，然后批量导入到Elasticsearch,本例子使用的kafka版本0.10，es版本是6.4，使用bulk方式批量导入到es中，也可以一条一条的导入，不过比较慢。 <groupId>org.elasticsearch <artifactId>elastic...

curl.rar ElasticSearch 批量导入一批数据: ElasticSearch 批量导入一批数据解压后再当前位置命令行执行命令

elasticsearch 性能测试: NULL 博文链接：https://mitchz.iteye.com/blog/2085365

elasticsearch-bulk-insert-plugin-8.2.0.4-606.zip: kettle7.1+elasticsearch7.0.1版本,此包通过pentaho-kettle-8.2.0.4-R源码编译，可用于elasticsearch7.0.1版本，解压此包，放入在kettle的plugin中，重启kettle即可，在配置项中设置address：<es的id>,port:9200

elasticsearch-tools：用于执行诸如批量导入导出和导出导入映射之类的工作的一系列Elasticsearch命令行工具: 安装npm install -g elasticsearch-tools 安装后，您将可以使用以下命令行工具：出口输入用法：es-export-bulk选项es-export-bulk --helpUsage: es-export-bulk [options] Options: -h, --help output usage ...

kettle elasticsearch插件: kettle etl工具中，实现批量导入到 elasticsearch中的插件

ElasticSearch官方测试数据: ElasticSearch官方测试数据

ElasticSearch分布式全文检索入门视频教程: 07_Elasticsearch 批量操作bulk 08_Elasticsearch 版本控制version 09_Elasticsearch 如何做映射mapping 10_Elasticsearch 基本查询 11_Elasticsearch filter查询 12_Elasticsearch 组合查询 13_Logstash 介绍以及...

elasticsearch进行批量插入的时候总是少数据: 现有a表和b表，两张mysql数据库的表，需要把两张表的数据取共同字段，合并并导入es中，其中a表共有数据1000条，b表共有数据1200条，a表和b表的主键id都是从1开始递增的，结果导入的时候显示成功导入2200条数据，而...

毕业设计-EasySwoole+ElasticSearch打造高性能小视频服务系统.zip: 毕业设计-EasySwoole+ElasticSearch打造高性能小视频服务系统毕业设计-EasySwoole+ElasticSearch打造高性能小视频服务系统毕业设计-EasySwoole+ElasticSearch打造高性能小视频服务系统毕业设计-EasySwoole+...

Global site tag (gtag.js) - Google Analytics

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

elasticsearch 批量入库bulk性能测试

评论

发表评论

相关推荐

ElasticSearch Groovy脚本远程代码执行漏洞分析（CVE-2015-1427） （附exp）

postman进行http接口测试

selenium 使用经验总结

selenium chrome 浏览器闪退

selenium 浏览器版本

geckodriver 关闭日志

selenium与firefox版本不兼容

解决Selenium与firefox浏览器版本不兼容问题

剖析Elasticsearch集群系列之二：分布式的三个C、translog和Lucene段

分布式搜索elasticsearch 搜索结果排序不一致性问题

多个ElasticSearch Cluster的一致性问题

WEB渗透测试之三大漏扫神器

淘宝 OAuth2.0 的登录验证与授权

Jsoup中getElementsByClass中className有空格处理

HttpClient4 Post XML到一个服务器上

Android安装Fiddler证书抓取App的HTTPS流量

使用Charles进行https抓包

如何使用charles对Android Https进行抓包

Selenium WebDriver 中鼠标事件

获取真实IP的方法，以及伪造IP的例子代码

最近访客更多访客>>

ElasticSearch Groovy脚本远程代码执行漏洞分析（CVE-2015-1427）（附exp）