Lucene（3.5）自定义QueryParser

m635674608

浏览: 4929450 次
性别:
来自: 南京

最近访客更多访客>>

millerchu

xdung

yunnick

lijun4010

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java
搜索引擎，爬虫

[java]view plaincopy 
package com.test.lucene;  
  
import java.io.File;  
  
import org.apache.lucene.analysis.Analyzer;  
import org.apache.lucene.analysis.standard.StandardAnalyzer;  
import org.apache.lucene.document.Document;  
import org.apache.lucene.index.IndexReader;  
import org.apache.lucene.queryParser.QueryParser;  
import org.apache.lucene.search.IndexSearcher;  
import org.apache.lucene.search.Query;  
import org.apache.lucene.search.ScoreDoc;  
import org.apache.lucene.search.TopDocs;  
import org.apache.lucene.store.Directory;  
import org.apache.lucene.store.FSDirectory;  
import org.apache.lucene.util.Version;  
import org.junit.Test;  
  
  
public class ParserTest {  
//  共找到1条记录  
//  name: java  
//  date:1334494024083  
//  size: 148  
//  content: 全国软件专业人才设计与开发大赛  
//  帽子和服装  
//  Hello  
//  Lucene实战(第二版) Lucene in action  
//  人民邮电出版社  
//  the quick brown fox jumped over the lazy dog  
    private static final Version version = Version.LUCENE_35;  
    private static final Analyzer analyzer = new StandardAnalyzer(version);//和索引时用的分词器一致  
      
    @Test  
    public void testQueryPraser() throws Exception {  
        //QueryParser parser = new QueryParser(version, "content", analyzer);//默认在content域中查找  
        QueryParser parser = new MyQueryParser(version, "content", analyzer);//默认在content域中查找, 重写了getRangeQuery方法， 可以进行数字范围查询  
        Query query = null;   
          
        //查找content（默认域）中存在软件的结果  
        query = parser.parse("软件");  
          
        //查找name域中有java的结果  
        query = parser.parse("name:java");  
          
        //使用通配符  
        query = parser.parse("name: j*");//默认*号不能出现在最前端， 会影响效率, 使用parser.setAllowLeadingWildcard(true)打开  
        query = parser.parse("lu*n?");//只能在单个分词中使用通配符， 即 使用 “lucene*action”就匹配不到  
        query = parser.parse("lucene test");//默认lucene和action是或关系  
        query = parser.parse("lucene OR test");//同上, OR必须大写  
        query = parser.parse("lucene AND test");//与关系  
        query = parser.parse("- lucene + test");//存在test但不存在lucene  
        //query = parser.parse("size:[100 TO 200]");//这个query是TermRangeQuery所以不能用于数字（日期）范围查询  
        query = parser.parse("name:[java TO java]");//查找有a-z字母的    {}不包含  
        //数字范围查询需要重写QueryParser的getRangeQuery方法  
        query = parser.parse("date:[1334550379955 TO 1334550379955]");  
        query = parser.parse("\"lucene action\"~1");//1即phraseQuery中的slop=1  
        query = parser.parse("name:xava~0.74");//加上~代表模糊查询， 要和上面的额短语查询相区别开来，另外~后面可以加一个浮点数去顶相似度  
        //查询大小在145到150， 名称与javv相似， 创建时间在1334550379955之前的 不要， lucene与action相距1  
        query = parser.parse("size:[145 TO 150] + name:javv~ - date:[1 TO 1334550379954] + \"lucene action\"~1");  
        doSearch(query);  
    }  
  
    private void doSearch(Query query) throws Exception{  
        Directory dir = FSDirectory.open(new File("E:/lucene/index"));  
        IndexReader reader = IndexReader.open(dir);   
        IndexSearcher searcher = new IndexSearcher(reader);  
        TopDocs hits = searcher.search(query, 100);  
        System.out.println("共找到" + hits.totalHits + "条记录");  
        ScoreDoc[] docs = hits.scoreDocs;  
        for(int i = 0; i < docs.length; i++){  
            int docId = docs[i].doc;  
            Document doc = searcher.doc(docId);  
            System.out.println("name: " + doc.get("name"));  
            System.out.println("date:" + doc.get("date"));  
            System.out.println("size: " + doc.get("size"));  
            System.out.println("content: " + doc.get("content"));  
        }  
        searcher.close();  
    }  
}  

[java]view plaincopy 

/**
* 自定义QueryParser，提供数字范围查询支持
* @author Ping_QC
*
*/
public class MyQueryParser extends QueryParser {
public MyQueryParser(Version matchVersion, String f, Analyzer a) {
super(matchVersion, f, a);
}
@Override
protected org.apache.lucene.search.Query getRangeQuery(String field,
String part1, String part2, boolean inclusive)
throws ParseException {
if ("size".equals(field) || "date".equals(field)) {
return NumericRangeQuery.newLongRange(field, Long.parseLong(part1),
Long.parseLong(part2), inclusive, inclusive);
}
return super.newRangeQuery(field, part1, part2, inclusive);
}
}

http://blog.csdn.net/ping_qc/article/details/7465888

分享到：

DNS原理及其解析过程 | ElasticSearch集群搭建实例

2015-08-22 01:28
浏览 902
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene（3.5）自定义QueryParser

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene（3.5）自定义QueryParser

评论

发表评论

相关推荐

Kryo 使用指南

spring session序列化问题排查

利用junit对springMVC的Controller进行测试

Java内存模型之重排序

pmd spotbugs 文档

PMD、FindBug、checkstyle、sonar这些代码检查工具的区别？各自的侧重点是什么？

阿里巴巴Java代码规约插件p3c-pmd使用指南与实现解析

静态分析工具PMD使用说明 (文章来源: Java Eye)

MyBatis 使用 MyCat 实现多租户的一种简单思路

Spring+MyBatis实现数据库读写分离方案

数据库连接池druid wallfilter配置

java restful 实体封装

dak

Java内存模型之从JMM角度分析DCL

Java 打印堆栈的几种方法

Servlet Session学习

浅析Cookie中的Path与domain

入分析volatile的实现原理

Spring MVC-ContextLoaderListener和DispatcherServlet

搭建spring框架的时候，web.xml中的spring相关配置，可以不用配置ContextLoaderListener（即只配DispatcherServl

最近访客更多访客>>