`
m635674608
  • 浏览: 4929450 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

Lucene(3.5)自定义QueryParser

 
阅读更多
[java] view plaincopy
 
  1. package com.test.lucene;  
  2.   
  3. import java.io.File;  
  4.   
  5. import org.apache.lucene.analysis.Analyzer;  
  6. import org.apache.lucene.analysis.standard.StandardAnalyzer;  
  7. import org.apache.lucene.document.Document;  
  8. import org.apache.lucene.index.IndexReader;  
  9. import org.apache.lucene.queryParser.QueryParser;  
  10. import org.apache.lucene.search.IndexSearcher;  
  11. import org.apache.lucene.search.Query;  
  12. import org.apache.lucene.search.ScoreDoc;  
  13. import org.apache.lucene.search.TopDocs;  
  14. import org.apache.lucene.store.Directory;  
  15. import org.apache.lucene.store.FSDirectory;  
  16. import org.apache.lucene.util.Version;  
  17. import org.junit.Test;  
  18.   
  19.   
  20. public class ParserTest {  
  21. //  共找到1条记录  
  22. //  name: java  
  23. //  date:1334494024083  
  24. //  size: 148  
  25. //  content: 全国软件专业人才设计与开发大赛  
  26. //  帽子和服装  
  27. //  Hello  
  28. //  Lucene实战(第二版) Lucene in action  
  29. //  人民邮电出版社  
  30. //  the quick brown fox jumped over the lazy dog  
  31.     private static final Version version = Version.LUCENE_35;  
  32.     private static final Analyzer analyzer = new StandardAnalyzer(version);//和索引时用的分词器一致  
  33.       
  34.     @Test  
  35.     public void testQueryPraser() throws Exception {  
  36.         //QueryParser parser = new QueryParser(version, "content", analyzer);//默认在content域中查找  
  37.         QueryParser parser = new MyQueryParser(version, "content", analyzer);//默认在content域中查找, 重写了getRangeQuery方法, 可以进行数字范围查询  
  38.         Query query = null;   
  39.           
  40.         //查找content(默认域)中存在软件的结果  
  41.         query = parser.parse("软件");  
  42.           
  43.         //查找name域中有java的结果  
  44.         query = parser.parse("name:java");  
  45.           
  46.         //使用通配符  
  47.         query = parser.parse("name: j*");//默认*号不能出现在最前端, 会影响效率, 使用parser.setAllowLeadingWildcard(true)打开  
  48.         query = parser.parse("lu*n?");//只能在单个分词中使用通配符, 即 使用 “lucene*action”就匹配不到  
  49.         query = parser.parse("lucene test");//默认lucene和action是或关系  
  50.         query = parser.parse("lucene OR test");//同上, OR必须大写  
  51.         query = parser.parse("lucene AND test");//与关系  
  52.         query = parser.parse("- lucene + test");//存在test但不存在lucene  
  53.         //query = parser.parse("size:[100 TO 200]");//这个query是TermRangeQuery所以不能用于数字(日期)范围查询  
  54.         query = parser.parse("name:[java TO java]");//查找有a-z字母的    {}不包含  
  55.         //数字范围查询需要重写QueryParser的getRangeQuery方法  
  56.         query = parser.parse("date:[1334550379955 TO 1334550379955]");  
  57.         query = parser.parse("\"lucene action\"~1");//1即phraseQuery中的slop=1  
  58.         query = parser.parse("name:xava~0.74");//加上~代表模糊查询, 要和上面的额短语查询相区别开来,另外~后面可以加一个浮点数去顶相似度  
  59.         //查询大小在145到150, 名称与javv相似, 创建时间在1334550379955之前的 不要, lucene与action相距1  
  60.         query = parser.parse("size:[145 TO 150] + name:javv~ - date:[1 TO 1334550379954] + \"lucene action\"~1");  
  61.         doSearch(query);  
  62.     }  
  63.   
  64.     private void doSearch(Query query) throws Exception{  
  65.         Directory dir = FSDirectory.open(new File("E:/lucene/index"));  
  66.         IndexReader reader = IndexReader.open(dir);   
  67.         IndexSearcher searcher = new IndexSearcher(reader);  
  68.         TopDocs hits = searcher.search(query, 100);  
  69.         System.out.println("共找到" + hits.totalHits + "条记录");  
  70.         ScoreDoc[] docs = hits.scoreDocs;  
  71.         for(int i = 0; i < docs.length; i++){  
  72.             int docId = docs[i].doc;  
  73.             Document doc = searcher.doc(docId);  
  74.             System.out.println("name: " + doc.get("name"));  
  75.             System.out.println("date:" + doc.get("date"));  
  76.             System.out.println("size: " + doc.get("size"));  
  77.             System.out.println("content: " + doc.get("content"));  
  78.         }  
  79.         searcher.close();  
  80.     }  
  81. }  

 

[java] view plaincopy
 
  1. /** 
  2.  * 自定义QueryParser, 提供数字范围查询支持 
  3.  * @author Ping_QC 
  4.  * 
  5.  */  
  6. public class MyQueryParser extends QueryParser {  
  7.     public MyQueryParser(Version matchVersion, String f, Analyzer a) {  
  8.         super(matchVersion, f, a);  
  9.     }  
  10.     @Override  
  11.     protected org.apache.lucene.search.Query getRangeQuery(String field,  
  12.             String part1, String part2, boolean inclusive)  
  13.             throws ParseException {  
  14.         if ("size".equals(field) || "date".equals(field)) {  
  15.             return NumericRangeQuery.newLongRange(field, Long.parseLong(part1),  
  16.                     Long.parseLong(part2), inclusive, inclusive);  
  17.         }  
  18.         return super.newRangeQuery(field, part1, part2, inclusive);  
  19.     }  
  20. }  

 

http://blog.csdn.net/ping_qc/article/details/7465888

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics