博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[转]solr入门
阅读量:7093 次
发布时间:2019-06-28

本文共 1972 字,大约阅读时间需要 6 分钟。

  hot3.png

solr作为nosql,和mysql等,solr数据查询功能简单,做, 查询效率相对于mysql快.

1,下载

2,solr+tomcat:

1. 拷贝 apache-solr-3.4.0/dist/apache-solr-3.4.0.war至apache-tomcat-7.0.21/webapps/   最好重命名为solr.war,简化网页访问路径2. 拷贝 apache-solr-3.4.0/example/solr 至 /home/hadooper/solr_home (或者任意一个你指定的Solr主目录)3. 修改tomcat/webapp/yourappname/web.xml文件,在文件末尾添加env-entry值   或者修改 apache-tomcat-7.0.21/conf/web.xml, 指定solr主目录   在文件末尾(之前)添加:    
        
solr/home
        
/home/hadooper/solr_home/
        
java.lang.String
    

3,

http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fq=websitetype:[30%20TO%2039]http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fl=websitetype&fq=-websitetype:[30%20TO%2039]

4,solr and/not 查询

NOT:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(厦门) OR content:(厦门) NOT websitetype:[30 TO 39]AND:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(厦门) OR content:(厦门) AND websitetype:[30 TO 39]

5,

6,solr倒排表:http://www.tuicool.com/articles/URvmQf

--------------------------------------------------------------------------------------------------------

简述说明:solr使用,实质是对lucene的封装,将其应用化;

lucene索引过程:

 a,文件文档化:document;

 b,分词处理:tokenizer;
  将文档分词一个个单独的单词;
  去除标点符号
  去除停词()
c,语言处理:linguistic processor
  变小写;
  词根化:cars->car/drove->drive;这个过程叫stemming,lemmatization

  stemming: cars->car,solr6下面有个protwords.txt,用于屏蔽stemming操作,

  lemmatization: drove->drive

   注:搜索过程得到的词语同样要做bc两步

d,对3的词语做建字典,做倒排表;

 

172914_fuYG_856051.png

分词:

solr6.0 自带标准分词,除此之外,通用中文分词还有ik,hanlp;

ik下载:https://code.google.com/archive/p/ik-analyzer/downloads

但ik仅更新到2012版本,solr6可参考:http://blog.csdn.net/linzhiqiang0316/article/details/51554217

通过配置IKAnalyzer.cfg.xml,以及dict文件,可自行配置term和停词

:https://cwiki.apache.org/confluence/display/solr/Using+SolrJ

字段区域更新:http://solr.pl/en/2012/07/09/solr-4-0-partial-documents-update/

转载于:https://my.oschina.net/u/856051/blog/605698

你可能感兴趣的文章
自动化运维之 部署Saltstack 并批量部署 Nginx
查看>>
Linux常用中间件启动命令
查看>>
中文自动摘要的基本实现方法
查看>>
Python——正则表达式 re模块
查看>>
如何使Windows显示文件扩展名
查看>>
springmvc拦截器讲解
查看>>
linux memcached集群
查看>>
Spring Boot系列(五)创建jar与热部署
查看>>
财务数据分析工作总结汇报PPT模板
查看>>
泛型-自定义类上的泛型,方法的泛型
查看>>
基本指令和语句
查看>>
华为防火墙USG5500
查看>>
22 个常见的HTML5技巧和实际应用
查看>>
我的友情链接
查看>>
解决飞信不能发送短信问题
查看>>
OpenSSL&搭建私人CA
查看>>
MySQL explain
查看>>
Tapestry5中的DI
查看>>
PHP判断文件或者目录是否可写
查看>>
部署java项目二
查看>>