Solr基本概念

article/2025/9/18 20:42:25
Solr是一种开放源码的、基于Lucene的搜索服务器。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。

官网: http://lucene.apache.org/solr/

Solr全文检索基本原理:

http://www.importnew.com/12707.html


相关概念:
  • Core:    对应于standalone(独立模式)
  • Collection:    对应于solrCloud(云模式)。注:在独立模式以是以core来管理,在云模式下是collection来管理。
  • facet维度,相当于对查询结果的统计
  • constraints约束,维度中的子类
  • breadcrumb面包屑,根据选择, 列出的导航路径(选中列表)
俗话说“一张图胜过一千个字”,比如淘宝搜索“数码相机”,这三个概念对应如下:


搜索请求参数:
参数
说明
q
要搜索的内容。
  • 如果要搜索一个句子,用引号引起来:q="Hello wolrd"
  • 如果指定搜索某个域:q=field_name:content
  • 如果是中文,用引号引起来,就是全内容匹配才返回,如:q="笔记"
  • 如果要搜索多个单词、句子,使用加号(+):q="笔记"+"配置"
  • 如果要排除含有某个关键字的,使用减号(-):q="笔记"-"配置"
fq
Filter Query,搜索结果过滤(结果会被缓存起来):
  • fq=popularity:[10 to *]:只返回popularity大于10的结果
  • 需要同时满足两个条件的情况:fq=popularity:[10 TO *]&fq=section:0
  • 上面这种也可以写成:fq=popularity:[10 TO *]+fq=section:0
后两种的不同点:前一种:搜索结果分开存在缓存中,然后取交集;后一种:搜索结果存在一个缓存中
sort
指定搜索结果按照某个域来排序,例子:
  • score desc(缺省):按照搜索分数降序排序
  • price asc:按照“price”域升序排序
  • nStock desc, price asc:先按照nStock降序,再按照price升序
start, rows
返回第start条开始,一共rows条记录,例子:
  • start=11&rows=100
  • 缺省:start=0, rows=10
fl
要返回的域,比如“id”、*,如果有多个,用逗号(,)分开,还可以返回score。例子
  • fl=id,name
  • fl=id,score
  • fl=*,score
df
默认的查询字段,重新指定并覆盖schema.xml中的default field
wt
结果的格式,json, xml...
facet
统计查询结果:
按某个域统计:facet=true&facet.field=author(按照“author”这个域统计)
参考: https://cwiki.apache.org/confluence/display/solr/Searching

目录说明:
  • dist 各种jar包 
  • contrib 各种jar包 
  • bin 常用命令脚本 
  • server web服务器 
    • solr 创建的core会在该目录下 
      • configsets  solr配置集,新建的core可以从这里拷贝配置 
      • xx-core 
        • conf 配置文件 
          • solrconfig.xml solr的配置信息 
          • schema.xml 分词器配置信息 
        • data 索引等数据 
    • logs 日志文件 
    • webapps web程序部署位置 
  • example  
    • example-DIH 数据导入工具 
  • licenses 各种授权协议 
  • docs api文档

(原创文章,转载请注明转自Clement-Xu的博客)


http://chatgpt.dhexx.cn/article/HhRSkINt.shtml

相关文章

Solr 原理、API 使用

日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 搜索引擎:Elasticsearch、Solr、Lucene ELK中的ES:ElasticsearchSolrCloud 的搭建、使用Solr 高亮显示Spring Data Solr …

Solr的工作原理

1. Solr的简介 ​ Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到…

Solr搜索引擎原理

本文转载至:http://www.importnew.com/12707.html 场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从…

【Solr启动原理】

Solr集群启动,都做了哪些事情?做了很多事,over。 启动流程大致如下: 1. 启动入口:web.xml。Solr归根结底是个Web服务,必须部署到jetty或者tomcat容器上。 2. SolrRequestFilter过滤器的实现类是org.apache…

Solr的工作原理以及如何管理索引库

1. Solr的简介 ​ Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到…

solr底层原理

一、总论 根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检索呢?这要从我们生活中的数据说起。 我们生活中…

全文搜索引擎Solr原理和实战教程

Solr简介 1.Solr是什么? Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。Solr是一个高性能,采用Java开发, 基于Lucene的全文搜索服务…

solr全文检索实现原理

solr那是我1年前使用到的一个搜索引擎,由于当初对于配置了相应了,但是今天突然面试问到了,哎,太久了,真的忘记了,今天特地写一篇博客记下来 solr是一个独立的企业级搜索应用服务器,它对外t提供…

Solr工作原理

Solr简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式…

Solr的原理及使用

1.Solr的简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格…

Solr原理剖析

一、简介 Solr是一个高性能、基于Lucene的全文检索服务器。Solr对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言,并实现了强大的全文检索功能、高亮显示、动态集群,具有高度的可扩展性。同时从Solr 4.0版本开始,支持SolrCl…

solr的基本原理

solr介绍: solr是一个全局检索引擎,能够快速地从大量的文本数据中选出你所需要的数据,而你只需要提供相应的关键词进行检索。solr的高效率查询靠的是底层强大的索引库,所以solr最关键的技术也是其底层的索引设计。solr工作的时候可…

Solr的工作原理(最直白的解释,简单易懂)懂?

Solr 什么是Solr Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。 为了在CNET网络的公司网站上添加搜索功能&…

Solr(一) Solr 简介及搜索原理

一、 Solr 简介 1 为什么使用 Solr 在海量数据下,对 MySQL 或 Oracle 进行模糊查询或条件查询的效率是很低的。而搜索功能在绝大多数项目中都是必须的,如何提升搜索效率是很多互联网项目必须要考虑的问题。 既然使用关系型数据库进行搜索效率比较低&a…

UML入门以及Plant UML工具介绍

简介 UML,Unified Modeling Language,可视化的统一建模语言,是一种开放的方法,用于说明、可视化、构建和编写一个正在开发的、面向对象的、软件密集系统的制品的开放方法。而非程序设计语言,支持从需求分析开始的软件…

UML工具 Astah Professional8.0下载

UML工具 Astah Professional8.0下载 开头功能特性使用方法 文件下载链接 开头 由于Astah目前社区版被取消了,在这提供Professional 8.0版本。 Astah官网:https://astah.net/ 功能特性 1、在一个工具中做所有事情 不要为每个工作阶段切换工具。 做UML设…

免费 UML 工具

选取了四款UML工具: astah 经常看到网上的黄色背景就是这个软件画的,最后一个免费的社区版本是:astah community 7.2 安装包大小50M 以下三个均为免费版本: Software Ideas Modeler 可以画序列图,安装包很小,只有十几兆,而且提供便携版下载 Modelio 这是一个大型的…

十二个开源UML工具

本文将为您介绍12个优秀的UML工具: 1. StarUML StarUML(简称SU),是一种创建UML类图,是一种生成类图和其他类型的统一建模语言(UML)图表的工具。StarUML是一个开源项目之一发展快、灵活、可扩展性强(zj)。 2. Netbeans UML Plugin 目前支持&…

UML工具Visual Paradigm入门:业务流程建模 (BPM) 教程

Visual Paradigm是包含设计共享、线框图和数据库设计新特性的企业项目设计工具。现在你只需要这样单独的一款模型软件 Visual Paradigm就可以完成用UML设计软件,用BPMN去执行业务流程分析,用ERD企业设计数据库的任务。Visual Paradigm现已加入在线订购&a…

UML图及UML工具使用技巧

转自:UML图及UML工具使用技巧 Rational Rose 2003 之“Rational License key error”问题的解决方案 大家对UML这个可视化的建模语言应该不在陌生了。五种关系、九种图是UML的核心组成元素,而Rational Rose 是实现这些关系、图的重要工具。工具的重要性…