SolrCloud介绍和应用

article/2025/11/4 8:27:04

SolrCloud是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的Solr4.0(目前还是ALPHA版本,基于lucene4.0)的核心组件之一,它的主要思想是使用Zookeeper作为集群的配置信息中心。它有几个特色功能:1)集中式的配置信息 2)自动容错 3)近实时搜索 4)查询时自动负载均衡 。

下载地址:http://lucene.apache.org/solr/downloads.html

流程架构图

基本应用

1、构建2个shard的配置

按照官方的说明  ,将example复制为example2。

cp -r example example2

启动第一个shard

cd example
java -Dbootstrap_confdir=D:/training/apache-solr-4.0.0-ALPHA/example/solr/conf -Dcollection.configName=lifeba -DzkRun -DnumShards=2 -jar start.jar

-DzkRun 启动一个嵌入式的Zookeeper服务器
-Dbootstrap_confdir 指定了solr的conf路径
-DnumShards指定了shard数量
-Dcollection.configName 指定了储存到zookeeper中的config名称

默认创建的核为collection1

启动第2个shard

cd example2
java -Djetty.port=7574 -DzkHost=localhost:9983 -jar start.jar

-Djetty.port 指定了jetty的端口,默认的8983端口已经被占用。
-DzkHost=localhost:9983就是指明了第一个shard中启动的Zookeeper的路径,solr集成的内嵌的zookeeper默认端口为solr的端口+1000,在这里为9983,对应的9984 9985端口分别用于:zookeeper的同步和选举。

访问
http://localhost:8983/solr/#/~cloud?view=graph

提交数据

cd exampledocs

java -Durl=http://localhost:8983/solr/collection1/update -jar post.jar ipod_video.xml
java -Durl=http://localhost:8983/solr/collection1/update -jar post.jar monitor.xml
java -Durl=http://localhost:8983/solr/collection1/update -jar post.jar mem.xml

查询数据

http://localhost:8983/solr/collection1/select?q=*:*

 

2、构建2个shard和replicas配置。

cp -r example exampleB
cp -r example2 example2B

cd exampleB
java -Djetty.port=8900 -DzkHost=localhost:9983 -jar start.jar

cd example2B
java -Djetty.port=7500 -DzkHost=localhost:9983 -jar start.jar

3、构建Zookeeper集群的配置

配置文件存放在zookeeper中,为了避免单点故障,需要配置Zookeeper集群来实现高可用性和容错性。

使用集成的zookeeper启动

先停掉4个server,然后执行

rm -r example*/solr/zoo_data

启动第一个solr server

cd example

java -Dbootstrap_confdir=D:/training/apache-solr-4.0.0-ALPHA/example/solr/conf -Dcollection.configName=lifeba1 -DzkRun -DzkHost=localhost:9983,localhost:9574,localhost:9900 -DnumShards=2 -jar start.jar

对应的其他3个solr启动

cd example2
java -Djetty.port=7574 -DzkRun -DzkHost=localhost:9983,localhost:9574,localhost:9900 -jar start.jar

cd exampleB
java -Djetty.port=8900 -DzkRun -DzkHost=localhost:9983,localhost:9574,localhost:9900 -jar start.jar

cd example2B
java -Djetty.port=7500 -DzkHost=localhost:9983,localhost:9574,localhost:9900 -jar start.jar

使用外部集群

java -Dbootstrap_confdir=D:/training/apache-solr-4.0.0-ALPHA/example/solr/conf -Dcollection.configName=lifeba1 -DzkHost=192.168.4.93:2181,192.168.4.94:2181,192.168.4.89:2181 -DnumShards=2 -jar start.jar

cd example2
java -Djetty.port=7574 -DzkHost=192.168.4.93:2181,192.168.4.94:2181,192.168.4.89:2181 -jar start.jar

cd exampleB
java -Djetty.port=8900 -DzkHost=192.168.4.93:2181,192.168.4.94:2181,192.168.4.89:2181 -jar start.jar

cd example2B
java -Djetty.port=7500 -DzkHost=192.168.4.93:2181,192.168.4.94:2181,192.168.4.89:2181 -jar start.jar


http://chatgpt.dhexx.cn/article/5OOwmR1G.shtml

相关文章

Solr简介Solr使用及SolrCloud搭建

一、Solr简介 1、Solr是什么? 1.1就是一个war项目 2、自己的项目如何Solr进行交互? 2.1特定的API叫做SolrJ(底层其实就是HttpClient) 3、具备数据持久化功能 3.1Solr中会存储需要进行搜索的数据 3.2把所有的数据都初始化到Solr中. 4、Solr作用&#…

solrcloud导入mysql数据配置

最简单的solr7集群搭建(不需要tomcat) 添加jar (三个节点都要) 复制solr解压目录中dist下的solr-dataimporthandler-7.5.0.jar solr-dataimporthandler-extras-7.5.0.jar 复制到WEB-INF/lib下 添加mysql-connection jar包到WEB-INF/lib下,我这里是mysq…

Solr+Zookeeper 搭建搜索集群SolrCloud

目录 一、简介 1、SolrCloud是个什么玩意? 2、Solr是个什么玩意? 3、zookeeper是个什么玩意? 4、实现负载均衡的方式: (Nginx、Redis槽、Zookeeper) 二、SolrCloud的结构 1、物理结构 2、逻辑结构 三、SolrCloud的搭建(3…

solrCloud分布式检索流程

好久没写solr的文章了,刚好需要在公司作个分享,先总结一些先。 引用请声明原文:http://blog.csdn.net/duck_genuine/article/details/17014991 solrCloud分布式检索主要流程如下: 搜索 video,“美女斗秀场” 取按…

solr全文检索技术学习(三)-搭建SolrCloud集群问题总结

什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请…

对SolrCloud集群Collection进行手动二次Sharding

我们已经基于SolrCloud 4.3.1Tomcat 7搭建了搜索服务器集群,一个Collection对应3个节点上的3个分片(Shard),同时包含对应分片的副本(Replica),此时,该Collection一共有6000万左右Doc…

Solr SolrCloud相关概念

Solr支持服务器的分布式集群部署,即SolrCloud。在SolrCloud中,一个索引可以被分布到不同的服务器,即不同的node,所有的这些node组成一个collection,并且充分考虑了高可靠性和容错的设计。 SolrCloud使用zookeeper来管理…

SolrCloud概述

在Lucene/Solr的SVN trunk中的SolrCloud已经可用, 在即将发布的4.0版本中将正式包含. 目前SolrCloud已经成熟, 可以支持分布式索引和分布式搜索. 下面是我们一个项目采用新的SolrCloud的部署结构图: 看起来是否非常简单? 下面我们看看内部的一些实现细节. SolrCloud功能和架…

solr8.9部署solrcloud

安装solr tar xf solr-8.9.0.tgz cd solr-8.9.0 ./bin/install_solr_service.sh /root/solr-8.8.2.zip -d /data/solr -u solr -n # /root/solr-8.8.2.zip 指定tar包 # -d: 指定solr可写目录,solr数据文件、日志、pid文件、索引会写入到此目录下。默认/var/solr #…

搭建SolrCloud的详细步骤

###一、需求 SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。 当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高&a…

SolrCloud Collection 创建

环境版本: CDH 5.12.0; Solr 4.10.3 CDH搭建SolrCloud集群十分方便,添加服务->solr->选择主机->next即可 在SolrCloud中,跨多个节点的索引分割称为集合(collection),见下图: [root@DXHY-YFEB-01 solr]# pwd /var/lib/solr [root@DXHY-YFEB-01 solr]# mv Invoi…

solrcloud集群搭建

什么是SolrCloud 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大&#xff0c…

Apache SolrCloud介绍及安装

SolrCloud介绍 在我们应用还很渺小的时候,一台Solr服务器能完全胜任这份工作,随着我们应用慢慢长大,访问也越来越多,一台Solr服务器的弊病也逐渐显现如查询变慢了,机器宕机就无法继续提供服务,于是乎我们引…

solr集群(solrcloud)部署搭建

简介 SolrCloud 旨在提供一个高度可用、容错的环境,用于跨多个服务器分发索引内容和查询请求。它是基于 Solr 和Zookeeper的分布式搜索方案,它的主要思想是使用 Zookeeper作为集群的配置信息中心。它是灵活的分布式搜索和索引,无需主节点来分…

SolrCloud之solr单机搭建使用

系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 第一章 zookeeper的搭建 及启动脚本 第二章 solr单机搭建使用 第三章 solrCloud搭建及演化 文章目录 前言 随着互联网技术的不断迭代更新,分布式技术也越…

SolrCloud 搭建之 zookeeper搭建

系列文章目录 第一章 zookeeper的搭建 及启动脚本 第二章 solr单机搭建使用 第三章 solrCloud搭建及演化 文章目录 前言 随着互联网技术的不断迭代更新,分布式技术也越来越重要,很多人都开启了学习模式,本文就介绍了solr搭建及使用的基础…

solrCloud搭建及演化

系列文章目录 第一章 zookeeper的搭建 及启动脚本 第二章 solr单机搭建使用 第三章 solrCloud搭建及演化 文章目录 前言 solr是一个web项目,上一节我们部署了solr的单机版,实际上solrcloud是多个tomcat的组合,将多个tomcat部署之后&#…

SolrCloud原理

本文为调研分布式检索系统的笔记整理,之前调研sphinx和coreseek的时候,发现国内的博客,还是讲怎么配置怎么安装多,原理性的东西并不多。本文为:官网文档阅读笔记(有些会附带上文档英文原文, 如果…

SolrCloud简介

原文地址:http://www.chepoo.com/solrcloud-introduction.html 一.简介 SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-S…

Solr云(SolrCloud)

SolrCloud只是作为Solr的一个突出特性,这个特殊的特性能够实现分布式功能。利用这个功能,你能建立高效、容错的Solr服务器群。这对于访问量规模巨大的企业级应用来说,使用SolrCloud能实现高有效性、容错性、分布式索引和搜索功能。 1 了…