Hadoop完全分布式集群环境搭建

article/2025/9/10 8:22:09

一、实验环境

  1. 主机操作系统:Windows7 以上(64 位)
  2. 虚拟机软件:Oracle VM VirtualBox
  3. 客户机操作系统:CentOS-6.8(64 位)
  4. JDK:1.8(Linux 版)
  5. SSH 连接客户端,如:Xme5
  6. Hadoop: 2.6.5

二、实验步骤

(1)在主节点解压 hadoop 安装包

去官网获取 Hadoop2.6.5 安装包。
https://archive.apache.org/dist/hadoop/common/
下载 Hadoop2.6.5,并使用 ftp 工具将 hadoop-2.6.5.tar.gz 文件上传到~/tools_bak 目录。(注:tools_bak可自己创建,上传压缩包到这里)
在这里插入图片描述
解压 hadoop-2.6.5.tar.gz 到tools文件夹:(注:tools可自己创建,存放解压缩的包)
tar -zxf hadoop-2.6.5.tar.gz -C ~/tool

(2)在主节点配置 hadoop-env.sh

用ls命令查看Hadoop 安装目录下的 tools/hadoop-2.6.5/etc/hadoop 目录里的如下配置文件:
在这里插入图片描述
将 hadoop-env.sh 文件中的 JAVA_HOME 修改为前面安装 JDK 的目录:
在这里插入图片描述
(注:如无特别说明,则文章打码处都是指用户名)

(3)在主节点配置 core-site.xml 文件

先在hadoop-2.6.5/下创建目录 tmp,打开tools/hadoop-2.6.5/etc/hadoop 目录下的core-site.xml文件并修改:
在这里插入图片描述

(4)在主节点配置 hdfs-site.xml 文件(注:复制因子是 3)

打开tools/hadoop-2.6.5/etc/hadoop 目录下的hdfs-site.xml 文件修改:
在这里插入图片描述

(5)在主节点配置 mapred-site.xml 文件

复制或重命名 cp mapred-site.xml.template mapred-site.xml
打开并修改 mapred-site.xml 文件:
在这里插入图片描述

(6)在主节点配置 yarn-site.xml 文件

打开修改yarn-site.xml 文件:(这个文件配置很长,以下是部分截图)
在这里插入图片描述

(7)在主节点配置 yarn-env.sh 文件

在 yarn-env.sh 文件增加 JAVA_HOME 变量,为前面安装 JDK 的目录:
在这里插入图片描述

(8)在主节点配置 slaves 文件

masters 和 slaves 文件(masters 文件是配置运行第二 namenode 的机器列表,每行一个,默认与namenode 在同一机器,这里不配置此文件)
修改 slaves 文件如下:
删除 localhost,添加从节点名称:
slave1
slave2
slave3
在这里插入图片描述

(9)向各节点复制 hadoop

在这里插入图片描述

(10)格式化 namenode

运行 Hadoop 安装目录下的 bin 目录里的 hdfs 命令进行格式化,如下:
./hdfs namenode -format
为方便今后操作,可以将 Hadoop 的 bin 目录加入系统路径,如下:
在~/.bashrc 文件末尾加上如下的两行代码:
在这里插入图片描述
然后运行 source ~/.bashrc 让环境变量生效。

(11)启动 hadoop 集群

进入目录
cd ~/tools/hadoop-2.6.5/sbin/
执行启动:
./start-dfs.sh(注:这是HDFS 集群)
./start-yarn.sh(注:这是Yarn 集群)
./mr-jobhistory-daemon.sh start historyserver(注:这是日志服务)

(12)用 jps 检验各后台进程是否成功启动

使用 Linux 的 jps 命令,查看主节点和从节点的 Hadoop 进程
在这里插入图片描述

(13)关闭 Hadoop 集群

进入目录
cd ~/tools/hadoop-2.6.5/sbin/
执行关闭:
./stop-dfs.sh
./stop-yarn.sh
./mr-jobhistory-daemon.sh stop historyserver

三、Hadoop 集群的基本管理

通过 Web 浏览 Hadoop 集群

首先在 Windows 系统中设置 IP 映射
在这里插入图片描述
在这里插入图片描述
通过浏览器访问 NameNode 所在节点的 50070 端口查看 HDFS 集群监控。
http://master:50070
在这里插入图片描述
通过以下 URL 地址直接访问分布式文件系统:
http://master:50070/dfshealth.jsp
在这里插入图片描述
在这里插入图片描述
通过浏览器访通过用浏览器访问 ResourceManager 所在节点的 8088 端口查看 YARN 集群监
控。
http://master:8088
在这里插入图片描述
注: 通过 Web 浏览 Hadoop 集群的前提是必须保证Hadoop集群正常启动并且启动后才能查看。


http://chatgpt.dhexx.cn/article/u6svZn3M.shtml

相关文章

基于ubuntu的hadoop完全分布式集群搭建

借鉴网址1 借鉴网址2 hadoop官方配置教程 搭建虚拟机,克隆(或者先配置JAVA和Hadoop环境再克隆,之后要改主机名和映射以及SSH免密) 可以利用xsync集群分发脚本一台机器配置其他机器分发 修改主机名和ip映射 检查 配置ssh免密登录…

Linux 部署Hadoop伪分布式集群教程

首先:我们需要下载一些关于Hadoop伪分布式集群需要的工具与tar包 链接: https://pan.baidu.com/s/1oUw1jDCxfghWsnaWauSHKg 提取码:6s5a 接下来打开虚拟机终端,先创建一个文件夹用来解压Hadoop的tar包 接着使用xshell远程连接到…

Jmeter分布式集群

一、背景 JMeter是一款非常不错的开源压力测试工具,但在使用过程中也会遇到比较多问题排查,例如:起压机(客户端)请求并发数无法达到既定目标量、报内存溢出错误、错误事务数过高; JMeter有两种运行模式&a…

hadoop分布式集群搭建

Hadoop入门 1. 了解Hadoop 1.1 Hadoop 的优势(4高) 高可靠性:存在多个数据副本,即使某个元素或存储出现故障,也不会导致数据的丢失 高拓展性:在集群见分配任务数据,可方便的拓展数以千计的节…

一文快速学会hadoop完全分布式集群搭建,很详细

文章目录 前言一、准备工作二、克隆三台虚拟机并进行网络配置克隆虚拟机克隆引导修改网络配置验证验证方式一验证方式二 三、安装jdk和hadoop四、ssh免密登录配置概述生成公钥和私钥把公钥拷贝到三台虚拟机上面去验证把hadoop103 和 hadoop104的免密登录配置安装上面的操作再做…

搭建Hadoop分布式集群的详细教程

目录 写在前面 一、创建虚拟机,安装Centos 二、VMware VMnet8模式共享主机网络配置 三、克隆集群节点HadoopSlave1与HadoopSlave2 四、Linux系统配置 五、Hadoop的部署配置 六、Hadoop集群的启动 写在前面 搭建Hadoop集群的过程比较复杂,本文旨在…

五大分布式集群架构问题解决方案

前言 什么是分布式集群? 这里有两个概念:分布式和集群。 分布式:分布式是指将不同的业务分布在不同的地方或者同一个业务模块分拆多个子业务,部署在不同的服务器上,解决高并发的问题。分布式中的每一个节点&#xf…

redis分布式集群搭建

一、软件环境信息 1、redis版本要求:3.0及之后版本 2、服务节点个数要求: 至少3个主节点,其中主节点不少于节点总数的一半;至多16384个节点;每个主节点至少有一个从节点,故redis集群模式至少需要6个服务节点。 3、…

大数据Hadoop集群搭建 1(伪分布式集群)

目录 Hadoop集群简介 Hadoop集群具体来说包含两个集群:HDFS集群和YARN集群。 Hadoop集群的部署方式分为三种,分别是单机模式、伪分布式模式和完全分布式模式。 环境搭建 1.修改主机名 2.修改时区 4.配置ssh免密 5.安装Hadoop 目录结构 配置文件说…

HADOOP 伪分布式集群搭建

一 linux 环境的搭建 由于笔者这里使用的是vmware 虚拟机 采用centos7 linux 操作系统进行搭建,所以一下示例均以centos7进行示例 1. 搭建vmware 虚拟机 (1)创建好虚拟机后采用linux ISO镜像文件启动安装centos7操作系统(其它…

Zookeeper分布式集群部署

文章目录 一:zookeeper安装包下载安装1.下载安装包2.上传安装包3.解压安装包4.改名 二:zookeeper集群配置1.修改zoo.cfg配置文件2.创建myid文件3.配置系统环境变量4.分发zookeeper相关文件至从节点slave1,slave2 三:zookeeper服务…

漫话:如何给女朋友解释什么是分布式和集群?

作者 | 漫小画 公号 | 漫话编程 漫小画 擅长漫话 程小员 擅长编程 某天,下班较早,我正在玩吃鸡,已经到决赛圈了,这时候,女朋友满脸求知欲的朝我走过来。 上次他们都说你给我讲的面向对象太简单了。 那你想怎样&#xf…

什么是分布式集群?

首先来说一下集群的概念,集群是指将多台服务器集中起来一起进行同一种服务。相比一台服务器,集群的优势在于将负载均衡到每台服务器上,可以承载更高的访问量。 分布式又是什么呢,分布式指的是将工作进行业务拆分,然后…

什么是分布式,分布式和集群的区别又是什么?这一篇让你彻底明白!

1. 什么是分布式 ? 分布式系统一定是由多个节点组成的系统。 其中,节点指的是计算机服务器,而且这些节点一般不是孤立的,而是互通的。 这些连通的节点上部署了我们的节点,并且相互的操作会有协同。 分布式系统对于用户而言&a…

什么是集群?什么是分布式?集群与分布式的区别,集群和分布式的关系。

什么是集群 假如你开发了一个程序供大家使用,当然会把开发好的程序放到应用服务器中,刚开始用户量不大,用户访问的正常,服务器压力小。 但是随着用户量的增大,一台服务器不足以支撑系统的正常运行。 于是你决定把程…

python 除法符号_python的除法运算符是什么

python的除法运算符是什么?python中除法运算符有两类,一种是浮点除法运算符,另一种是整除除法运算符。 1. / 浮点除法,就算分子分母都是int类型,也返回float类型,比如我们用4/2,返回2.0 2. // …

c语言和Python整除符号,互联网常识:python除法运算符有哪些

python除法运算符:1、“/”运算符,按照常规数学除法计算的方式直接得出结果即可;2、“//”运算符,取整除,返回商的整数部分(向下取整);3、“%”运算符,返回除法的余数。 本教程操作环境&#xf…

python的除法_python中的除法

广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 截断表示截断小数分,取整数部分的意思。 实际应用中,精确除法比截断除法更频繁,所以有的书上,精确除法也叫普通除法(也就是常用除法) 也有人把精确除法叫浮…

python 整除及余数_python除法余数

广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 常量常量就是不变的变量,在python中,通常用大写的变量名表示常量,这一点和java想相同:ali_address=ali_address=www.alibaba.com4.除法python中和除法...- …

Python 计算之除法

文章目录 1. 除法 /2. 四舍五入round()3. 浮点数取整int()4. 地板除 //5. 向上取整math.ceil()6. 取小数和整数部分math.modf() 1. 除法 / a,b 95,20 c a/b print(a,a,b,b,c,c)运行结果: a 95 b 20 c 4.752. 四舍五入round() round()的第2个位置参数表示取小数…