启动Hadoop集群

article/2025/8/28 9:37:45

启动Hadoop集群

第一次启动前置工作

注意:首次启动 HDFS 时,必须对其进行格式化操作。本质上是一些清理和准备工作,因为此时的 HDFS 在物理上还是不存在的。(本质是对namenode进行初始化)

命令:hdfs namenode -format 或者 hadoop namenode -format

命令中的 - 已经修复为 英文输入法下的 -

关于hdfs的格式化:
首次启动需要进行格式化;
格式化本质是进行文件系统的初始化操作 创建一些自己所需要的文件;
格式化之后 集群启动成功 后续再也不要进行格式化
格式化的操作在hdfs集群的主角色(namenode)所在机器上操作(我们设置的是node-1)。

注意:第一次格式化启动是会为集群产生一个标识,标识我们每一个节点的ID是多少,如果格式化之后,你再进行一次格式化,就会改变这个标识,导致节点的ID发生变化,导致集群启动失败。

[外链图片转存失败(img-MCU6lU6N-1565707079239)(D:\学习笔记\hadoop\保存图片\安装Hadoop\格式化HDFS01.jpg)]

HDFS格式化失败解决方案

格式化的时候发现,之前设置的hddata文件夹没有创建,查询不大节点ID,然后懵了。

这时候想到的是格式化失败,因为之前是复制之前的脚本输入的,想了想,是不是脚本有问题,于是手动输入了一下,格式化成功了,对比之前的命令,发现 中文状态下的- 和英文状态下的- 不是一样的。心态爆炸…

启动Hadoop

要启动 Hadoop 集群,需要启动 HDFS 和 YARN 两个集群。

单节点逐个启动

在主节点上使用以下命令启动 HDFS NameNode:

hadoop-daemon.sh start namenode

在每个从节点上使用以下命令启动 HDFS DataNode:

hadoop-daemon.sh start datanode

在主节点上使用以下命令启动 YARN ResourceManager:

yarn-daemon.sh start resourcemanager

在每个从节点上使用以下命令启动 YARN nodemanager:

yarn-daemon.sh start nodemanager

以上脚本位于Hadoop安装目录下的sbin目录下。如果想要停止某个节点上某个角色,只需要把命令中的 start 改为 stop 即可。

脚本一键启动

如果配置了 etc/hadoop/slaves 和 ssh 免密登录,则可以使用程序脚本启动所有 Hadoop 两个集群的相关进程,在主节点所设定的机器上执行。

首先进入Hadoop的安装目录下的sbin目录,我这边是:cd /export/server/hadoop-2.7.4/sbin/

里面有 .sh 结尾的文件(用于在Linux上启动集群),有.cmd结尾的文件(用于在window上启动集群)。

start-dfs.sh  			# 启动hdfs
sbin/start-yarn.sh		# 启动YARN
stop-dfs.sh 			# 停止hdfs集群
stop-yarn.sh			# 停止yarn集群

里面还有start-all.shstop-all.sh ,这两个可以直接启动或停止HDFS和YARN集群,但是这两个命令是过时了的,可能到了Hadoop的某个版本就不能使用了。

[外链图片转存失败(img-MLSoEv1C-1565707079240)(D:\学习笔记\hadoop\保存图片\安装Hadoop\启动Hadoop集群.jpg)]

集群 web-ui

一旦 Hadoop 集群启动并运行,可以通过 web-ui 进行集群查看,如下所述:

NameNode 			http://nn_host:port/ 	默认 50070.
ResourceManager 	http://rm_host:port/ 	默认 8088.

这个需要我们在window上配置主机名IP映射,之前貌似有介绍配置。

然后直接在电脑的浏览器上输入:node-1:50070 即可看到这个界面。

[外链图片转存失败(img-sXZzBKSm-1565707079262)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面01.jpg)]

[外链图片转存失败(img-141H4IxK-1565707079263)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面02.jpg)]

Non DFS Used = 配置的容量 - 剩余容量 - DFS使用容量
而配置容量 = 总容量 - 预留空间(总容量为磁盘的总大小,预留空间为默认的5%)
所以,Non DFS used=(总容量-预留空间)- 剩余容量 - DFS使用容量

查看hdfs目录文件

在UI界面上点击Utilities显示下拉菜单,在下拉菜单中选择Browse the file system。

[外链图片转存失败(img-r6m4Hvb5-1565707079264)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面查看hdfs存储文件.jpg)]

进入后,我们输入 / 查看根目录下存储的文件,因为集群刚刚创建,所以里面没有任何数据。

[外链图片转存失败(img-4KkYV9Kz-1565707079265)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面查看hdfs存储文件01.jpg)]

我们在Linux系统上上传一个文件后再来这查看一下。

hdfs dfs -ls /						# 查看hdfs根目录下的文件
hdfs dfs -mkdir /hellohdfs			# 在根目录下创建一个名为hellohdfs的文件
hdfs dfs -put 1.txt /hellohdfs		# 将1.txt上传到hellohdfs文件夹下
hdfs dfs -ls /hellohdfs				# 查看 hellohdfs 文件夹下的文件

[外链图片转存失败(img-dmXsEP4Z-1565707079265)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面查看hdfs存储文件02.jpg)]

[外链图片转存失败(img-8I6TxeHP-1565707079266)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面查看hdfs存储文件03.jpg)]

查看YARN的UI界面

在浏览器输入:node-1:8088 即可进入yarn的ui界面。

[外链图片转存失败(img-AK5Pd6Of-1565707079267)(D:\学习笔记\hadoop\保存图片\安装Hadoop\HadoopUI界面查看yarn.jpg)]

在yarn上运行一个Hadoop自带的案例程序:计算圆周率。

使用命令:cd /export/server/hadoop-2.7.4/share/hadoop/mapreduce/ ,这个下面存放了一个example的jar包(java写的)。

这个案例用来计算圆周率。

使用命令Hadoop jar来加载jar包程序:hadoop jar hadoop-mapreduce-examples-2.7.4.jar pi 20 50

后面的pi 20 50 是所输入的参数(这个不用太深究,毕竟只是测试)。

[外链图片转存失败(img-KOmwFvSS-1565707079267)(D:\学习笔记\hadoop\保存图片\安装Hadoop\初次尝试测试yarn上运行.jpg)]

在yarn的UI界面,我们可以看到正在运行的mr程序。

[外链图片转存失败(img-tpnnzNFR-1565707079268)(D:\学习笔记\hadoop\保存图片\安装Hadoop\初次尝试测试yarn上运行01.jpg)]


http://chatgpt.dhexx.cn/article/rmqMq3iT.shtml

相关文章

Hadoop集群部署和启动与关闭

文章目录 一、安装Hadoop二、Hadoop高可用集群配置三、启动Hadoop高可用集群配置四、关闭Hadoop高可用集群 Hadoop集群的部署方式分为三种,分别是独立模式(Standalone mode)、伪分布式模式(Pseudo-Distributed mode)和…

Hadoop集群搭建(超级详细)

感谢评论区大佬们指出文章中的一些错误,已经进行修改。如果还存在其他错误,希望大佬们指出! 需要的安装包:jdk-8u162-linux-x64.tar.gz( 提取码:6k1i )、hadoop-3.1.3.tar.gz( 提取…

Hadoop集群搭建配置教程

Hadoop3.1.3集群搭建 前言集群规划集群搭建具体步骤1、下载hadoop-3.1.3.tar.gz2、上传并解压3、配置path变量4、修改配置文件4.1 修改文件hadoop-env.sh4.2 修改文件workers4.3 修改文件core-site.xml4.4 修改文件hdfs-site.xml4.5 修改文件mapred-site.xml4.6 修改文件 yarn-…

Hadoop集群配置及运行

本文章基于尚硅谷Hadoop 3.x视频进行总结,仅作为学习交流使用 视频链接如下:30_尚硅谷_Hadoop_入门_集群配置_哔哩哔哩_bilibili 集群配置整体思路 1.切换到/opt/module/hadoop-3.3.4/etc/hadoop,配置core-site.xml、hdfs-site.xml、…

hadoop集群概述

Hadoop集群(cluster) 概述 Hadoop集群包含两个集群:HDFS集群、YARN集群两个集群逻辑上分离,物理上在一起两个集群都是标准的主从架构 HDFS(分布式存储)集群包括三种角色 NNSNNDN YARN集群有两个角色 RM…

超详细的Hadoop集群部署

本文建立在已经把虚拟机ip环境等已经下载好情况下。 那么,直接开始今天的正题: 搭建集群 环境准备 这里提供两种思路:一种是将一台直接搭建好,后面的克隆或者copy虚拟机 一种是3台并进,多次进行虚拟机之间文件互传&…

Hadoop集群格式化

hadoop搭建过程中需要进行格式化,而在进行文件配置过程中难免会出错,导致格式化后集群不能正常启动, 想要重新格式化,删掉hadoop-2.10.1目录下的tmp文件夹: rm -rf tmp hadoop版本因人而异,之后重新进行格式化即可&am…

Hadoop集群的启动

在首次启动Hadoop之前还需要进行一些配置工作 我们是在Linux集群上安装Hadoop集群 Linux中对大小写敏感! 1. 配置操作系统的环境变量 注意,一说Linux操作系统的环境变量 配置文件就在/home/wangguowei下的.bash.profile中 将hadoop的家目录写好 并引入…

搭建Hadoop集群

实验二 搭建Hadoop集群 1 实验目的 搭建Hadoop集群;掌握Linux分发;掌握Hadoop启动和关闭。 2 实验内容 搭建Hadoop集群,配置etc/下的配置文件,设置主从节点,设置Hadoop环境变量,分发到其他电脑&#xf…

5. Hadoop集群操作

5. Hadoop集群操作 5.1 启动Hadoop集群 5.1.1 格式化文件系统 如果集群是第一次启动,需要在hadoop102节点格式化NameNode。 注意:格式化NameNode,会产生新的集群id,导致NameNode和DataNode的集群id不一致,集群找不到…

hadoop集群迁移

集群迁移 主要是要找到两个集群中active状态的namenode 集群迁移不同于服务器之间的文件发送,在hdfs中,文件是以块的形式,只可以通过namenode访问文件,所以迁移时需要通过hadoop命令 主要命令是distcp distcp有很多参数&#xf…

Hadoop集群实验

目录 1.实验介绍 2.安装前准备 3.实验环境搭建 4.安装Hadoop 4.1下载Hadoop 4.2修改hadoop配置文件 5.启动Hadoop集群 6.Hadoop测试 1.实验介绍 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式…

Hadoop集群部署

Hadoop集群部署 一、环境准备二、在hadoop102中安装jdk三、在 hadoop102 安装 Hadoop安装hadoop查看 Hadoop 目录结构 四、编写集群分发脚本1. scp(secure copy)安全拷贝2.rsync远程同步工具3.xsync集群分发脚本 五、ssh免密登录1.配置ssh2.免密配置 六、…

Hadoop集群简介

Hadoop集群整体概述: Hadoop集群包括两个集群:HDFS集群、YARN集群 两个集群逻辑上分离(两个集群互相之间没有依赖、互不影响)、通常物理上在一起(某些角色进程往往部署在同一台物理服务器上) 两个集群都是标准的主从架构集群 MapReduce算是集群吗&…

hadoop集群

一、概念 Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统,类似mogilefs,但又不同于mogilefs,hdfs由存放文件元数…

Hadoop入门详解以及Hadoop集群搭建

一、Hadoop概念 hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。hadoop充分利用了集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Distributed File System&#xff…

把Redis 设置成服务

设置Redis服务 上面虽然安装启动了Redis,但是一旦关闭cmd窗口,redis就关闭了,为了我们日后开发测试的便利,我们当然要把它设置成windows服务项。 打开cmd命令窗口,切换到Redis目录,输入如下命令: redis-…

配置redis,对外服务

前言 在服务器安装完redis之后,别的机器想要通过IP和端口连接Redis服务器是连接不上的,因此需要配置redis对外服务。 一、打开redis配置文件 vi /etc/redis/redis.conf二、修改bind绑定的地址 三、关闭保护模式 四、重启redis服务 service redis res…

Redis 服务监控

Redis现在在很多公司中应用已经很广泛了,但是如何监控redis,实时的观察redis的性能,下面就关于Redis的常用监控介绍一下。 一、使用redis自带的info命令和monitor命令 现在常见的监控方案基本上都是使用redis自带的info命令和monitor命令获取…

Windows下将Redis设置为服务

如果下载的是免安装的 Redis ,解压文件后运行 Redis-server.exe就可开启服务 但是,这个窗口不能关闭,否则服务也会随之关闭,过于麻烦,也不方便操作 所以,我们可以将 redis 设置为一种服务,可利…