Hadoop集群测试

article/2025/8/28 9:45:39

文章目录

  • Hadoop集群测试
    • 一,通过UI界面查看Hadoop运行状态
      • 1,hadoop2和hadoop3端口区别表
      • 2,查看HDFS集群状态
      • 3,查看yarn状态
    • 二,Hadoop集群体验
      • 1,启动Hadoop集群
      • 2,在虚拟机上准备文件
      • 3,文件上传到HDFS指定目录
      • 4,运行词频统计程序的jar包
      • 5,在HDFS集群UI界面查看结果文件
      • 6,在YARN集群UI界面查看程序运行状态

Hadoop集群测试

一,通过UI界面查看Hadoop运行状态

Hadoop集群正常启动后,它默认开放了两个端口9870和8088,分别用于监控HDFS集群和YARN集群。通过UI界面可以方便地进行集群的管理和查看,只需要在本地操作系统的浏览器输入集群服务的IP和对应的端口号即可访问。

1,hadoop2和hadoop3端口区别表

![在这里插入图片描述](https://img-blog.csdnimg.cn/1547df2137c04ca6a9f94bebb9533839.png

2,查看HDFS集群状态

在浏览器里访问http://master:9870 会发现进入不了
在这里插入图片描述
打开本机路径: C:\Windows\System32\drivers\etc 这个目录下的hosts 文件
在这里插入图片描述
进入hosts文件进行修改 一定要记住这里是浮动IP,不然进去那个网站,上面的注释不要删了
增加hadoop集群主机名与IP地址的映射
在这里插入图片描述
浏览器输入网址:master:9870 这下就能进去了 从图中可以看出HDFS集群状态显示正常。
在这里插入图片描述
单击Datanodes,查看数据节点信息
在这里插入图片描述
点开 Utilities 下拉菜单,选择 Browse the file system 可以看到有一些之前添加的东西
在这里插入图片描述
在HDFS上创建一个目录BigData2,执行命令:hdfs dfs -mkdir /BigData2
在这里插入图片描述
在Hadoop WebUI界面查看刚才创建的目录 可以看到新加了一个刚刚创建的BigData2目录
在这里插入图片描述

3,查看yarn状态

访问http://master:8088/cluster,从图中可以看出YARN集群状态显示正常。
在这里插入图片描述
单击 About
在这里插入图片描述

二,Hadoop集群体验

1,启动Hadoop集群

在master虚拟机上执行命令:start-all.sh
在这里插入图片描述

2,在虚拟机上准备文件

在master虚拟机上创建cipin.txt 文件 ,用来装词频统计所需要的词
在这里插入图片描述
在这里插入图片描述

3,文件上传到HDFS指定目录

输入命令: hdfs dfs -put cipin.txt /BigData2 上传 cipin.txt 文件到 HDFS 的 /BigData2 目录
在这里插入图片描述
在 Hadoop WebUI查看文件是否上传成功 可以看到 /BigData2 目录下已经有这个文件了
在这里插入图片描述

4,运行词频统计程序的jar包

输入命令: cd $HADOOP_HOME/share/hadoop/mapreduce 查看Hadoop自带示例的jar包
在这里插入图片描述
执行命令:hadoop jar ./hadoop-mapreduce-examples-3.3.4.jar wordcount /BigData2/cipin.txt /tongji 最后这个 /tongji 要空一格,用来存放统计好的结果
在这里插入图片描述
查看输出目录/tongji,执行命令:hdfs dfs -ls /tongji 会看到下面有两个文件
在这里插入图片描述
查看词频统计结果,执行命令:hdfs dfs -cat /tongji/* 后面那个*代表所有
可以看到我之前存在cipin.txt 文件里每个词出现的次数
在这里插入图片描述

5,在HDFS集群UI界面查看结果文件

在HDFS集群UI界面生成了一个tongji目录,查看/tongji 目录
在这里插入图片描述
下面有两个目录,查看下面那个 统计结果的目录
在这里插入图片描述
单击之后,会出现一个提示框,然后点击Download
在这里插入图片描述
单击 Download,下载结果文件到本地
在这里插入图片描述
用写字本打开结果文件
在这里插入图片描述

6,在YARN集群UI界面查看程序运行状态

访问http://master:8088,看到FINISHED和SUCCEEDED
在这里插入图片描述
单击应用标识application_1664509926859_0005,查看应用的运行详情
在这里插入图片描述


http://chatgpt.dhexx.cn/article/fvdamAhP.shtml

相关文章

CentOS7搭建hadoop集群

说明: 1.准备三台虚拟机,参考:CentOS7集群环境搭建(以3台为例) 2.配置虚拟机间免密登陆:参考:CentOS7集群配置免密登录 3.虚拟机分别安装jdk:参考:CentOS7集群安装JDK1.8 4.hadoop安装包下载&am…

启动Hadoop集群

启动Hadoop集群 第一次启动前置工作 注意:首次启动 HDFS 时,必须对其进行格式化操作。本质上是一些清理和准备工作,因为此时的 HDFS 在物理上还是不存在的。(本质是对namenode进行初始化) 命令:hdfs namenode -format 或者 had…

Hadoop集群部署和启动与关闭

文章目录 一、安装Hadoop二、Hadoop高可用集群配置三、启动Hadoop高可用集群配置四、关闭Hadoop高可用集群 Hadoop集群的部署方式分为三种,分别是独立模式(Standalone mode)、伪分布式模式(Pseudo-Distributed mode)和…

Hadoop集群搭建(超级详细)

感谢评论区大佬们指出文章中的一些错误,已经进行修改。如果还存在其他错误,希望大佬们指出! 需要的安装包:jdk-8u162-linux-x64.tar.gz( 提取码:6k1i )、hadoop-3.1.3.tar.gz( 提取…

Hadoop集群搭建配置教程

Hadoop3.1.3集群搭建 前言集群规划集群搭建具体步骤1、下载hadoop-3.1.3.tar.gz2、上传并解压3、配置path变量4、修改配置文件4.1 修改文件hadoop-env.sh4.2 修改文件workers4.3 修改文件core-site.xml4.4 修改文件hdfs-site.xml4.5 修改文件mapred-site.xml4.6 修改文件 yarn-…

Hadoop集群配置及运行

本文章基于尚硅谷Hadoop 3.x视频进行总结,仅作为学习交流使用 视频链接如下:30_尚硅谷_Hadoop_入门_集群配置_哔哩哔哩_bilibili 集群配置整体思路 1.切换到/opt/module/hadoop-3.3.4/etc/hadoop,配置core-site.xml、hdfs-site.xml、…

hadoop集群概述

Hadoop集群(cluster) 概述 Hadoop集群包含两个集群:HDFS集群、YARN集群两个集群逻辑上分离,物理上在一起两个集群都是标准的主从架构 HDFS(分布式存储)集群包括三种角色 NNSNNDN YARN集群有两个角色 RM…

超详细的Hadoop集群部署

本文建立在已经把虚拟机ip环境等已经下载好情况下。 那么,直接开始今天的正题: 搭建集群 环境准备 这里提供两种思路:一种是将一台直接搭建好,后面的克隆或者copy虚拟机 一种是3台并进,多次进行虚拟机之间文件互传&…

Hadoop集群格式化

hadoop搭建过程中需要进行格式化,而在进行文件配置过程中难免会出错,导致格式化后集群不能正常启动, 想要重新格式化,删掉hadoop-2.10.1目录下的tmp文件夹: rm -rf tmp hadoop版本因人而异,之后重新进行格式化即可&am…

Hadoop集群的启动

在首次启动Hadoop之前还需要进行一些配置工作 我们是在Linux集群上安装Hadoop集群 Linux中对大小写敏感! 1. 配置操作系统的环境变量 注意,一说Linux操作系统的环境变量 配置文件就在/home/wangguowei下的.bash.profile中 将hadoop的家目录写好 并引入…

搭建Hadoop集群

实验二 搭建Hadoop集群 1 实验目的 搭建Hadoop集群;掌握Linux分发;掌握Hadoop启动和关闭。 2 实验内容 搭建Hadoop集群,配置etc/下的配置文件,设置主从节点,设置Hadoop环境变量,分发到其他电脑&#xf…

5. Hadoop集群操作

5. Hadoop集群操作 5.1 启动Hadoop集群 5.1.1 格式化文件系统 如果集群是第一次启动,需要在hadoop102节点格式化NameNode。 注意:格式化NameNode,会产生新的集群id,导致NameNode和DataNode的集群id不一致,集群找不到…

hadoop集群迁移

集群迁移 主要是要找到两个集群中active状态的namenode 集群迁移不同于服务器之间的文件发送,在hdfs中,文件是以块的形式,只可以通过namenode访问文件,所以迁移时需要通过hadoop命令 主要命令是distcp distcp有很多参数&#xf…

Hadoop集群实验

目录 1.实验介绍 2.安装前准备 3.实验环境搭建 4.安装Hadoop 4.1下载Hadoop 4.2修改hadoop配置文件 5.启动Hadoop集群 6.Hadoop测试 1.实验介绍 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式…

Hadoop集群部署

Hadoop集群部署 一、环境准备二、在hadoop102中安装jdk三、在 hadoop102 安装 Hadoop安装hadoop查看 Hadoop 目录结构 四、编写集群分发脚本1. scp(secure copy)安全拷贝2.rsync远程同步工具3.xsync集群分发脚本 五、ssh免密登录1.配置ssh2.免密配置 六、…

Hadoop集群简介

Hadoop集群整体概述: Hadoop集群包括两个集群:HDFS集群、YARN集群 两个集群逻辑上分离(两个集群互相之间没有依赖、互不影响)、通常物理上在一起(某些角色进程往往部署在同一台物理服务器上) 两个集群都是标准的主从架构集群 MapReduce算是集群吗&…

hadoop集群

一、概念 Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统,类似mogilefs,但又不同于mogilefs,hdfs由存放文件元数…

Hadoop入门详解以及Hadoop集群搭建

一、Hadoop概念 hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。hadoop充分利用了集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Distributed File System&#xff…

把Redis 设置成服务

设置Redis服务 上面虽然安装启动了Redis,但是一旦关闭cmd窗口,redis就关闭了,为了我们日后开发测试的便利,我们当然要把它设置成windows服务项。 打开cmd命令窗口,切换到Redis目录,输入如下命令: redis-…

配置redis,对外服务

前言 在服务器安装完redis之后,别的机器想要通过IP和端口连接Redis服务器是连接不上的,因此需要配置redis对外服务。 一、打开redis配置文件 vi /etc/redis/redis.conf二、修改bind绑定的地址 三、关闭保护模式 四、重启redis服务 service redis res…