Hadoop安装教程_单机/伪分布式配置_Hadoop 2.7.7(2.7.7)/CentOS Linux release 7.4.1708

article/2025/10/7 14:15:12

作为大数据研发工程师基础技能,当开始着手 Hadoop课程教学时,安装 Hadoop 往往会成为新手的一道门槛。尽管安装其实很简单,书上有写到,官方网站也有 Hadoop 安装配置教程,但由于对 Linux 环境不熟悉,书上跟官网上简略的安装步骤新手往往 Hold 不住。加上网上不少教程也甚是坑,导致很多学生折腾老几天愣是没装好,或者看似配置好了,其实还是无法运行,很是打击学习热情。

环境

本教程使用 CentOS Linux release 7.4.1708 作为系统环境(Centos7.4 64位),请自行安装系统(可参考centos 7.4 详细安装图文教程 - ETl数据挖掘 - 大数据学习网)。

本教程基于原生 Hadoop 2,在 Hadoop 2.7.7 (stable) 版本下验证通过,可适合任何 Hadoop 2.x.y 版本,如 Hadoop 2.7.1、2.6.0、2.4.1等。

准备工作

任务1:安装配置JAVA 环境

具体详细安装步骤参考:centos 7.4 下安装Java1.8 - ETl数据挖掘 - 大数据学习网

任务2:配置SSH免密登录

(1)首先生成密钥对,使用命令:

ssh-keygen## 或者ssh-keygen -t rsa
上面一种是简写形式,提示要输入信息时不需要输入任何东西,直接回车三次即可。

   

从打印信息中可以看出,私钥id_rsa和公钥id_rsa.pub都已创建成功,并放在 /root/.ssh(隐藏文件夹(以.开头))目录中:

(2)将公钥放置到授权列表文件 authorized_keys中,使用命令:

cp id_rsa.pub authorized_keys

注意:一定要授权列表文件 authorized_keys写对,不能改名。

(3)修改授权列表文件 authorized_keys 的权限,使用命令:

chmod 600 authorized_keys

设置拥有者可读可写,其他人无任何权限(不可读、不可写、不可执行)。

(4)验证免密登录是否配置成功,使用如下命令:

ssh localhost  

安装 Hadoop 

1. 进入到/opt/目录,解压Hadoop

cd /opt/
tar -zxvf hadoop-2.7.7.tar.gz -C /usr/local/hadoop

2. 配置Hadoop系统变量

(1) 首先打开/etc/profile文件(系统环境变量:对所有用户有效):

vim /etc/profile

 (2) 在文件底部添加如下内容:

#HADOOP
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.7
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_HOME_WARN_SUPPRESS=1 生效环境变量:source /etc/profile

3.配置HDFS

1. 配置环境变量hadoop-env.sh

打开hadoop-env.sh文件:

vi /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/hadoop-env.sh 

找到JAVA_HOME参数位置,修改为本机安装的JDK的实际位置

 

2. 配置核心组件core-site.xml

该文件是Hadoop的核心配置文件,其目的是配置HDFS地址、端口号,以及临时文件目录。使用如下命令打开“core-site.xml”文件:

vi /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/core-site.xml 

将下面的配置内容添加到 <configuration></configuration> 中间:

  <property><name>hadoop.tmp.dir</name><value>file:/usr/local/hadoop/tmp</value><description>Abase for other temporary directories.</description></property><property><name>fs.defaultFS</name><value>hdfs://node02:9000</value></property>

3. 配置文件系统hdfs-site.xml

该文件主要用于配置 HDFS 相关的属性,例如复制因子(即数据块的副本数)、NameNode 和 DataNode 用于存储数据的目录等。在完全分布式模式下,默认数据块副本是3 份。 使用如下命令打开“hdfs-site.xml”文件:

vi /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/hdfs-site.xml 

将下面的配置内容添加到 <configuration></configuration> 中间:

    <property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/usr/local/hadoop/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/usr/local/hadoop/tmp/dfs/data</value></property>

4. 配置slaves文件(无需修改)

该文件用于记录Hadoop集群所有从节点(HDFS的DataNodeYARN的NodeManager所在主机)的主机名,用来配合一键启动脚本启动集群从节点(并且还需要保证关联节点配置了SSH免密登录)。

打开该配置文件:

vi /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/slaves 

我们看到其默认内容为localhost,因为我们搭建的是伪分布式集群,就只有一台主机,所以从节点也需要放在此主机上,所以此配置文件无需修改

 5. 配置yarn配置环境变量yarn-env.sh,补全JAVA_HOME对应参数

该文件是YARN框架运行环境的配置,同样需要修改JDK所在位置。

使用如下命令打开“yarn-env.sh”文件:

vi /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/yarn-env.sh 

找到JAVA_HOME参数位置,将前面的#去掉,将其值修改为本机安装的JDK的实际位置:

 6. 配置计算框架mapred-site.xml

在$HADOOP_HOME/etc/hadoop/目录中默认没有该文件,需要先通过如下命令将文件复制并重命名为“mapred-site.xml”:

cp mapred-site.xml.template mapred-site.xml

接着,打开“mapred-site.xml”文件进行修改:

vim /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/mapred-site.xml

将下面的配置内容添加到 中间:

  <property><name>mapreduce.framework.name</name><value>yarn</value></property>

7. 配置YARN系统yarn-site.xml

本文件是YARN框架的核心配置文件,用于配置 YARN 进程及 YARN 的相关属性。

使用如下命令打开该配置文件:

vim /usr/local/hadoop/hadoop-2.7.7/etc/hadoop/yarn-site.xml

将下面的配置内容加入中间:

 <property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>

8.格式化文件系统

hdfs namenode -format

9. 脚本一键启动hdfs

启动集群最常使用的方式是使用脚本一键启动,前提是需要配置 slaves 配置文件和 SSH免密登录。

  • 在本机上使用如下方式一键启动HDFS集群start-dfs.sh

在本机上执行 jps 命令,在打印结果中会看到4 个进程,分别是 NameNode、SecondaryNameNode、Jps、和DataNode,如果出现了这 4 个进程表示HDFS启动成功。

10. 启动集群

在本机上使用如下方式一键启动YARN集群:

start-yarn.sh

ps:start-dfs.sh和start-yarn.sh也是sbin目录下的脚本文件。

打印信息:

  • 在本机上启动了 ResourceManager守护进程

  • 在本机上启动了 NodeManager 守护进程

 

 通过本机的浏览器访问http://本机名:8088或http://本机IP地址:8088查看YARN集群状态,效果如下图所示:


http://chatgpt.dhexx.cn/article/QmoUwbJW.shtml

相关文章

超详细Hadoop安装教程(单机版、伪分布式)

超详细Hadoop安装教程&#xff08;单机版、伪分布式&#xff09; 1.Hadoop分布式系统基础架构介绍1.1.Hadoop核心 2.Hadoop安装教程2.1.环境准备2.2.配置用户ssh 免密登录2.3.JAVA环境的安装和配置2.4.Hadoop安装2.5.单机版Hadoop配置2.6.伪分布式Hadoop配置2.7Hadoop初始化 1.…

Hadoop安装教程_单机/伪分布式配置

目录 测试环境创建hadoop用户更新apt安装SSH、配置SSH无密码登陆配置Java环境安装 Hadoop3.1.3Hadoop部署方式介绍Hadoop单机配置(非分布式)Hadoop伪分布式配置运行Hadoop伪分布式实例 测试环境 Linux系统版本&#xff1a;ubuntukylin-20.04-pro Hadoop版本&#xff1a;hadoop…

Hadoop安装教程方式

本次教程首先介绍的是根据个人经验来安装hadoop环境&#xff0c;其次是林子雨老师Hadoop安装教程方式&#xff0c;大家可以自行选择其中一种方式来进行安装。另外&#xff0c;还附送根据个人经验进行虚拟机磁盘扩容&#xff0c;可以说是痛苦经历吧&#xff01; 个人安装hadoop…

Hadoop安装教程

1:先解决桌面向虚拟机黏贴问题。(在windos环境中下载好hadoop安装包) sudo apt-get autoremove open-vm-tools sudo apt-get update sudo apt-get install open-vm-tools-desktop reboot 2:下载openssh-server sudo apt-get install openssh-server 3:登陆ssh ssh local…

Hadoop安装教程(单机/伪分布式配置)

Hadoop安装文件&#xff0c;可以到Hadoop官网下载&#xff0c;也可以点击这里从百度云盘下载&#xff08;提取码&#xff1a;99bg&#xff09;&#xff0c;进入该百度云盘链接后&#xff0c;找到Hadoop安装文件hadoop-2.7.1.tar.gz&#xff08;本教程也可以用于安装Hadoop 2.7.…

手机突发bug?这几种Android 手机自动化测试工具,关键时刻轻松搞定你的手机!

主要分享软件测试的学习资源&#xff0c;帮助想转行、进阶、小白成为高级测试工程师…1、Monkey是Android SDK自带的测试工具&#xff0c;在测试过程中会向系统发送伪随机的用户事件流&#xff0c;如按键输入、触摸屏输入、手势输入等等&#xff09;&#xff0c;实现对正在开发…

安卓自动化测试框架

安卓APP测试框架总结&#xff1a; 基于Instrumentation的测试框架&#xff0c;比如Espresso&#xff0c;Robotium&#xff0c;Selendroid等&#xff0c;都不能支持跨APP使用。 如自动化测试中有跨APP操作&#xff0c;我们可以结合UiAutomator实现。支持BDD&#xff08;行为驱动…

自动化测试工具-Airtest

目录 一、Airtest介绍与安装二、Airtest基于图像识别自动控制手机App流程三、Airtest基于Poco的UI组件自动化控制App流程四、Airtest实现手机群控操作 一、Airtest介绍与安装 主要介绍区别&#xff0c;以及各种详细的教程可以看这篇文章&#xff0c;和selenium、appium都是用来…

手把手教你使用手机自动化测试工具Airtest

安卓手机自动化操作框架--Airtest 项目官网&#xff1a;http://airtest.netease.com/ 前言 Airtest是网易基于信息识别出品的一个自动化操作框架&#xff0c;可以模拟人工机械操作&#xff0c;对于日常中一些机械录入手机系统的信息完全可以使用Airtest来代替&#xff0c;实现录…

APP自动化测试

大框架参考&#xff1a;appium新手入门&#xff08;第2步Android和sdk安装与配置需要百度&#xff09; 前提&#xff0c;已经安装好了JDK&#xff0c;Maven 一、安装Android SDK 1、下载地址 http://tools.android-studio.org/index.php/sdk 2、设置Android环境变量 3、安…

android 自动化测试

Android 谈谈自动化测试 Android自动化测试原来可以这么简单 几款Android 应用自动化测试工具 Android自动化测试探索&#xff08;一&#xff09;adb详细介绍 - 周希 - 博客园 移动测试基础 Android&#xff1a;自动化兼容性测试 Android 上一次编写&#xff0c;随处测试 a…

手机自动化测试

随着手机被越来越多人使用&#xff0c;移动自动化也是趋势所在。 测试的时间是至关重要的&#xff0c;尤其是移动测试&#xff0c;软件测试生命周期中的手工测试的时间已经影响到了手机抢占最佳市场先机。因此自动化是不可避免的需求。 什么是手机自动化测试? 要回答这个问题&…

App 自动化测试

一、5分钟上手自动化测试——AirtestPoco快速上手 - Airtest Project DocsAirtest Project Docshttps://airtest.doc.io.netease.com/tutorial/1_quick_start_guide/自动化测试工具-Airtest_十一姐的博客-CSDN博客_airtest工具目录一、Airtest介绍与安装二、Airtest基于图像识别…

android 自动化测试工具

Auto.js https://github.com/hyb1996/Auto.js/tree/master/app/src/main/assets/sample 布局范围分析 https://blog.csdn.net/zy0412326/article/details/105140707 免费版auto.js apk 下载 https://zhuanlan.zhihu.com/p/90065914?from_voters_pagetrue&ivk_sa10243…

Github每日精选(第65期):手机自动化测试工具maestro

Maestro 现在手机ui的测试工具已经很多了&#xff0c;为什么还要多一款Maestro 呢&#xff1f;我们来看看Maestro 的介绍。 Maestro 是为您的移动应用程序自动化 UI 测试的最简单方法。 github的地址在这里。 Maestro 建立在其前辈&#xff08;Appium、Espresso、UIAutomat…

手机自动化测试工具实现

手机自动化测试工具实现 一、PC 端监控工具实现 1、手机自动化可解决的问题 ( 1 ) 压力测试&#xff1a;一些连续不断的操作&#xff0c;比如反复切换歌曲播放及联网操作等 ( 2 ) 极限临界测试&#xff1a;一些极限条件的构造&#xff08;创建多个列表&#xff09;及输入字…

五款Android 应用的自动化测试工具

如今自动化测试已经应用到每天的测试中。这不足为奇&#xff0c;因为自动化测试在测试过程中节约了时间&#xff0c;还能避免包括人为因素造成的测试错误和遗漏。 自动化测试工具选择很多。一些是开源的&#xff0c;一些非常贵。一些自动化工具是几年前出的,一些才在市场上出来…

Android 应用有哪些自动化测试工具

目录 简述&#xff1a; 1、Monkey 测试 2、 MonkeyRunner 测试 3、Robotium测试 4、Ronaorex测试 5、Appium测试 6、UI Automator 测试 7、TestBird 测试 简述&#xff1a; 本文介绍几款流行的 Android应用自动化测试工具。希望对你有帮助&#xff0c; Monkey测试&…

六款Android 应用的自动化测试工具

如今自动化测试已经应用到每天的测试中。这不足为奇&#xff0c;因为自动化测试在测试过程中节约了时间&#xff0c;还能避免包括人为因素造成的测试错误和遗漏。 自动化测试工具选择很多。一些是开源的&#xff0c;一些非常贵。一些自动化工具是几年前出的,一些才在市场…

超好用的手机开源自动化测试工具分享

随着消费者对移动应用使用的占比增加, APP测试越来越被重视! 在现已出现的开源移动自动化测试工具中&#xff0c;总结了几个最实用的&#xff0c;希望对大家有帮助&#xff1a; 一、Calabash&#xff08;适用于Android和iOS&#xff09; Calabash-android是支持android的UI自…