Hadoop集群的配置

article/2025/10/8 22:13:47

一.、创建虚拟机

(10条消息) CentOS 7 虚拟机的搭建_仄言2997的博客-CSDN博客

    1. 创建虚拟机

    2. 安装 CentOS

 二、虚拟机网络设置

(10条消息) 虚拟机网络配置_仄言2997的博客-CSDN博客

三、 安装JDK

(10条消息) 虚拟机安装jdk,运行java文件_仄言2997的博客-CSDN博客

四、 安装 Hadoop

(10条消息) 虚拟机安装Hadoop_仄言2997的博客-CSDN博客

    1. 下载并解压

    2. 修改配置

五、组成集群(本章)

        1、虚拟机克隆与主机配置

        2、配置每台主机

       (1)主机配置:更改IP地址

        (2) 修改主机名(重启后永久生效)

        (3)设置ip和域名映射,四台主机都需要修改

        3. 免密登录

        4、Hadoop集群的配置

        (1)修改文件#############workers

         (2) 创建数据和临时文件夹

       5.、格式化 HDFS

六、 启动集群(本章)

        1、关闭防火墙 

        2、 宿主机上做节点映射

        3、Hadoop环境变量配置 (对所有节点)

七、 关闭集群(本章)

在上几篇文章中我们已经完成了jdk 以及Hadoop的安装和配置,下面我们就开始Hadoop集群的配置。

组成集群

虚拟机克隆与主机配置

(1)这里推荐采用完整克隆方式,克隆时需要虚拟机处于关机状态。

2. 配置每台主机

 (1)主机配置:更改IP地址

设置固定IP命令:vi  /etc/sysconfig/network-scripts/ifcfg-ens33

dot1: 192.168.230.151

dot2: 192.168.230.152

dot3: 192.168.230.153

使用ip addr查看ip地址,ping www.baidu.com,ping通表示成功。

(2) 修改主机名(重启后永久生效)

命令:vi /etc/sysconfig/network

或者 命令:vi /etc/hostname

对于其他节点:

dot1 -  vi /etc/hostname

 dot1

dot2 - vi /etc/hostname

dot2

dot3 -  vi /etc/hostname

dot3

 (3)设置ip和域名映射,四台主机都需要修改

命令:vi /etc/hosts

192.168.199.150 demo demo.centos.com
192.168.199.151 dot1 dot1.centos.com
192.168.199.152 dot2 dot2.centos.com
192.168.199.153 dot3 dot3.centos.com

    3. 免密登录

 免密登录设置步骤

**第一步:四台机器生成公钥与私钥**

在四台机器执行以下命令,生成公钥与私钥

ssh-keygen -t rsa

执行该命令之后,按下三个回车即可

**第二步:拷贝公钥到同一台机器**

四台机器将拷贝公钥到demo机器

四台机器执行命令:

ssh-copy-id demo

 **第三步:复制第一台机器的认证到其他机器**

将demo机器的公钥拷贝到其他机器上

在demo机器上面指向以下命令

scp /root/.ssh/authorized_keys dot1:/root/.ssh

scp /root/.ssh/authorized_keys dot2:/root/.ssh

scp /root/.ssh/authorized_keys dot3:/root/.ssh

各机器之间实现免密登录

ssh master

ssh node1

ssh node2

ssh node3

exit

    4. 格式化 HDFS

 2、Hadoop集群的配置

(1)修改文件#############workers

dot1

dot2

dot3

 (2) 创建数据和临时文件夹

  (3) 创建数据和临时文件夹

demo 主节点:

mkdir -p /data/hadoop/tmp

mkdir -p /data/hadoop/namenode

Other dots:

mkdir -p /data/hadoop/tmp

mkdir -p /data/hadoop/datanode

或者在dot节点shell :

ssh dot1“mkdir -p /data/hadoop/tmp & mkdir -p/data/hadoop/datanode

ssh dot2“mkdir -p /data/hadoop/tmp & mkdir -p/data/hadoop/datanode

ssh dot3“mkdir -p /data/hadoop/tmp & mkdir -p/data/hadoop/datanode

格式化 HDFS

在demo上面:

cd /opt/hadoop-3.1.4

cd bin

./hdfs namenode -format demo

    5. 启动集群

  启动集群

在demo上操作,cd到sbin文件夹 (/opt/hadoop-3.1.4/sbin),注意启动顺序:

[root@master sbin]# ./start-dfs.sh

[root@master sbin]# ./start-yarn.sh

[root@master sbin]# ./mr-jobhistory-daemon.sh start historyserver 或者  mapred --daemon start historyserver

!!!报错:设置hadoop-env.sh

/opt/hadoop-3.1.4/etc/hadoop/hadoop-env.sh

在demo上设置,添加授权:

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

 拷贝文件到其他节点:

scp hadoop-env.sh dot1:/opt/hadoop-3.1.4/etc/hadoop/

scp hadoop-env.sh dot2:/opt/hadoop-3.1.4/etc/hadoop/

scp hadoop-env.sh dot3:/opt/hadoop-3.1.4/etc/hadoop/

[root@demo hadoop]# scp hadoop-env.sh dot1:/opt/hadoop-3.1.4/etc/hadoop/
hadoop-env.sh                                                                            100%   16KB   4.8MB/s   00:00    
[root@demo hadoop]# scp hadoop-env.sh dot2:/opt/hadoop-3.1.4/etc/hadoop/
hadoop-env.sh                                                                            100%   16KB   4.4MB/s   00:00    
[root@demo hadoop]# scp hadoop-env.sh dot3:/opt/hadoop-3.1.4/etc/hadoop/
hadoop-env.sh                                                                            100%   16KB   4.7MB/s   00:00    
[root@demo hadoop]# 

-> 再重复2步骤,通过jps查看进程

 在demo上操作,cd到sbin文件夹 (/opt/hadoop-3.1.4/sbin),注意启动顺序:

[root@master sbin]# ./start-dfs.sh

[root@master sbin]# ./start-yarn.sh

[root@master sbin]# ./mr-jobhistory-daemon.sh start historyserver 或者  mapred --daemon start historyserver

6. 关闭防火墙 

 (对所有节点,可以考虑在克隆之前完成)

systemctl status firewalld.service

systemctl stop firewalld.service & systemctl disable firewalld.service

 点击链接:

http://192.168.199.150:50070/dfshealth.html#tab-overview

​​​​​http://192.168.199.150:8088/cluster

http://192.168.199.150:19888/jobhistory

 

7. 宿主机上做节点映射

宿主机上修改,host文件

/C:/Windows/System32/drivers/etc/hosts

192.168.199.150 demo demo.centos.com
192.168.199.151 dot1 dot1.centos.com
192.168.199.152 dot2 dot2.centos.com
192.168.199.153 dot3 dot3.centos.com

编辑文件

 8. Hadoop环境变量配置 

 (对所有节点)

vi /etc/profile

export HADOOP_HOME=/opt/hadoop-3.1.4

export PATH=$PATH:$HADOOP_HOME/bin

[root@demo ~]# vi /etc/profile
[root@demo ~]# source /etc/profile
[root@demo ~]# echo $HADOOP_HOME
/opt/hadoop-3.1.4
[root@demo ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/opt/hadoop-3.1.4/bin

6. 关闭集群

在master上操作,cd到sbin文件夹 (/opt/hadoop-3.1.4/sbin),注意关闭顺序:

[root@master sbin]# ./stop-dfs.sh

[root@master sbin]# ./stop-yarn.sh

[root@master sbin]#./mr-jobhistory-daemon.sh stop historyserver 或者 mapred --daemon stop historyserver

poweroff

Hadoop集群就配置成功啦!


http://chatgpt.dhexx.cn/article/VkUoyYBu.shtml

相关文章

Hadoop集群环境配置搭建

一、简单介绍 Hadoop最早诞生于Cutting于1998年左右开发的一个全文文本搜索引擎 Lucene,这个搜索引擎在2001年成为Apache基金会的一个子项目,也是 ElasticSearch等重要搜索引擎的底层基础。 项目官方:https://hadoop.apache.org/ 二、Linux环…

超详解Hadoop集群环境配置,步步附有截图,一篇讲解清楚

写在最前,在配置Hadoop之前,要确定已经准备好了Hadoop的准备环境,并且已经在机器上安装完了Hadoop,以及编写了一些必要的集群脚本,具体操作详情见这两篇文章 Hadoop安装及集群脚本编写 Hadoop集群准备环境搭建 一、Ha…

大数据开发之Hadoop学习3--Hadoop运行模式

Hadoop运行模式 目录 Hadoop运行模式 4.1 本地运行模式(官方wordcount) 4.2 完全分布式运行模式 4.2.1 虚拟机准备 4.2.2 编写集群分发脚本xsync 4.2.3 SSH无密登录配置 4.2.4 集群配置 4.2.5 群起集群 4.2.6 集群启动/停止方式总结 4.2.7 配置…

Hadoop完全分布式集群——Hadoop 配置

前面已完成VMware虚拟机安装与配置(参考前一篇Hadoop完全分布式集群——VMware虚拟机安装与配置_夏雨和阳阳的博客-CSDN博客),下面将进行Hadoop 配置。 一、slave1、slave2节点配置修改 slave1、slave2节点都需要进行以下操作: …

简易员工信息管理系统

这是一个虽然简单但很有代表性和借鉴性的管理系统。没有使用现有框架SSH等,使用自有JavaBeanJSPServlet技术。 该系统的源码经过细心打磨,可以作为去Spring框架的简单Web系统开发模板使用,从设计模式、函数式编程、Lambda表达式、业务分层、页…

基于SSH学生请假管理系统

【A-021】基于SSH学生请假管理系统 开发环境: Eclipse/MyEclipse、Tomcat8、Jdk1.8 数据库: MySQL (1)管理员模块 定义一个最高级管理员,可以对整个系统进行查询修改等操作,浏览修改其他管理员的相关信息…

简单的员工信息管理系统

需求: 做一个简易命令行版本的员工信息管理系统 现有员工:张三,年龄23,工号9527;李四,年龄32,工号,007; 王五,年龄22,工号&a…

员工考勤系统

需求: 一、用户管理 1、用户列表 列表字段:姓名、登录名、性别、手机号、薪资、岗位、角色 列表按钮:编辑、启用、停用、重置密码 搜索条件:用户名、状态(启用停用) 顶部按钮:新增用户 导入、导…

企业如何利用OA系统轻松管理员工请休假

企业的员工想请个假,为什么人事和员工都在喊难? 员工请假麻烦: 不知道自己还有多少年假没有休,每次都要去人事那里查,有事请假要找领导报备交接工作,填完单子还要找领导签字,如果哪天请假领导出…

JavaEE技术的员工请假管理系统的设计与实现

摘 要 近年来,随着网络产业的飞速发展,人们的日常生活和工作方式也随之发生变化。许多公司正在把常规的工作方式与因特网相融合,借助因特网的力量来提升管理者的工作能力。当前很多员工请假管理系统工作都有很多问题,所以针对员…

人事管理系统如何做好员工考勤管理?

企业考勤管理的主要难题在于考勤、排班、假勤这三块,对于考勤来说,往往存在一些漏打卡、代打卡、打卡慢的情况; 对于排班,存在着多班次混排的情况,对各人员调配、设备调配、轮班作业、生产计划调整等有复杂调配需求&a…

【023】Springboot+vue+mysql员工考勤管理系统(多角色登录、请假、打卡)(含源码、数据库、运行教程)

前排提示:项目源码已放在文末 开发环境:SpringbootMysqlVueNodejsMavenJDK1.8 技术栈:spring-boot、mysql、mybatis-plus、druid连接池。 部分功能及代码介绍: 1.员工类型:部门经理、副总经理、总经理、人事人员、财务…

【024】Vue+Springboot+mysql员工考勤管理系统(多角色登录、请假、打卡)(含源码、数据库、运行教程、实验报告)

前排提示:项目源码已放在文末 基于VueSpringbootmysql员工考勤管理系统(多角色登录、请假、打卡) 开发环境:SpringbootMysqlVueNodejsMavenJDK1.8 技术栈:spring-boot、mysql、mybatis-plus、druid连接池。 与【023】相比,【024…

java企业员工考勤请假工资人事管理系统springboot+vue

springboot是spring家族中的一个全新框架,用来简化spring程序的创建和开发过程。在以往我们通过SpringMVCSpringMybatis框架进行开发的时候,我们需要配置web.xml,spring配置,mybatis配置,然后整合在一起,而…

学生请假管理系统--UML画图

参与者 学生、班主任、学工处、学校领导、教务管理系统 功能 学生 销假请假/续假查看(请假/销假/续假)进度查询个人请假记录 班主任 查询班级请假记录审批学生请假/销假/续假信息 学工处 审批学生请假/销假/续假信息设置规则查询数据 学校领导 …

员工管理系统

一.项目介绍: 该项目主要是实现了管理员和普通用户登录功能,登录后会出现相应的功能菜单。管理员的功能菜单包括查询、修改、添加用户、删除用户、查询历史记录、退出功能,其中查询分为按人名查找和查找所有,修改可以按照…

ssm员工考勤签到请假管理系统 idea maven

1、管理员账号:abo 密码:abo 2、开发环境为Eclipse/idea,数据库为mysql 使用java语言开发。 3.eclipse配置好tomcat 即可打开首页 idea tomcat部署处 必须用项目名 ,不能带_war 4.数据库连接src\main\resources\config.properties中修改 5…

【员工管理系统】

员工管理系统 前言需求分析系统设计系统框图所需技术 系统实现编写代码测试 前言 这是一个使用epoll实现TCP并发服务器,并让客户端登录服务器可以进行员工的管理,员工的信息存储在sqlite数据库中,对数据库进行增删改查实现对员工的添加&…

一个简单的请假系统

本项目是一个简单的spring项目,使用了springmybatis,实现数据的增,删,查,和poi的基本使用,导出数据库中的请假信息到excel中等一些基本的功能。有很多不足之处欢迎大家指出,后面慢慢学习会慢慢优…

Java项目:JSP员工出差请假考勤管理系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 本项目为后台管理系统; 管理员角色包含以下功能: 登录,首页,考勤记录增删改查,假期申请记录增删改查,出差申请记录增删…