Hadoop应用配置

article/2025/10/8 21:38:42

文章目录

    • hadoop目录
    • 配置hadoop角色
    • hadoop运行和使用
    • hadoop 观察FsImage和EditLog
    • 分发配置

hadoop目录

  • bin :功能模块
  • sbin:shell脚本
  • etc:配置
  • lib:使用库
    bin和sbin目录都要加入到环境变量中。
vi /etc/profile

增加:
export HADOOP_HOME = /opt/data/hadoope-.6.5
export PATH= P A T H : PATH: PATH:JAVA_HOME/bin: H A D O O P H O M E / b i n : HADOOP_HOME/bin: HADOOPHOME/bin:HADOOP_HOME/sbin
说明:HADOOP_HOME 是hadoop代码路径/安装路径;

配置hadoop角色

配置1:

  • cd $HADOOP_HOME /etc/hadoop
  • vi hadoop-env.sh
  • 修改其内的JAVA_HOME路径为绝对路径,因为ssh远程操作的时候无法通过$JAVA_HOME获得路径

配置2:

  • cd $HADOOP_HOME /etc/hadoop
  • vi core-site.xml
  • 配置NameNode的主机名和端口号(决定NameNode启动的主机和端口,使其他从机知道NameNode位置)

配置3:

  • cd $HADOOP_HOME /etc/hadoop
  • vi hdfs-site.xml 配置副本数量,NameNode元数据和DataNode数据(block块)放置位置,同时配置SNN(主机名:端口)和其存储路径
    在这里插入图片描述

配置4:

  • cd $HADOOP_HOME /etc/hadoop
  • vi slaves 配置DataNode角色启动位置

hadoop运行和使用

  • 格式化:只执行一次,且格式化只生成NameNode;
hdfs namenode -format
  • 启动:读取配置文件,完成NameNode和DataNode,SecondaryNameNode启动,该shell脚本将会执行bin下slaves.sh,将登录所有的slaves。
start-dfs.sh
  • 启动完成后,可以通过NameNode配置的主机名:端口号访问该集群,如http://node01:50070

  • 修改windows: C:\Windows\Systenm32\drivers\etc\hosts文件,增加主机的ip地址和主机名,如 192.168.150.11 node01

  • hdfs操作

hdfs dfs -mkdir -p /user/root  //递归创建目录,使用和linux相同
hdfs dfs -put filepath /user/root //将文件放到user/root目录下

hadoop 观察FsImage和EditLog

  • 前往/var/bigdata/hadoop/local/dfs/name/current路径可以查看当前的FsImage和EditLog
  • cd /var/bigdata/hadoop/local/dfs/secondary/current,只需要拷贝最新的FsImage和EditLog

分发配置

  1. ssh配置
    配置ssh免密,用于启动dfs。将执行start-dfs.sh脚本的服务器的公钥分发给其他所有的服务器。
  2. 将配置的文件分发给所有的服务器(包含core-site.xml, hdfs-site.xml, salves)

http://chatgpt.dhexx.cn/article/aBtknWfd.shtml

相关文章

配置Hadoop_1

配置Hadoop_1 1. 配置jdk2. 配置Hadoop3.完全分布式运行环境(配置集群)3.1 编写集群分发脚本xsync3.2 rsync远程同步工具3.3 xsync集群分发脚本3.4 SSH无密登录配置3.5集群配置3.6 配置历史服务器3.7 配置日志的聚集 3.8 两个常用脚本asd 1. 配置jdk 上…

hadoop集群配置(保姆级教学)

目录 1 .集群配置 (1)集群部署规划 (2)配置文件说明 (3)配置集群 (1)核心配置文件 (2)HDFS配置文件 (3)YARN配置文件 (4)MapRedu…

Hadoop集群配置

一:集群部署规划 注意: ➢ NameNode和SecondaryNameNode不要安装在同一台服务器 ➢ ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台机器上。 二:配置文件说明 Hadoop配置文件分两类&#xff1a…

Hadoop配置环境变量(详解版)

1.运行hadoop的程序报错java.io.IOException: Could not locate executable nullinwinutils.exe in the Hadoop binaries. **这是因为windows环境变量不兼容的原因解决办法: 首先需要下载 hadoop的tar.gz包,前提是JDK必须配置成功,存放路径不…

hadoop配置文件

安装前的工作: jdk集群中节计算机互联互通关闭防火墙节点间的计算机免密码登录(authorized_keys认证文件root用户存放在/root/.ssh/) (User用户 /home/user/.ssh/) A计算机免密码登录B计算机,将A计算机的公钥存放在B计算机的认证…

4.Hadoop环境配置

4. 集群配置 4.1 集群部署规划 安装前先做好节点规划,完全分布式目前规划1个主节点(Master)和2个从节点(Slave)一共三个节点。 部署规划要求: NameNode和SecondaryNameNode不要安装在同一台服务器。Reso…

hadoop环境配置

hadoop环境配置 一、VmWare与linux版本VmWare版本:linux版本 二、使用VmWare来安装linux软件三、三台linux服务器环境准备1、三台机器IP设置2、三台机器关闭防火墙3、三台机器关闭selinux4、三台机器更改主机名5、三台机器更改主机名与IP地址映射6、三台机器同步时间…

hadoop详细安装及配置

一、下载 http://hadoop.apache.org/ hadoop官网 二、解压 注:使用管理员权限解压 三、配置环境变量 添加HADOOP_HOME配置:自己安装hadoop路径,我的是D:\hadoop-3.0.3 在Path中添加如下:自己安装hadoop路径/bin,…

Hadoop集群的配置

一.、创建虚拟机 (10条消息) CentOS 7 虚拟机的搭建_仄言2997的博客-CSDN博客 1. 创建虚拟机 2. 安装 CentOS 二、虚拟机网络设置 (10条消息) 虚拟机网络配置_仄言2997的博客-CSDN博客 三、 安装JDK (10条消息) 虚拟机安装jdk,运行java文件_仄言2997的博客-CSDN博客…

Hadoop集群环境配置搭建

一、简单介绍 Hadoop最早诞生于Cutting于1998年左右开发的一个全文文本搜索引擎 Lucene,这个搜索引擎在2001年成为Apache基金会的一个子项目,也是 ElasticSearch等重要搜索引擎的底层基础。 项目官方:https://hadoop.apache.org/ 二、Linux环…

超详解Hadoop集群环境配置,步步附有截图,一篇讲解清楚

写在最前,在配置Hadoop之前,要确定已经准备好了Hadoop的准备环境,并且已经在机器上安装完了Hadoop,以及编写了一些必要的集群脚本,具体操作详情见这两篇文章 Hadoop安装及集群脚本编写 Hadoop集群准备环境搭建 一、Ha…

大数据开发之Hadoop学习3--Hadoop运行模式

Hadoop运行模式 目录 Hadoop运行模式 4.1 本地运行模式(官方wordcount) 4.2 完全分布式运行模式 4.2.1 虚拟机准备 4.2.2 编写集群分发脚本xsync 4.2.3 SSH无密登录配置 4.2.4 集群配置 4.2.5 群起集群 4.2.6 集群启动/停止方式总结 4.2.7 配置…

Hadoop完全分布式集群——Hadoop 配置

前面已完成VMware虚拟机安装与配置(参考前一篇Hadoop完全分布式集群——VMware虚拟机安装与配置_夏雨和阳阳的博客-CSDN博客),下面将进行Hadoop 配置。 一、slave1、slave2节点配置修改 slave1、slave2节点都需要进行以下操作: …

简易员工信息管理系统

这是一个虽然简单但很有代表性和借鉴性的管理系统。没有使用现有框架SSH等,使用自有JavaBeanJSPServlet技术。 该系统的源码经过细心打磨,可以作为去Spring框架的简单Web系统开发模板使用,从设计模式、函数式编程、Lambda表达式、业务分层、页…

基于SSH学生请假管理系统

【A-021】基于SSH学生请假管理系统 开发环境: Eclipse/MyEclipse、Tomcat8、Jdk1.8 数据库: MySQL (1)管理员模块 定义一个最高级管理员,可以对整个系统进行查询修改等操作,浏览修改其他管理员的相关信息…

简单的员工信息管理系统

需求: 做一个简易命令行版本的员工信息管理系统 现有员工:张三,年龄23,工号9527;李四,年龄32,工号,007; 王五,年龄22,工号&a…

员工考勤系统

需求: 一、用户管理 1、用户列表 列表字段:姓名、登录名、性别、手机号、薪资、岗位、角色 列表按钮:编辑、启用、停用、重置密码 搜索条件:用户名、状态(启用停用) 顶部按钮:新增用户 导入、导…

企业如何利用OA系统轻松管理员工请休假

企业的员工想请个假,为什么人事和员工都在喊难? 员工请假麻烦: 不知道自己还有多少年假没有休,每次都要去人事那里查,有事请假要找领导报备交接工作,填完单子还要找领导签字,如果哪天请假领导出…

JavaEE技术的员工请假管理系统的设计与实现

摘 要 近年来,随着网络产业的飞速发展,人们的日常生活和工作方式也随之发生变化。许多公司正在把常规的工作方式与因特网相融合,借助因特网的力量来提升管理者的工作能力。当前很多员工请假管理系统工作都有很多问题,所以针对员…

人事管理系统如何做好员工考勤管理?

企业考勤管理的主要难题在于考勤、排班、假勤这三块,对于考勤来说,往往存在一些漏打卡、代打卡、打卡慢的情况; 对于排班,存在着多班次混排的情况,对各人员调配、设备调配、轮班作业、生产计划调整等有复杂调配需求&a…