Hadoop常见场景

article/2025/9/25 9:19:35

本篇文章主要列举一些Hadoop常用场景

​ 主要是以下几种

高可用集群

节点新增/减少/拉黑

HDFS数据迁移

大量小文件存储

高可用集群

​ 一句话概括 双namenode消除单点故障

​ 过程:

​ 对active Namenode进行的任何操作,都会同步到共享存储设备(从NAS NSF挂载)到一个目录,备用节点会监控共享存储设备,发现更改同步到自身,发生故障时进行切换

img

Hadoop节点上下线

上线

  1. 首先在slave配置中新加节点并且保证dfs.exclude文件为空

  2. 刷新node节点 ./hdfs dfsadmin -refreshNodes

  3. 直接启动节点./hadoop-daemon.sh datanode

  4. 如果是部署在yarn上,则 ./yarn-daemon.sh start nodemanager

  5. 均衡broker ./bin/start-balancer.sh -threshold 5

  6. 速度慢的话 ,修改带宽

     <property>
    2   <name>dfs.balance.bandwidthPerSec</name>  
    3   <value>1048576</value>  
    4   <description>  
    5     Specifies the maximum amount of bandwidth that each datanode   
    6     can utilize for the balancing purpose in term of   
    7     the number of bytes per second.   
    8   </description> 
    9 </property>
    

    下线

    • 需要配置的文件

    ​ namenode节点的dfs.exclude文件,添加下线节点即可

    ​ resourcemanager节点上的yarn.exclude文件,同样添加下线节点

    • 刷新Namenode和ResourceManager

    ​ hdfs dfsadmin -refreshNodes //刷新Namenode节点

    ​ yarn rmadmin -refreshNodes //刷新ResourceManager节点

    • 打开web浏览器,查看节点状态为udecommission in progress 表示正在退役中,当变为decommissioned 表明该节点数据块已被全部复制,所以不用担心下线数据丢失的问题

      • **注意:**如果集群节点副本数为n,则服役的节点必须>=n,否则不能下线成功
    • 停止datanode和namenode节点

      ./sbin/hadoop-daemon.sh stop datanode

      ./sbin/yarn-daemon.sh stop nodemanager

    • 数据不平衡,参考上文,使用再平衡命令进行修改

    Namenode 和DataNode多目录配置

    ​ 原因:增加可靠性

    namenode

    • 修改hfds.site配置,将dfs.namenode.name.dir 下的配置文件以多个逗号隔开

    • 配置已成功,需要格式化重启

      删除logs和data文件

      rm -rf data/* logs/*

    • 格式化namenode

      ./sbin/hdfs namenode -format

    • 启动集群

    思考一个问题,生产环境上敢格式化namenode吗?

    DataNode

    ​ 和namenode类似,修改hdfs.site配置文件中的dfs.datanode.data.dir属性,多个文件以逗号隔开

    HDFS小文件合并

    ​ 使用HDFS存档文件或者HAR文件

    ​ 原理:类似于在小文件外面包了一层,对Namenode来说是一个整体,对内还是一个一个的独立文件

    ​ 操作: 使用archive命令归档

    • bin/hadoop archive -archiveName a.har -p /usr/local/tmp
      

    HDFS数据迁移

    ​ 应用场景:集群升级情况

    ​ 使用命令:distcp

    ​ 过程:

    1. 新旧集群都要配置对方的主机名

    2. 执行命令 hadoop distcp hftp://hadoop1.x-namenode:50070/usr/local /usr/tmp

    3. 修改hdfs.site.xml配置

      <property>
      <name>dfs.checksum.type</name>
      <value>CRC32</value>
      <description>when  transfer data from  hadoop 1.x to hadoop 2.x  the data block  checksum  in hadoop 1.x is crc32and  hadoop 2.x is crc32c .   transfer data will fail .
      </description>
      </property>
      


http://chatgpt.dhexx.cn/article/h4D10GNo.shtml

相关文章

Hadoop的优势及大数据平台系统架构典型行业应用场景

扩容能力强&#xff1a;Hadoop可以部署在数百台并行运行的廉价服务器集群&#xff0c;能提供成百上千TB的数据节点上运行的高度可扩展的存储与计算平台。 成本低&#xff1a;Hadoop可以通过普通廉价的服务器集群分布式处理数据&#xff0c;从而降低成本。 高效率&#xff1a;…

大数据利器:Hadoop的十大应用场景[转]

【IT168 评论】谁在用Hadoop?这是个问题。在大数据背景下&#xff0c;Apache Hadoop已经逐渐成为一种标签性&#xff0c;业界对于这一开源分布式技术的了解也在不断加深。但谁才是Hadoop的最大用户呢?首先想到的当然是它的“发源地”&#xff0c;像Google这样的大型互联网搜索…

金三银四、金九银十 面试宝典 Spring、MyBatis、SpringMVC面试题 超级无敌全的面试题汇总(超万字的面试题,让你的SSM框架无可挑剔)

Spring、MyBatis、SpringMVC 框架 - 面试宝典 又到了 金三银四、金九银十 的时候了&#xff0c;是时候收藏一波面试题了&#xff0c;面试题可以不学&#xff0c;但不能没有&#xff01;&#x1f941;&#x1f941;&#x1f941; 一个合格的 计算机打工人 &#xff0c;收藏夹里…

Spring 常见面试题

目录 Spring 基础 1、什么是 Spring 框架? 2、Spring 包含的模块有哪些&#xff1f; 3、Spring,Spring MVC,Spring Boot 之间什么关系? Spring IoC 4、谈谈自己对于 Spring IoC 的了解 5、什么是 Spring Bean&#xff1f; 6、将一个类声明为 Bean 的注解有哪些? 7、…

Spring框架常见面试题

1. 你对Spring框架的理解(特点)&#xff1f; Spring框架有哪些模块 &#xff1f; Spring&#xff0c;一种用来简化企业应用级开发的一种开源框架。简化开发&#xff1a;它对常用的API做了封装&#xff0c;比如对JDBC的封装&#xff0c;使用Spring JDBC访问数据库&#xff0c;就…

【面试】Spring面试题

文章目录 Spring概述什么是spring?Spring的俩大核心概念Spring框架的设计目标&#xff0c;设计理念&#xff0c;和核心是什么Spring的优缺点是什么&#xff1f;Spring有哪些应用场景Spring由哪些模块组成&#xff1f;Spring 框架中都用到了哪些设计模式&#xff1f;详细讲解一…

Spring框架面试精华知识

咳咳&#xff0c;这里整理一些关于WEB框架的一些知识点&#xff0c;来帮助更多的人进行面试&#xff0c;主要的还是讲解一些关于目前企业用得比较流行的框架&#xff0c;还有就是一些比较前沿的框架&#xff0c;比如阿里开源的Dubbo框架及其开源框架Zookeeper等等&#xff0c;都…

Spring框架-面试题核心概念

目录 1.Spring框架的作用是什么&#xff1f; 2. 什么是DI&#xff1f; 3.什么是AOP&#xff1f; 4.Spring常用注解 5.Spring中的设计模式 6.Spring支持的几种bean的作用域 7.Spring中Bean的生命周期&#xff1f; 8.Spring中的事务管理 9.Spring中的依赖注入方式有几种 10.Sprin…

MyBatis+Spring+SpringMVC框架面试题整理(一)

目录 SpringMVC 的工作原理 谈谈你对SpringMVC的理解 SpringMVC 常用注解都有哪些? Spring 的常用注解 如何开启注解处理器和适配器? 如何解决 get 和 post 乱码问题? 谈谈你对 Spring 的理解 Spring 中的设计模式(解释) 简单介绍一下 Spring bean 的生命周期&…

面试官:看你简历上写熟悉Spring框架,谈谈对Spring的理解

今天只谈一下我们在面试中的如果面试官问到Spring&#xff0c;你应该怎么去回答&#xff0c;来获取面试官的青睐。在我的印象中&#xff0c;Spring框架可以说是Java世界里面最为成功的框架了&#xff0c;在企业的实际的应用里面&#xff0c;大部分的企业架构都是基于Spring框架…

说实话,面试这么问Spring框架的问题,我快扛不住了

面试官&#xff1a;Spring Framework有用过吧? 小小白&#xff1a;用过(有些心虚&#xff0c;因为Spring框架中内容太多了)。 面试官&#xff1a;在applicationgContext.xml文件中定义了一个bean&#xff0c;id为authService&#xff0c;通过ApplicationContext实例对象的getB…

【java面试】框架篇之Spring

1.你如何理解Spring? 具体来说Spring是一个轻量级的容器&#xff0c;用于管理业务相关对象的。核心功能主要为&#xff1a;IOC,AOP,MVC。 IOD&#xff1a;控制反转&#xff0c;将对象的创建过程交给容器&#xff0c;让容器管理对象的生命周期如创建&#xff0c;初始化&#…

spring框架-如何面试(四)

回顾&#xff1a; spring框架-认识spring框架&#xff08;一&#xff09; spring框架-认识IOC&#xff08;二&#xff09; spring框架-认识AOP&#xff08;三&#xff09; 面试官关于spring最喜欢、也是概率最大的提问 谈谈你对spring的理解 spring的官方定义&#xff1a;…

Spring框架面试题总结(面试必备)

1. spring 概述部分 1.1 什么是spring? 1.2 spring框架的核心? 1.3 spring框架的优缺点 1.4 spring5 的主要模块构成 1.5 Spring 框架中都用到了哪些设计模式&#xff1f; 1.6 讲解一下核心容器&#xff08;spring context应用上下文) 模块 2. spring的控制反转&#xff08…

cmos管宽长比,OC, OD门和线与逻辑,传输门,竞争冒险,三态门

https://blog.csdn.net/vivid117/article/details/100187137 pmos,nmos宽长比https://blog.csdn.net/qq_34070723/article/details/89291200 cmos宽长比&#xff1a; 1.CMOS的宽长比 关于COMS原理及结构图可以参考[1]COMS原理及门电路设计. 栅在源漏方向的长度称作栅的长L&…

OD门OC门

什么是集电极开路&#xff08;OC&#xff09;&#xff1f; % {0 V: X2 {1 I2 s E( y; n! S 我们先来说说集电极开路输出的结构。集电极开路输出的结构如图1所示&#xff0c;右边的那个三极管集电极什么都不接&#xff0c;所以叫做集电极开路&#xff08;左边的三极管为反相之用…

最强深入浅出上拉、OC门、OD门 —— 电子电路基础2

写在前面&#xff1a;对于本科阶段数电课程课时比较少的学校&#xff0c;这一块老师很可能就跳过了&#xff0c;对于这一块的知识来源&#xff0c;清华大学阎石的数电课本在第三章CMOS门电路和TTL门电路。 先看一些电路&#xff1b; &#xff08;1&#xff09;为什么有些时候单…

女朋友去应聘硬件工程师,面试官考她OC门、OD门和推挽输出!

硬件工程师的笔试题中经常会考OC门和OD门&#xff0c;有的放在面试中问&#xff0c;多个OC或者多个OD门能组成线与结构&#xff0c;线与结构考的更频繁&#xff0c;还有一个推挽输出&#xff0c;有一些单片机的GPIO用的就是这种结构&#xff0c;如最常见的STM32。 原创博主AirC…

OC门、OD门和推挽输出

1. OC门 OC意为集电极开路&#xff0c;结构如下&#xff1a; OC门电路 A0&#xff0c;①截止&#xff0c;②导通&#xff0c;相当于开关闭合&#xff0c;输出0V&#xff08;实际输出不是0V&#xff0c;因为三极管存在饱和压降&#xff09;。 A1&#xff0c;①导通&#xff0…

线与逻辑与OC门、OD门关系

线与逻辑:两个或多个输出信号连接在一起可以实现逻辑“与”的功能。 以下图为例: 当与非门G1和G2输出都为1时,输出L才为1;只要有一个输出为0,则输出L为0。 在硬件上,要用OC门(三极管,集电极开路)或OD门(NMOS,漏极开路)来实现。另外,为了防止灌电流过大,在输出端…