CDH目录结构

article/2025/10/3 6:48:03

1 组件安装路径:   /opt/cloudera/parcels/CDH/lib  

 

2 组件配置路径:  /etc/组件名/conf     步骤1 通过软链接指过来

 hadoop配置文件路径:/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop  (hadoop软链接 -->/etc/hadoop/conf)

   /etc/hadoop/conf 软连接指向/etc/alternatives/hadoop-conf 

  hadoop-conf又通过软链接指向: /etc/hadoop/conf.cloudera.yarn       这才是真实的hdfs配置文件路径

 

注:如果没有安装hdfs:  hadoop-conf指向目录为:/opt/cloudera/parcels/CDH-6.3.1-1.cdh6.3.1.p0.1470567/etc/hadoop/conf.empty

hadoop命令定位HDFS namenode就是依据上述配置路径。 在没有安装HDFS的情况下,我们可以手动设置软链接指向,即可使用hadoop命令。

   hive配置文件路径:/opt/cloudera/parcels/CDH/lib/hive/conf  (conf软链接 -->/etc/hive/conf)

3 组件命令行直接输入可以运行。如hadoop  hive命令

  PATH:   /bin/hadoop    /usr/bin/hadoop

 上述2者都是 软链接 指向 /etc/alternatives/hadoop ,这里又软链接指向 /opt/cloudera/parcels/CDH/bin/hadoop

 

4 日志路径(参看 6运行时路径, log4j.properties):

  Cloudera  server日志路径:

        /var/log/cloudera-scm-server/cloudera-scm-server.log

 

Agent日志路径:

       /var/log/cloudera-agent-server/cloudera-scm-agent.log

 

 

  HDFS日志路径:

      各namenode的日志类似

            /var/log/hadoop-hdfs/hadoop-cmf-hdfs-NAMENODE-hadoop000.log.out

     各datanode的日志类似

           /var/log/hadoop-hdfs/hadoop-cmf-hdfs-DATANODE-hadoop001.log.out

   Journal node日志路径

          /var/log/hadoop-hdfs/hadoop-cmf-hdfs-NAMENODE-hadoop002.log.out

 

      KAFKA日志路径:

         /var/log/kafka/kafka-broker-hadoop002.log

 

YARN

nodemanager 日志: /var/log/hadoop-yarn/hadoop-cmf-yarn-NODEMANAGER-hadoop002.log.out

   resourcemanager:             /var/log/hadoop-yarn/hadoop-cmf-yarn-RESOURCEMANAGER-hadoop001.log.out

job history 服务器日志路径:/var/log/hadoop-mapreduce/hadoop-cmf-yarn-JOBHISTORY-hadoop001.log.out

    /var/log/

 

 

5 数据路径

 

namenode数据路径:

/dfs/nn/current          current/VERSION  下会保存namenode所属的CLUSTERID,  

 

datanode数据路径:

/datax/dfs/dn    (默认/dfs/dn)        路径 current/VERSION  下会保存datanode节点所属的CLUSTERID,  

此ID必须同NAMENODE cluster id一致,否则无法启动。

 

Journalnode同步edit log数据路径:

 /datax/dfs/jnn

 

brokerid 在配置项可以自行指定修改对应参数。

  笔者 重装CDH时,忘记删除目录数据,导致重装后启动失败。  

 

kafka数据路径:

/var/local/kafka/data

/var/local/kafka/data/meta.properties会保存brokerid信息。如果broke id同集群的ID不匹配,启动会报错。

笔者重装CDH时,也是忘记删除此目录数据,导致无法启动kafka.

 

6 运行时路径。[各组件运行时,实际的配置文件路径]

CDH的相关组件重启时都会动态生成新的配置文件启动,依据CDH管理配置界面各组件的配置来动态生成最新的配置文件。

在此路径下,通过log4j.properties, 可以看到对应的日志文件路径。

HDFS重启时,也会动态生成相关配置路径

如:core-site.xml,hdfs-site.xml,log4j.properties

/run/cloudera-scm-agent/process/76-hdfs-DATANODE

启动时stderr,stdout输出日志路径就在此目录下log路径查看。

 

Kafka重启时,每次都会动态生成下述目录,99 每次递增(数字根据各类事件顺序递增).  目录下会根据最新的配置文件,产生相关配置文件。

如kafka.properties, kafka-monitor.properties以及日志log4j.properites

/run/cloudera-scm-agent/process/99-kafka-KAFKA_BROKER

log4j.properites配置了broker日志路径: /var/log/kafka/kafka-broker-hadoop001.log

 

HIVESERVER2:

/var/run/cloudera-scm-agent/process/248-hive-HIVESERVER2

7 yarn job日志路径:

yarn.nodemanager.remote-app-log-dir参数,配置了Yarn application开启日志聚合时,指定的日志聚合路径。

一旦应用程序跑完,相关日志会立即被删除,并被转移到聚合路径下。

 

yarn job日志查看方法:以spark job为例:

 

yarn job ,主要分为  AM和 container两大类容器:

 

1)AM的日志主要为job容器管理职责,相关启动容器分配资源的日志信息

保存路径也在默认在节点本地路径:

/data1/yarn/container-logs/application_1587434606227_0004/container_1587434606227_0004_01_000001

application_1587434606227_0004           为applicationId

container_1587434606227_0004_01_000001      为AM容器id

 

AM所在节点,可以在WEB UI上查看。


 

 

2)一般子task运行的日志在container容器中查看: 

默认保存在节点本地:/data1/yarn/logs/appliaciotnID/containerId下

 

具体executor路径可以查看所在节点:通过AM的 track url进入executor界面:

a)

 

b)

3)注:   如果启用了日志聚合,task运行完毕, 上述路径的所有容器日志都会删除,并统一搜集到 HDFS路径下: /tmp/logs/[username]/logs .

a)  可以WEB ui 点击各logs下的链接stdout, stderr查看

b) 也可以通过任一节点: yarn logs -applicationId application_1587434606227_0004 查看聚合日志信息。

    日志输出包含多个容器日志清单:

上述例子:先输出:  000003,000002容器日志,最后输出AM容器(spark driver) 00001

c)通过 hadoop fs -cat 查看,

如下列表。 效果同 yarn logs命令一样。

 

8 组件启动目录

CDH组件启动目录都是在 /opt/cloudera/cm-agent/service

如hiveserver2在WEB端重启的时候,实际会使用的重启脚本,如下: 

停止hiveserver2角色:  具体命令待确认?

 

启动hiveserver2:    /opt/cloudera/cm-agent/service/hive/hive.sh hiveserver2

还会启动一些辅助进程:

Re-exec watcher: /opt/cloudera/cm-agent/bin/cm proc_watcher 71255
Re-exec redactor: /opt/cloudera/cm-agent/bin/cm redactor --fds 3 5

 

 

 

 

 

 

 

 

 

 

 

 


http://chatgpt.dhexx.cn/article/whFlX6uP.shtml

相关文章

CDH邮件报警配置

CDH邮件报警配置 cloudera manager提供邮件告警功能,方便管理员在集群出现问题的第一时间维护集群。 登录CM 点击进入cloudera manager service服务 启用电子邮件警报 在搜索框输入启用电子邮件警报,并启用 配置邮箱服务器 配置邮箱服务器 保存配置并…

CDH 6.3.1安装

一、准备工作 1 安装lrzsz [roothadoop001 ~]# yum -y install lrzsz [roothadoop002 ~]# yum -y install lrzsz [roothadoop003 ~]# yum -y install lrzsz2 上传安装文件 [roothadoop001 ~]# rz[roothadoop001 cdh63]# ll -h total 3.9G -rw-r--r-- 1 root root 2.0G Oct …

CDH部署及排错

第1章 搭建 前言 该文档为部署CDH6.3.1,其他版本的CDH安装步骤大体一样,如果安装其他版本的cdh遇到报错,请参考我的另一篇文档。 CDH-7.1.4安装报错解决 1.1 说明 这里的ip和主机名视实际情况而定 1.2 环境 操作系统 CentOS 7 服务器5台&#xff0c…

CDH 维护

1、cm启动 systemctl restart cloudera-scm-serversystemctl restart cloudera-scm-agent2、虚拟机异常,导致mysql重启失败 去掉data目录下的ib_logfile0 ib_logfile1这两个文件,mv rm都行 然后启动mariadb就行 3、CDH 测试数据不足: 测试 A…

CDH

CDH(Cloudera Distribution Hadoop), 是一个大数据平台 Hadoop的发行版本有很多,有华为发行版,Intel发行版,Cloudera发行版(CDH),MapR版本,以及HortonWorks版本等。所有发行版都是基于Apache Hadoop衍生出来…

centos7安装cdh全过程

centos7配置静态ip Vi /etc/sysconfig/network-scripts/ ifcfg-ens33 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno IPV6INITyes IPV6_AUTOCONFyes IPV6_DEFROUTEyes IPV6_FAILURE_FATALno IPV6_ADDR_GEN_MODEstable-priva…

CDH是什么?

CDH CDH是Cloudera的100%开放源代码平台发行版,包括Apache Hadoop,是专门为满足企业需求而构建的。CDH可立即提供企业使用所需的一切。通过将Hadoop与十几个其他关键的开源项目集成在一起,Cloudera创建了功能先进的系统&#xff0…

CDH简介

一、CDH概念 CDH,全称Clouderas Distribution, including Apache Hadoop。由美国的Cloudera公司推出的大数据产品;CDH是基于稳定版本的Apache Hadoop构建而成,也是目前市场上应用比较广泛的大数据产品。 二、CDH架构 三、CDH优点 1.版本管理…

大数据之CDH(web页面部署Hadoop)

一、了解CDH 在众多 Hadoop 版本中, CDH 是 Hadoop 众多分支中比较出色的版本, 它由Cloudera 发行和维护。CDH 基于 Apache 的 Hadoop 进行重新构建,提供了基于 Web 页面的群集部署和管理操作。 1.1 Hadoop 属于开源软件,采用Apa…

CDH简介及CDH部署、原理和使用介绍( 版本6.3.1 )

CDH简介及CDH部署、原理和使用介绍( 版本6.3.1 ) 第一章:CDH简介 CDH概念 ​ CDH是Cloudera的100%开源平台发行版,包括Apache Hadoop,专为满足企业需求而构建。CDH提供开箱即用的企业使用所需的一切。通过将Hadoop与十几个其他…

Symmetric Eigenvalue Decomposition

求特征值求出s,如何求r 转载于:https://www.cnblogs.com/zzsama/p/10856126.html

Eigenvalue and singular value

1. 特征值: A为方阵,v是A的特征向量。 λ是特征向量v对应的特征值。 一个矩阵的特征向量是一组正交向量。 其中Q是这个矩阵A的特征向量组成的矩阵; 一个矩阵其实就是一个线性变换,因为一个矩阵乘以一个向量后得到的向量&#xff0…

Part2 正交、行列式、特征值

方阵的行列式determinant eigen values特征值 Determinants det A|A| 这三个性质定义了行列式: 1. det I1 2. exchange rows:reverse sign of det 置换矩阵 det P1 even -1 odd 3. matlab求行列式: pivot formula主…

【线代NumPy】第八章 - 特征值和特征向量 | Eigenvalue and Eigenvector | 简述并提供代码

💬 例1: import numpy as npA = np.array([[2, 3], [3, -6]]) w1, V1 = np.linalg.eig(A) # 计算A的特征值和特征向量print("A的特征值: = ", w1) print("A的特征向量: = ", V1)B = np.array([[5,2,0], [2,5,0], [-3,4,6]]) w2, V2 = np.linalg.eig(…

Householder transformation + QL to calculate eigenValue and eigenVectors of Hertian Matrix, cpu code

化Hertinan matrix eigen problem into a real symmetric matrix eigen problem: 原理: 与matlab的结果进行对比: A[ ... ( 3.0 0.0*j) (-2.0 -2.0*j) (-0.9 -0.9*j) (-0.5 -0.5*j); ... (-2.0 2.0*j) ( 4.0 0.0*j) ( 1.0 1.0*j) (-0.7…

Truncated Power Method for Sparse Eigenvalue Problems

目录 算法k的选择\(x\)的初始化代码 抱歉,真的没怎么看懂,当然,估计和我现在没法静下心来好好看也有关系。 算法 想法非常非常简单吧,就是在原来幂法的基础上,每次迭代的时候再加个截断。当然,论文里给出了…

R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE)、计算矩阵数据的特征值(eigenvalue)

R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE)、计算矩阵数据的特征值(eigenvalue) 目录 R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE)、计算矩阵数据的特征值&#x…

Nonlinear Component Analysis as a Kernel Eigenvalue Problem

目录 引kernel PCA kernel 的选择性质一些问题代码 Scholkopf B, Smola A J, Muller K, et al. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998, 10(5): 1299-1319. 引 普通的PCA将下式进行特征分解(用论文的话讲就是对…

拉格朗日乘数法和KKT条件的直观解释

拉格朗日乘数法和KKT条件的直观解释 标签(空格分隔): 机器学习 linbin 2018-05-10 Abstract 在SVM的推导中,最优化问题是其中的核心,这里我们简单介绍下最优化问题,特别是带有约束的最优化问题&#xff…

[Math Algorithm] 拉格朗日乘数法

https://www.cnblogs.com/maybe2030/p/4946256.html 阅读目录 1. 拉格朗日乘数法的基本思想2. 数学实例3. 拉格朗日乘数法的基本形态4. 拉格朗日乘数法与KKT条件 拉格朗日乘数法(Lagrange Multiplier Method)之前听数学老师授课的时候就是一知半解&…