Ranger架构

article/2025/9/19 5:15:27

一、Ranger介绍

随着大数据技术生态不断发展壮大,为了抢占企业级市场,各厂商都迭代出自己的一套访问控制体系,不管是老牌系统(比如HDFS、HBase),还是生态新贵(比如Kafka、Alluxio),ACL(Access Control List)支持都是Roadmap里被关注最高的issue之一。

在访问控制体系方面,Hadoop两大厂Cloudera和Hortonworks先后发起标准化运动,分别开源了Sentry和Ranger,在centralized访问控制领域展开新一轮的角逐。Apache Ranger能够监控和管理整个Hadoop平台的综合数据安全。Ranger在0.4版本的时候被Hortonworks加入到其Hadoop发行版HDP里,目前作为Apache Top Level Project(顶级项目)。

Ranger主要提供如下特性:

  • 基于策略(Policy-based)的访问权限模型。
  • 通用的策略同步与决策逻辑,方便控制插件的扩展接入。
  • 内置常见系统(如HDFS、YARN、Hive、HBase等12个)的控制插件,且可扩展。
  • 内置基于LDAP、File、Unix的用户同步机制,且可扩展。
  • 统一的中心化的管理界面,包括策略管理、审计查看、插件管理等。

二、Ranger的权限模型

访问权限无非是定义了“用户-资源-权限”这三者间的关系,Ranger基于策略来抽象这种关系,进而延伸出自己的权限模型。“用户-资源-权限”的含义详解:

含义
用户由User或Group来表达,User代表访问资源的用户,Group代表用户所属的用户组。
资源由Resource来表达,不同组件对应的业务资源是不一样的,比如HDFS的File Path,HBase的Table。
权限由(AllowACL, DenyACL)来表达,类似白名单和黑名单机制,AllowACL用来描述允许访问的情况,DenyACL用来描述拒绝访问的情况。不同的组件对应的权限也是不一样的。

Ranger中的访问权限模型可以用下面的表达式来描述,从而抽象出了“用户-资源-权限”这三者间的关系:

Service = List<Policy>
Policy =  List<Resource> + AllowACL + DenyACL
AllowACL = List<AccessItem> allow + List<AccssItem> allowException
DenyACL = List<AccessItem> deny + List<AccssItem> denyException
AccessItem = List<User/Group> + List<AccessType>

下表列出了Ranger支持的所有系统的模型实体枚举值:

ServiceResourceAccess Type
HDFSPathRead,Write,Execute
HBaseTable,Column-family,ColumnRead,Write,Create,Admin
HiveDatabase,Table,UDF,Column,URLSelect,Update,Create,Drop,Alter,Index,Lock,Write,Read,ALL
SqoopConnector,Link,JobREAD,WRITE
StormTopologySubmit Topology,File Upload,File Download,Kill Topology,Rebalance,Activate,Deactivate,Get Topology Conf, Get Topology,Get User Topology,Get Topology Info,Upload New Credential
SolrCollectionQuery,Update,Others,Solr Admin
KafkaTopicPublish,Consume,Configure,Describe,Create,Delete,Kafka Admin
KnoxTopology,ServiceAllow
KylinProjectQUERY,OPERATION,MANAGEMENT,ADMIN
YARNQueuesubmit-app,admin-queue
AtlasType Catagory,Type Name,Entity Type,Entity Classification,Entity ID,Atlas ServiceCreate Type,UpdateType,Delete Type,Read Entity,Create Entity,Update Entity,Delete Entity,Read Classification,Add Classification,Update Classification,Remove Classification,Admin Export,Admin Import
NifiNiFi ResourceRead,Write

关于权限这个部分,为什么AllowACL和DenyACL需要分别对应两组AccessItem?这是由具体使用场景引出的设计:

以AllowACL为例,假定我们要将资源授权给一个用户组Group1,但是用户组里某个用户User1除外,这时只要增加一条包含Group1的AccessItem到AllowACL_allow,同时增加一条包含User1的AccessItem到AllowACL_allowException即可。类似的原因可反推到DenyACL。

一条Policy有四组AccessItem:allow、allowException、deny、denyException,优先级由高到低依次是:

denyException > deny > allowException > allow

访问决策树的流程如下:
在这里插入图片描述
总结一下就是:黑名单优先级高于白名单,黑名单排除优先级高于黑名单,白名单排除优先级高于白名单。

决策下放:如果没有policy能决策访问,一般情况是认为没有权限拒绝访问,然而Ranger还可以选择将决策下放给系统自身的访问控制层,比如HDFS的ACL,这和每个Ranger插件以及应用系统自己的实现有关。

三、Ranger的系统插件

系统插件主要负责三件事:

  • 定期从RangerAdmin拉取策略
  • 根据策略执行访问决策树
  • 实时记录访问审计

以上执行逻辑是通用的,可由所有系统插件引用,因此剩下的问题是如何把这些逻辑嵌入到各个系统的访问决策流程中去。

多数的系统在实现时都有考虑功能扩展性的问题,一般会为核心的模块暴露出可扩展的接口,访问控制模块也不例外。Ranger通过实现访问控制接口,将自己的逻辑嵌入各个系统。下表列出了Ranger插件对所有支持系统的扩展接口:

ServiceExtensible InterfaceRanger Implement Class
HDFSorg.apache.hadoop.hdfs.server.namenode.INodeAttributeProviderorg.apache.ranger.authorization.hadoop.RangerHdfsAuthorizer
HBaseorg.apache.hadoop.hbase.protobuf.generated.AccessControlProtos.AccessControlService.Interfaceorg.apache.ranger.authorization.hbase.RangerAuthorizationCoprocessor
Hiveorg.apache.hadoop.hive.ql.security.authorization.plugin.HiveAuthorizerFactoryorg.apache.ranger.authorization.hive.authorizer.RangerHiveAuthorizerFactory
Sqooporg.apache.sqoop.security.AuthorizationValidatororg.apache.ranger.authorization.sqoop.authorizer.RangerSqoopAuthorizer
Stormorg.apache.storm.security.auth.IAuthorizerorg.apache.ranger.authorization.storm.authorizer.RangerStormAuthorizer
Solrorg.apache.solr.security.AuthorizationPluginorg.apache.ranger.authorization.solr.authorizer.RangerSolrAuthorizer
Kafkakafka.security.auth.Authorizerorg.apache.ranger.authorization.kafka.authorizer.RangerKafkaAuthorizer
Knoxorg.apache.knox.gateway.deploy.ProviderDeploymentContributorBaseorg.apache.ranger.authorization.knox.deploy.RangerPDPKnoxDeploymentContributor
Kylinorg.apache.kylin.rest.security.ExternalAclProviderorg.apache.ranger.authorization.kylin.authorizer.RangerKylinAuthorizer
YARNorg.apache.hadoop.yarn.security.YarnAuthorizationProviderorg.apache.ranger.authorization.yarn.authorizer.RangerYarnAuthorizer
Atlasorg.apache.atlas.authorize.AtlasAuthorizerorg.apache.ranger.authorization.atlas.authorizer.RangerAtlasAuthorizer
NifiNANA

各系统插件安装节点:

ServiceInstall Node
HDFSName Node
HBaseMaster,Regional Server
HiveHiveServer2
SqoopALL/Stand-alone
StormALL/Cluster
SolrALL/Cluster
KafkaALL/Cluster
KnoxKnox gateway
KylinALL/Stand-alone
YARNResource Manager
AtlasALL/Stand-alone
NifiNA

系统插件拉取策略:主动到RangerAdmin拉取策略,而非RangerAdmin把策略下发给各个插件。策略如有变化,拉取新的策略更新内存中鉴权引擎,同时保存一份备份文件在本地。RangerAdmin挂掉后,组件也重启时,可以使用本地的备份继续鉴权。删除RangerAdmin上面的service,会使插件鉴权不可用。

系统插件性能考虑:关闭策略中的audit审计日志。插件鉴权引擎定时对策略排序,优先匹配高命中的策略。

权限管理流程:(以Sqoop2插件的权限控制为例)

1、RangerAdmin创建服务Service;
2、RangerAdmin创建策略Policy;
3、SqoopPlugin插件拉取策略;
4、SqoopPlugin对用户访问请求鉴权:show connector;
5、SqoopPlugin插件记录审计日志Audit;
6、RangerAdmin查看审计日志Audit。

完毕。


http://chatgpt.dhexx.cn/article/rtDCbCku.shtml

相关文章

大数据技术栈概貌

一、大数据技术栈概貌 pig&#xff1a;要使用 Apache Pig 分析数据&#xff0c;程序员需要使用Pig Latin语言编写脚本。所有这些脚本都在内部转换为Map和Reduce任务。sqoop 是 apache 旗下一款“Hadoop 和关系数据库服务器之间传送数据”的工具。导入数据&#xff1a;MySQL&…

一节课轻松通关 Spark

大数据跟我学系列文章007-三节课轻松通关 Spark &#xff08;一&#xff09; 文章目录 大数据跟我学系列文章007-三节课轻松通关 Spark &#xff08;一&#xff09;前言第01讲&#xff1a; MapReduce&#xff1a;计算框架和编程模型第02讲&#xff1a;Hadoop&#xff1a;集群的…

基于深度强化学习的连接查询优化

Krishnan, S., et al. (2018). "Learning to optimize join queries with deep reinforcement learning." 如何优化 SQL 连接是数据库社区数十年来一直在研究的一个大问题。伯克利 RiseLab 公布的一项研究表明&#xff0c;深度强化学习可以被成功地应用在优化 SQL 连…

Flink流处理框架总结

Flink流处理框架 第一部分 Flink 概述第 1 节 什么是 Flink第 2 节 Flink 特点第 2 节 Flink 应用场景第 4 节 Flink 核心组成及生态发展第 5 节 Flink 处理模型&#xff1a;流处理与批处理第 6 节 流处理引擎的技术选型 第二部分 Flink快速应用第 1 节 单词统计案例&#xff0…

Presto(Trino)动态过滤与优化器

Presto 系列文章目录- 动态过滤与谓词下推 文章目录 Presto 系列文章目录- 动态过滤与谓词下推trino性能提升新特性Dynamic partition pruning动态分区裁剪设计注意事项执行未来的工作 Hive connector延迟执行动态过滤器 动态过滤分析和确认动态过滤器收集阈值维度表布局局限性…

AI 应用的全流程存储加速方案技术解析和实践分享

AI 应用对存储系统的挑战是全面的&#xff0c;从离应用最近的数据计算如何加速&#xff0c;到离应用最远的数据存储如何管理&#xff0c;到数据存储和数据计算之间如何高效流通&#xff0c;再到不同应用之间的资源调度如何协调 …… 这其中每一个环节的低效&#xff0c;都有可能…

flink部署-1.13

1. 版本说明 本文档内容基于 flink-1.13.x&#xff0c;其他版本的整理&#xff0c;请查看本人博客的 flink 专栏其他文章。 2. 概述 Flink 是一种通用性框架&#xff0c;支持多种不同的部署方式。 本章简要介绍 Flink 集群的组成部分、用途和可用实现。如果你只是想在本地启…

Spark2.1.0——存储体系概述

本书在5.7节曾介绍过存储体系的创建,那时只为帮助读者了解SparkEnv,现在是时候对Spark的存储体系进行详细的分析了。简单来讲,Spark存储体系是各个Driver、Executor实例中的BlockManager所组成的。但是从一个整体出发,把各个节点的BlockManager看成存储体系的一部分,那么存…

探秘百度数据工厂Pingo的多存储后端数据联合查询技术

作者介绍&#xff1a;张志宏&#xff0c;2013年加入百度大数据部&#xff0c;曾作为核心成员参与百度大数据平台的搭建。目前是百度数据工厂Pingo核心团队的技术负责人。 Pingo是来自百度的离线大数据集成开发平台&#xff0c;使用Spark作为计算引擎&#xff0c;深度整合了资源…

Tachyon与Ignite系统对比

1. Alluxio(原Tachyon)内存文件系统 1.1 系统概述 Alluxio&#xff08;原Tachyon&#xff09;是以内存为中心(memory-centric)的虚拟的分布式存储系统&#xff0c;拥有高性能和容错能力&#xff0c;能够为集群框架&#xff08;如Spark、MapReduce&#xff09;提供可靠的内存级…

百度案例:利用Alluxio实现安全的即插即用分布式文件系统

全文共3361字,预计学习时长7分钟 本文介绍了百度如何依靠开源项目Alluxio,在一个企业大数据分析解决项目Pingo中创建了一个安全、模块化和可扩展的分布式文件系统服务。 在这篇文章中,你将学习如何依靠Alluxio来实现一个统一的分布式文件系统服务,以及如何在Alluxio之上添…

如何通过API调用alluxio 文件系统

如何通过API调用alluxio 文件系统 一般来说&#xff0c;不论从spark&#xff0c;hfds等等大数据分布式框架&#xff0c;甚至使用公有云api&#xff0c;来说&#xff0c;与集群进行交互不外乎以下这些套路&#xff1a; 设置configuration&#xff08;有很重要的主节点host&…

office产品密钥如何找回

明明自己有正版office产品密钥却因为时间太久种种原因找不到了&#xff0c;登录微软账户查看信息也没有&#xff0c;怎么办&#xff1f;&#xff1f; 不要着急&#xff0c;只要你还记得你当时激活office的微软账号和密码&#xff0c;可以登录微软账户&#xff0c;follow me&am…

qq恢复官方网站服务器繁忙,qq恢复官方网站

删除好友&#xff0c;又后悔了&#xff01;&#xff01;&#xff1f;&#xff1f; 想把好友找回来&#xff1f; 世上没有后悔药,但是系统是还是人性化的&#xff0c; 所以&#xff0c;QQ官方给广大用户提供了好友找回功能。登录qq以恢复官方网络以恢复朋友操作。 在qq恢复官方网…

手机计算机怎么恢复出厂设置密码,如何找回手机锁屏密码?

原标题&#xff1a;如何找回手机锁屏密码&#xff1f; 世界上最遥远的距离不是我站在你面前你却不知道我爱你&#xff0c;而是手机明明在手上偏偏忘了锁屏密码&#xff01; 我们总是会有犯傻的时候&#xff0c;比如突然想到一个数字觉得还不错&#xff0c;于是想着给手机改个密…

Vue + element + Springboot 通过邮箱找回密码

Vue element Springboot 通过邮箱找回密码 需求分析一、导入二、流程分析 详细设计一、前端界面设计1. 登录界面2. 重置密码界面 二、后端代码设计1. JavaMail配置2. QQ邮箱开启STMP授权3. 配置applicaiton.yml文件4. 新建文件夹5. 邮件配置&#xff1a;6. User相关类&#xf…

5年前带留言的公众号还可以找回,让我来教你该怎么做

今天注定是很神奇的一天&#xff0c;因为今天我居然找回了5年前注册的公众号&#xff0c;一个带留言功能的公众号。 了解公众号的人可能都知道&#xff0c;腾讯在2018年3月宣布暂停新注册公众号的留言功能&#xff0c;这之后注册的公众号都不具备留言功能。 这成了很多号主运营…

怎么找回丢失的手机?

手机定位这个功能&#xff0c;每个智能手机都必备的。但是如果手机不小心丢失了&#xff0c;能通过手机本身懂的定位功能&#xff0c;找回自己的手机吗&#xff1f;其实大部分智能手机&#xff0c;都能通过定位功能找回手机的。但是使用查找手机定位必须已打开查找手机功能且丢…

Word文档恢复,2大方案教你找回没有保存或者被删除的数据

我们经常会使用到Word文档来记录各种东西&#xff0c;有时候Word文档输入数据到一半&#xff0c;就不小心关闭&#xff0c;却没有保存。或者在电脑清理的时候&#xff0c;不小心把重要的Word文档数据删除了&#xff0c;又或者文档已经删除了一段时间。 Word文档能恢复吗&#…

计算机用户删除文件找回,电脑上删除的文件如何找回 业内人士分享小技巧

电脑上删除的文件如何找回?众所周知&#xff0c;使用数据恢复软件可以找回被删除的文件&#xff0c;但是并非所有删除的文件都可以顺利找回。想知道如何最大限度地确保完整恢复删除的文件吗&#xff1f;小编接下来就将为大家分享关于如何完整找回误删除文件的方法。 如何找回被…