【云计算与大数据计算】大数据物理、集成、安全架构及阿里云飞天系统架构讲解(超详细)

article/2025/8/31 23:28:14

一、物理架构

物理架构 - 企业大数据系统的各层次系统最终要部署到主机节点中,这些节点通过网络连接成 为一个整体,为企业的大数据应用提供物理支撑 ,企业大数据系统由多个逻辑层组成,多个逻辑层可以映射到一个物理节点上,也可以映射到多个物理节点上

在映射时需要考虑三个方面的问题:一是是否容易识别,二是是否足够集约,三是是否能够同构

二、集成架构

集成架构 - 企业大数据系统由多个系统集成而成,每个系统都提供了多种协议和接口, 以便企业大数据系统的内部系统间集成和外部系统与大数据系统的集成

企业大数据系统的集成可以分为总体集成和专项集成,总体集成是指各组成系统间的集成,通过总体集成可以构成高校,可靠,安全运行的企业大数据系统,若企业大数据系统之外的某个应用系统或大数据系统之内的某个应用系统只想与存储系统,调度系统等进行集成,那么可通过调用这些系统开放的接口来实现,这种集成方式就是专项集成

三、安全架构

安全架构 - 由于企业大数据系统的数据资源和计算资源广泛地分布在多个节点上,所以用户的 身份、权限等安全,数据资源的存储、传输、访问等安全,以及计算资源的访问、监控、调整、恢复等安全,都是企业大数据系统在进行安全架构设计时需要考虑的问题

一般来讲,企业大数据的安全架构由针对三层的安全设计构成,这三层分别是用户层,应用层和数据层,针对每一层的关键行为加入安全因素的设计,以确保系统的整体安全

四、阿里云飞天系统体系架构

飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计 算操作系统  

它可以将遍布全球的百万级服务器连成一台超级计算机、以在线公共服务的方式为社会提供计算能力  

7年过去,飞天已经为全球200多个国家和地区的创新创业企业、政府、机构等提供服务

阿里云飞天整体架构 - 飞天平台的体系架构如图所示,整个飞天平台包括飞天内核和飞天开发服务两大部分

 飞天管理着互联网规模的基础设施。其最底层是遍布全球的几十个数据中心和数百个PoP节点

飞天内核跑在每个数据中心里面,它负责统一管理数据中心内的通用服务器集 群,调度集群的计算、存储资源,支撑分布式应用的部署和执行

安全管理根植在飞天内核最底层。飞天内核提供的授权机制能够有效实现“最小权限原则 (principle of least privilege)”,同时还建立了自主可控的全栈安全体系

监控报警诊断是飞天内核最基本的能力之一。飞天内核对上层应用提供了非常详细的、无间断的监控数据和系统事件采集

在基础公共模块之上有两个最核心的服务,一个叫盘古,一个叫伏羲

天基是飞天的自动化运维服务,负责飞天各个子系统的部署、升级、扩容以及故障迁移 

阿里云飞天平台内核可以分成以下几个部分

分布式系统底层服务 - 其提供分布式环境下所需要的分布式协调服务、远程过程调用服务、安全管理、分布式资源调度等功能

盘古分布式文件系统 - 盘古(Pangu)是一个分布式文件系统, 盘古系统 的设计目标是将大量通用机器的存储资源聚合在一起,为用户提供大规模、高可靠、高可用、高吞吐量和可扩展的存储服务

伏羲任务调度系统 - 该系统为集群中的任务提供调度服务,同时支持强调响应速度的在线 服务(Online Service)和强调处理数据吞吐量的离线任务(Batch Processing Job)

集群监控和部署 - 神农(Shennong )是飞天平台内核中负责信息收集 、监控和诊断的模块,大禹 (Dayu)是飞天内核中负责提供配置管理和部署的模块

飞天开放服务 

包括弹性计算 (ECS)、阿里云对象存储(OSS)、表格存储服 务(Table Store)、关系型数据库服务(RDS)、流式计算服务 (Stream Compute)和大数据计算服务(MaxCompute)等

弹性计算 (ECS) - 云服务器ECS(Elastic Compute Service)是一种云计算服务 , 它的管理方式比物理服务器更加简单、高效

 阿里云对象存储(OSS) - 阿里云对象存储 (Object Storage Service, OSS)是阿里云对外提供的海量、安全、低成本、高可靠的云存储服务

表格存储 (Table Store) -  它是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提供海量结构化数据的存储和实时访问

大数据计算服务(MaxCompute) - 大数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案

阿里云飞天 OpenStack 和 Hadoop 的不同

OpenStack和 Hadoop是软件,它们并没有解决客户的CAPEX 投入问题、运维人员投入问题,需要部署到自有的硬件上,一般只用于单个企业的内部环境

 飞天上面提供了基于 Hadoop、EMR、Mongo等开源软件的托管服务,这是飞天开放 能力的体现

阿里云飞天与 VMware 、华为 FusionSphere 的不同

虚拟化不等于云计算,云的实时在线、海量弹性、多租户隔离、专业运维都是传统虚拟化软件所欠缺的

 VMware的三大件主要解决了计算的效率问题,但是没有解决计算的规模问题 

华为的 FusionSphere 其实是基于开源软件进行定制并适配华为硬件的软件系统,飞天内核在规模、性能、稳定性和通用性上都超越了 FusionSphere

五、主流大数据厂商

Cloudera

Cloudera是一家专业从事基于Apache Hadoop的数据管理软 件销售和服务的公司 , 它发布的实时查询开源项目Impala比基于 MapReduce的HiveSQL的查询速度提升了3~90 倍

 Hortonworks

Hortonworks的开放式互联平台帮助企业管理所拥有的数据(动态数据以及静态 数据),为用户组织启用可操作情报。

 

Amazon 

Amazon 的 AWS 本身就是最完整的大数据平台, Amazon Web Services 提供了一系列广泛的服务,可以快速 、轻松地构建和部署大数据分析应用程序

 

Google 

Google提出的 MapReduce计算框架在很多大数据领域得到了非常广泛的应用

 

 微软 

微软推出的商业数据分析系统 Microsoft Analytics Platform System 能够通过其扩充的大规模平行处理整合式系统支持混合格式的数据仓库,借此适应数据仓库环境不断发展的需求

 

阿里云数加平台

数加是阿里云为企业大数据的实施提供的一套完整的一站式大数据解决方案,

数加平台由大数据计算服务(MaxCompute)、分析型数据库(Analytic DB)、流计算 (StreamCompute)共同组成了底层强大的计算引擎, 速度更快, 成本更低  

 

创作不易 觉得有帮助请点赞关注收藏~~~ 


http://chatgpt.dhexx.cn/article/llav4XfL.shtml

相关文章

阿里云飞天系统的技术架构

阿里云飞天系统的技术架构 阿里云有以下五大优势: 中国万网,提供虚拟主机托管的服务,而且还提供域名等服务,其客户群非常庞大; 淘宝、阿里巴巴(内部称:B2B)、支付宝等其他子公司有大…

阿里飞天云平台架构简介

一. 简介 飞天是由阿里云开发的一个大规模分布式计算系统,其中包括飞天内核和飞天开放服务。 飞天内核负责管理数据中心Linux集群的物理资源,控制分布式程序运行, 隐藏下层故障恢复和数据冗余等细节,有效提供弹性计算和负载均衡…

程序人生 - 猫咪冷知识!猫咪“呼噜呼噜”声究竟代表什么?

猫咪,包括所有的猫科动物,它们的习性都非常相似。猫咪有一个习惯,就是总是会时不时地就发出“呼噜呼噜”的声音。这种声音的频率和音调其实蛮有催眠效果的,反正八酱听到猫咪在身边发出这样的声音的时候,就很容易安眠了…

[鼠标指针][仅需1步]宝藏的猫咪Cat老师[win10/11][点击看更多免费]......

win10/11好看的免费鼠标指针样式... 1.鼠标指针样式介绍****** 推荐猫咪老师 ******* 2.安装使用3.来源 1.鼠标指针样式介绍 ****** 推荐猫咪老师 ******* Janguru CursorsJanguru Cursors X2Win 11 Cursors LightWin 11 Cursors DarkOverwatch PointerOS X El Capitan v4 MIN…

【python】采集可爱猫咪数据并作可视化

前言 嗨喽~大家好呀,这里是魔王呐 ! 环境介绍: python 3.6 pycharm 爬虫部分使用模块: csv requests >>> pip install requests parsel 如何安装python第三方模块: win R 输入 cmd 点击确定, 输入安装命令 pip install 模…

猫咪单独为某个网站添加Proxy

猫咪将overleaf网站添加到猫咪名单中,猫咪单独为某个网站添加猫咪 坑。暂时没有找到解决方案。 我想实现的效果是,打开一个网站,如果网站比较卡,就把这个网站添加到直联列表中。停止对它的猫咪。 方案1: 1、修改猫…

最近非常火的猫咪回收站操作总结来了~

具体步骤: ①下载喵咪图标,百度网盘: 链接:https://pan.baidu.com/s/1noZvCVeyj3Zs4G9XaK69BQ?pwdu1g5 提取码:u1g5 ②开始-打开电脑设置-个性化-主题-桌面图标设置-更改回收站图标-结束 注意事项:改图标…

Java新特性(2):Java 10以后

您好,我是湘王,这是我的CSDN博客,欢迎您来,欢迎您再来~ 虽然到目前为止Java的版本更新还没有什么惊天动地的改变,但总是会冒出一些有趣的小玩意。前面列举了Java9和Java10的一些特色,现在接着来…

【JavaSE】Java9Java10Java11新特性(687~717)

687.复习:动态代理 688.复习:Lambda表达式 689.复习:函数式接口 690.复习:方法引用与构造器引用 691.复习:Stream API 692.复习:Optional类的使用 693.jdk版本更新说明 JDK 9 的发布 经过4次跳票&#x…

Java-13

学习来源:日撸 Java 三百行(41-50天,查找与排序)_闵帆的博客-CSDN博客 42 哈希表 42.1 使用 (最简单的) 除数取余法获得数据存放地址 (下标)。 42.2 使用 (最简单的) 顺移位置法解决冲突。 代码: /***************…

Win10下安装Java JDK12

前言:这是在csdn上写的第一篇博客,本以为第一篇会是超厉害的技术博客,没想到在重装系统,重新配置java环境的时候踩了这么大一坑,而且更重要的是,搜了那么多篇博客内容都跟假的一样,要么是抄的&a…

Java:Windows 10下载和配置JDK

文章目录 0. 介绍1. 下载2. 安装2.1. “.zip” 安装2.2. “.exe” 安装 3. 配置4. 测试4. 问答 0. 介绍 JDK,全称是 “Java Development Kit”,Java 开发工具包,是一个开发 Java 必不可少的程序或资源(目前可替换的有&#xff1a…

Java 10 正式发布了

3 月 20 日,Oracle 宣布 Java 10 正式发布。官方已提供下载:http://www.oracle.com/technetwork/java/javase/downloads/index.html 。 在 Java 9 之后,Java 采用了基于时间发布的策略,每 6 个月一个版本。这是采用新的发布策略之…

Java-1.10

题目描述: 假设一个人45分30秒跑了14千米,编写程序,显示他以每小时多少英里为单位的平均速度。 (1英里约等于1.6千米) 代码: public class Speed {public static void main(String[] args){double speed…

关于Java(10)

关于Java(10)第十四章-I/O输入输出 1. Java中流的分类有哪些? 流从流动方向上看:一般分为输入流和输出流 输入流:如System.in是一个InputStream类型输入流 输出流:如System.out 是一个PrintStream类型输出流从读取类…

java 01~~10

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言Day01——从“Hello World”开始吧Day02——基本算术操作练习:四则运算运行结果 Day03——基本if语句练习:求绝对值运行结果 小结 Day04…

Java-10

学习来源:日撸 Java 三百行(31-40天,图)_闵帆的博客-CSDN博客 33 图的广度优先遍历 33.1与树的广度优先遍历类似。 33.2为每个核心方法写一个测试方法。这叫单元测试。 代码: /********************** Breadth fi…

Java 10 新特性解读

前言  2018年3月21日,Oracle官方宣布Java10正式发布。  需要注意的是 Java 9 和 Java 10 都不是 LTS (Long-Term-Support) 版本。和过去的 Java 大版本升级不同,这两个只有半年左右的开发和维护期。而未 来的 Java 11,也就是 18.9 LTS&am…

【小家java】java10新特性(简述十大新特性) 小步迭代

相关阅读 【小家java】java5新特性(简述十大新特性) 重要一跃 【小家java】java6新特性(简述十大新特性) 鸡肋升级 【小家java】java7新特性(简述八大新特性) 不温不火 【小家java】java8新特性&#xff0…

IP地址与端口Port

IP地址 IP地址:InetAddress 唯一定位一台网络上的计算机127.0.0.1 (本机localhost) IP地址的分类 IPv4:网际协议版本4(英语:InternetProtocolversion4,IPv4),又称互联网…