数据中台(七) 数据中台架构

article/2025/9/18 13:30:55

总体架构图

数据存储

计算引擎

数据汇聚

数据汇聚是把数据资源通过实时、批量的方式存储到数据中台。基本是按照数据的原始状态堆砌在一起的,是企业对过往所有IT信息化建设积累的成果的融合。

数据开发

数据开发是数据资产内容建设的主战场,是数据价值生产过程中核心环节。数据资源是原材料,数据资产是商品,数据开发就是商品生产流水线,通过这条流水线将数据资源转换成数据资产。

为了降低开发难度,提高开发效率,需要一个可视化的开发平台,主要包括以下产品功能:

数据体系

数据体系是在全域数据资源的基础上,进行标准定义及分层建模,数据体系建设最终呈现的结果是一套完整、规范、标准、准确的数据体系,可以方便支撑数据应用。

贴源数据层STG:数据资源通过批量同步和实时接入临时存储的数据层,只存储增量数据或部分全量数据。数据结构与源系统基本保持一致。仅做简单整合、非结构化数据结构化处理、增加审计列,不做深度清洗加工。

操作数据层ODS:对贴源数据层进行处理,存储全量数据。数据结构和贴源层保持一致。

统一数仓层DW:分为明细数据层DWD、汇总数据层DWS和公共维度层DIM。按照维度建模的方式进行数据组织,定义一致的维度和指标,各业务板块、业务域按照统一规范独立建设,通过清洗、规范化形成统一规范的标准业务数据体系。

明细数据层DWD:按照业务过程建立事实表,主要包括维度表的键、原子指标、少量冗余列和审计列。

汇总数据层DWS:把DWD层按照业务域进行聚合,形成粗粒度的事实表。主要包括维度表的键、派生指标、少量冗余列和审计列。

公共维度层DIM:按照实体对象或数据字典建立维度表,主要包括文本信息、离散数值和审计列。

标签数据层TDM:面向对象建模,对跨业务板块、跨数据域的特定对象数据进行整合,通过ID-Mapping把各个业务板块、各个业务过程中的同一对象的数据打通,形成对象的全域标签体系,方便深度分析、挖掘、应用。主要包括标签类目、标签和标签值。

数据应用层ADS:按照业务的需要从统一数仓层和标签数据层抽取数据,并面向业务的特殊需要加工业务特定数据,以满足业务及性能需求,向特定应用组装应用数据。

资产管理体系

数据资产是指由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等。在企业中,并非所有的数据都构成数据资产,数据资产是能够为企业产生价值的数据资源。 

数据资产管理是指规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理需要充分融合业务、技术和管理,以确保数据资产保值增值。

数据标准管理

数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准分为基础类数据标准和指标类数据标准。基础类数据标准是指业务流程中直接产生的,未经过加工和处理的基础业务信息。指标类数据标准是指具备统计意义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算而得到。

数据标准包括三个要素:标准类别、数据元、数据属性。

数据标准管理是指数据标准的制定和实施的一系列活动。数据标准管理的目标是通过统一的数据标准制定和发布,结合制度约束、系统控制等手段,实现数据的完整性、有效性、一致性、规范性、开放性和共享性管理,为数据资产管理活动提供规范依据。

数据模型管理

数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型从抽象层次上描述了数据的静态特征、动态行为和约束条件。

数据模型管理是指在信息系统设计时,参考业务模型,使用标准化用语、单词等数据要素来设计企业数据模型,并在信息系统建设和运行维护过程中,严格按照数据模型管理制度,审核和管理新建数据模型,数据模型的标准化管理和统一管控,有利于指导企业数据整合,提高信息系统数据质量。

数据模型是数据资产管理的基础,一个完整、可扩展、稳定的数据模型对于数据资产管理的成功起着重要的作用。通过数据模型管理可以清楚地表达企业内部各种业务主体之间的数据相关性,使不同部门的业务人员、应用开发人员和系统管理人员获得关于企业内部业务数据的统一完整视图。

数据质量管理

数据质量管理是通过计划、实施和控制活动,运用质量管理技术度量、评估、改进和保证数据的恰当使用。

元数据管理

元数据是有关一个企业所使用的物理数据、技术和业务流程、数据规则和约束以及数据的物理与逻辑结构的信息。

元数据管理是数据资产管理的重要基础,是为获得高质量的、整合的元数据而进行的规划、实施与控制行为。

数据安全管理

数据安全管理是指对数据设定安全等级,按照相应国家/组织相关法案及监督要求,通过评估数据安全风险、制定数据安全管理制度规范、进行数据安全分级分类,完善数据安全管理相关技术规范,保证数据被合法合规、安全地采集、传输、存储和使用。企业通过数据安全管理,规划、开发和执行安全政策与措施,提供适当的身份以确认、授权、访问与审计等功能。

数据安全管理的目标是建立完善的体系化的安全策略措施,全方位进行安全管控,通过多种手段确保数据资产在“存、管、用”等各个环节中的安全,做到“事前可管、事中可控、事后可查”。

数据的安全治理应贯穿于数据的整个生命周期

数据共享管理

数据共享管理主要是指开展数据共享和交换,实现数据内外部价值的一系列活动。

数据内部共享的关键步骤是打通企业内部各部门间的数据共享瓶颈,建立统一规范的数据标准与数据共享制度,数据外部流通和对外开放可以通过数据直接交易与提供数据分析信息的两种方式实现,将数据中符合共享开放层级的信息作为应用商品,以合规安全的形式完成共享交换或开放发布。

数据服务体系

数据服务作为数据中台实现资产服务化的核心能力,是连接前台业务和数据的桥梁,通过服务接口的方式对数据进行封装和开放,快速、灵活地满足上层应用的需求。

数据运营体系

数据运营体系是让数据中台得以健康、持续运转和产生持续价值的体系。数据中台是个复杂工程,数据的汇聚、开发、管理、服务都是要持续进行的工作,如果没有运营体系的保障,可能会导致后期的参与者无从下手,随着时间的推移,数据的质量、服务的效率业务持续下降,进而导致中台无法使用。

产品选择

确定中台架构后,进入产品选择阶段,数据中台主要包括以下产品:


http://chatgpt.dhexx.cn/article/1xRplRRR.shtml

相关文章

什么是中台?

文章目录 中台——为前台而生一、没有中台的时代——传统项目二、中台的出现背景(1)国外(最先)(2)国内(部分)A. 阿里巴巴B. 华为 三、什么是中台四、为什么要做中台五、前中后台三者…

详解什么是中台?

什么是中台 最近被老板折腾得够呛,我们老板听说最近中台的概念很火,让我们调研公司实习中台战略的可行性。刚开始并不理解什么是中台… 因此,写篇博客先简单介绍下什么是中台。 要理解中台,要先清楚传统项目架构的痛点在哪里 没有…

传统系统架构与中台架构的区别和联系

SOA架构思想 我们可以来看下SOA本身的定义,即: SOA是一种架构方法,将传统的单片式应用打破,分解为离散的、自治的业务服务,利用标准提升他们的互操作性,从而可以更好地共享、重用和组装,快速构…

中台不同于平台,那么到底啥是中台?

1、哪些不是中台,而是应该叫平台 做开发,有所谓的三层技术架构:前端展示层、中间逻辑层、后端数据层。我们现在讲的中台不在这个维度上。 做开发,还有所谓的技术中间件。一开始我们没有中间件的概念,只有操作系统、数据…

什么是数据中台

转载:https://mp.weixin.qq.com/s/nXI0nSSOneteIClA7dming 没有中台的时代 在传统IT企业,项目的物理结构是什么样的呢?无论项目内部的如何复杂,都可分为“前台”和“后台”这两部分。 什么是前台? 首先,这里所说的“…

到底什么是数据中台?

最近可能大家听到“数据中台”这个词越来越频繁了,有时候我跟一些朋友聊起来,也是都在说这个,但是一直不知道这到底是个什么。最近就看到这篇文章,觉得说的还挺好的,分享给大家看看,希望大家看完能对数据中…

什么是数据中台?

01数据中台的前世今生 在正式进入数据中台建设实践之前,我想花点时间先聊一聊大数据的发展史,这样更能理解数据中台诞生的原因。不管是学习一项知识,还是讨论一个问题,最好的方法都不应该是一头扎进细节里,而是应该先…

什么是中台系统?

查看百度指数,“中台”两字的搜索量从2019年5月21日后开始陡增。 这天发生了什么?这天腾讯召开了“腾讯全球数字生态大会”,在会上,多位腾讯高管提到”开放中台能力,拥抱产品互联网“。至此,“中台”2个字开…

中台系统是什么

中台系统是将企业进行数字化的一种工程。企业通过进行数字化改造的工程建立一条数字化的中台系统,这样可以适应企业的多元化发展。另外也会更加容易与互联网进行衔接。 中台系统是将企业进行数字化的一种工程。企业通过进行数字化改造的工程建立一条数字化的中台系…

前后端分离开发具体实现

一. 前后端分离开发具体实现 1 Visual Studio Code开发工具的安装 双击安装,即可成功 3.1.2 Visual Studio Code开发工具的配置 3.1.2.1、设置中文环境 设置中文环境 安装完毕后,vscode全部都是英文版本的,需要把vscode环境调整为中文…

nginx实现前后端分离

文章目录 nginx实现前后端分离1、安装nginx2、配置conf2.1、设置前端代码位置2.2、配置后台请求拦截2.3、完整配置 nginx实现前后端分离 1、安装nginx 参考 https://blog.csdn.net/mybook201314/article/details/73604640 2、配置conf 路径:nginx/conf/nginx.co…

前后端分离和不分离图解

原理(JSON字符串作为前后端之间信息传递载体) 前后端进行信息传递前都要先将数据转化为json字符串形式才可以进行数据传输。 例如:前端向后端传递对象参数时需要将对象转为json形式,而后端return数据时,也要将数据转化…

使用IIS部署若依前后端分离项目

本章教程,介绍一下如何使用IIS部署若依前后端分离项目。 目录 一、准备需要部署的包 二、IIS服务器配置流程

java前后端分离怎么测试,前后端分离如何提高开发测试效率

前后端分离如何提高开发测试效率 三丰 soft张三丰 前后端分离项目 开发步骤: 项目是基于前后端分离的架构进行开发,前后端分离架构总体上包括前端和服务端,通常是多人协作并行开发,对于不同职位的人来说,有不同的侧重点。 1、需求分析 梳理用户的需求,分析业务流程 2、接…

前后端分离的好处知多少?

编者按:熟悉软件开发的小伙伴应该都知道,软件开发分前端和后端,那么前后端分不分离,这直接影响到开发的难度和复杂程度,跟小编一起来了解一下前后端分离让人意想不到的好处吧。 1、前后端的概念 在了解前后端分离之前…

前后端分离的好处是什么?

WEB 前后端分离三个最大的优点在于: 1:最大的好处就是前端js可以做很大部分的数据处理工作,对服务器的压力减小到最小2:后台错误不会直接反映到前台,错误接秒较为友好3:由于后台是很难去探知前台页面的分布…

消息队列面试相关

(1)为什么使用消息队列啊? 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么 面试官问你这个问题,期望的一个回答是说,你们公司有个什…

面试题:为什么使用消息队列?消息队列有什么优缺点?

目录 1. 面试题 2. 面试官心理分析 3. 面试题剖析 3.1. 为什么使用消息队列 3.2. 消息队列有什么优缺点 3.3. Kafka、ActiveMQ、RabbitMQ、RocketMQ 有什么优缺点? 1. 面试题 为什么使用消息队列?消息队列有什么优点和缺点?Kafka、Act…

消息中间件面试题

消息中间件 (原创不易,你们对阿超的赞就是阿超持续更新的动力!)(以免丢失,建议收藏,阿超持续更新中......) (--------------------------------------------------------…

《消息队列》常问面试题

1、为什么要使用消息队列?(消息队列的应用场景) 这个问题主要考察为什么使用消息队列?在项目中为了解决什么问题? 消息队列的本质 消息队列是一种“先进先出”的数据结构 常见应用场景:解耦、异步、削峰…