第四代数据平台技术:数据云平台

article/2025/9/24 10:23:17

当前社会已经进入一个企业数据高速膨胀的时代,近几年,每年全球的数据规模平均以40%的速度增长。在云计算、大数据技术并驾齐驱发展几年后,两个技术逐渐融合,数据平台的技术在云计算的助力下,能够支持更复杂的业务发展需求。本文就介绍一下基于云原生架构的第四代数据平台技术:数据云平台。
数据平台技术的发展从80年代开始,最早是小型机支持的ORACLE,DB2, 到2000年前后达到技术高峰的大规模并行处理MPP技术的一体机,代表有Greenplum, Teradata; 2000年以后,出现了Hadoop技术为基础的cloudera, Spark。如今,基于云原生架构的第四代数据云平台技术已经逐渐成为主流技术。数据云平台技术的典型代表国外是2020年上市的snowflake公司, 国内是北京偶数科技有限公司。
本文就数据云平台的趋势和特点做简单分享。
(1)数据平台的发展趋势;
数据平台发展趋势

(2)数据架构的发展演变
传统数据仓库解决了企业结构化数据的管理和应用需求,数据湖引入了非结构化数据做格式化处理,并继续通过传统数据仓库架构提供服务。
传统数仓架构数据湖架构

数据湖的架构有2个显著的缺点:(1)多份数据,浪费存储空间;(2)数据传输可能出现数据质量问题,导致业务受影响。
数据云平台架构的出现,解决了这些问题。在统一的云平台基础架构基础上,通过计算和存储分离的架构,实现数据管理和服务。
数据云平台架构

(3)数据云平台和数据中台有哪些区别?
在几年前阿里提出中台概念,陆续出现了数据中台,业务中台,算法中台等等。简单来讲,中台就是将底层的资源通过软件管理以服务的方式提供给业务部门使用。
数据中台从技术角度看是一个业务范畴的名词,数据中台的服务场景涉及到云服务的一些基本特性:服务封装,服务目录,自助服务等。通过资源管理工具将底层资源封装成不同类型不同级别的服务,并通过统一的服务目录为用户提供自助服务,业务部门可以自助的从服务目录中选择自己需要的服务。但是数据中台的底层还是需要数据平台技术的支撑。如果数据平台技术有局限性,例如跑批的性能无法满足业务需求,那么数据中台的服务能力也就无法实现对业务的很好支撑。
数据云平台从技术角度看是数据平台演变过程中最新的基于云原生技术架构的解决方案。去年在美国上市的snowflake也是基于分布式云数据库的技术,并且提出了datacloud数据云的说法。
在国内,数据云的代表公司是北京偶数科技有限公司,公司长期致力于云原生的高性能数据仓库产品(OUSHUDB)的研究开发,目前已经成为国内排名前列的国产自主可控技术的大数据公司,在人工智能和图数据库技术方面也有深入研究。2020年下半年偶数科技公司和国内爱分析咨询公司联合编著了《数据平台技术发展白皮书》,在数据平台发展趋势分析中首次提出“数据云平台”的名词解释,对数据云平台从各个角度做了详细的定义,包括技术架构,技术特点,技术优势,业务场景等,为国内各企事业单位和公司在大数据平台技术选型提供了有价值的参考和指引。偶数科技自身也推出了数据云的整体解决方案,并在国内保险,运营商,公安,制造等行业进行了方案的落地实施。
2021年3月,星环科技在其产品发布会上宣布将于5月推出TDC(星环数据云)产品,并且也提出数据云技术的产品是其未来的发展目标。在偶数科技作为数据云领军企业的推动下,越来越多的大数据企业正在推出数据云的解决方案。
(4)数据云平台的技术特点和优势
数据云平台技术特点和优势

(5)数据云平台由哪些元素组成?
“数据云平台”是新一代的数据基础设施,它能够依托云原生特性、计算存储分离架构、强ACID特性、强SQL标准支持、Hadoop原生支持、高性能并行执行能力等一系列底层技术的变革,实现高弹性、强扩展性、强共享性、强兼容性、强复杂查询能力、自动化机器学习支持等上层技术能力的变革,最终帮助企业有效应对大规模、强敏态、高时效、智能化等愈发明显的数字化趋势。
在这里插入图片描述数据云平台的构成主要由云原生数据仓库、数据管理平台、自动化机器学习平台构成整体解决方案。以偶数科技的数据云平台解决方案来说,主要由OUSHUDB云原生数据仓库,LAVA数据管理平台和Littleboy自动化机器学习平台三大产品组成。
数据云平台解决方案(6)数据云平台的典型应用场景
某世界五百强企业在实时数仓技术选型的技术选型POC测试后,该企业技术负责人对偶数科技的数据云平台技术赞赏有加。
该企业当前的实时数仓业务场景中,使用MPP产品实现跑批业务,但是无法满足同时进行500并发明细查询的混合负载的需求。于是,该企业考虑了两种方案:
(1) 在当前跑批的生产环境,引入支持并发明细查询的实时数仓产品,与MPP产品搭配,在前端获取Kafka流数据后,按照数据类型分别完成跑批和实时查询的工作。
(2) 寻找一种能同时支持跑批和实时查询的混合负载的数据平台解决方案;
从上述两个方案来看,第一个方案无法实现数据共享,如果后端的数据分析同时需要批量数据和实时查询的数据,就需要专门开发对接两个不同产品的程序。第二个方案显然是可以解决第一个方案的问题,但是,从市场来看,能够支持第二个方案的技术非数据云平台技术莫属。
经过POC测试,偶数科技的数据云平台成功达到了客户第二个方案的预期。在下一步的实时数仓的建设中,该企业规划用两个阶段来逐步建设数据云平台集群。
第一阶段:继续采用传统的MPP技术作为日常跑批业务,同时采用实时数仓作为配套方案支持高并发实时查询的业务处理。第一阶段同时规划一个新业务集群,采用数据云平台技术,以满足与人工智能有关的创新业务。
第二阶段:将更多的需要混合负载的复杂业务迁移到数据云平台,逐渐将数据云平台发展成为实时数仓的核心处理和服务平台。
(7)数据云平台的未来发展
不久的将来,数据云平台的技术很快就会成为各大企业数据平台建设的技术主流技术,在人工智能,物联网,区块链等新技术领域发挥其重要价值。欢迎更多的企业同行研究数据云的技术。


http://chatgpt.dhexx.cn/article/EySosblF.shtml

相关文章

斯人已逝,精神犹存——纪念知名技术博客作者雷霄骅同学

今天在视频技术交流群里赫然听到一则让人无比震惊的消息,近些年一直活跃在视频开发领域的中国传媒大学在读博士研究生雷霄骅同学,因劳累过度在学校猝死。直到多家权威媒体证实之前,我们都一直不敢相信这消息的真实性。雷博士在音视频领域已经…

悼念博客专家雷霄骅七律诗一首

【引言】 今日凌晨,小虎看罢CSDN博客管理员的文章《叹息!悼念CSDN博客专家雷霄骅》, 感概世事无常,生命可贵,身体健康重要。 雷霄骅,中国传媒大学通信与信息系统专业的博士,青年才俊。 雷霄骅&a…

雷霄骅开源视音频项目汇总

from: http://blog.csdn.net/leixiaohua1020/article/details/42658139# 作者:雷霄骅, 一个值得怀念的人 本文汇总一下自己视音频编解码学习方面的开源项目。这些开源项目大体上可以分成专业领域程序,FFmpeg示例程序,FFmpeg移植程…

永远感谢雷神-雷霄骅!

致雷神: 谢谢你引我进入视音频的大门! 一路走好, 天堂好好休息! 20160804 、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、 姓名:雷霄骅 网名:leixiaohua1020 本…

【视频音频】雷霄骅开源视音频项目汇总

from: http://blog.csdn.net/leixiaohua1020/article/details/42658139# 作者:雷霄骅, 一个值得怀念的人 本文汇总一下自己视音频编解码学习方面的开源项目。这些开源项目大体上可以分成专业领域程序,FFmpeg示例程序,FFmpeg移植程…

雷霄骅---巨星陨落

今天 18:55 来自 人民日报微博 【中传25岁博士凌晨猝死教学楼,家属疑因过劳】中国传媒大学25岁博士雷霄骅,被发现猝死在学校主楼:16日晚9点多进实验室,凌晨3时倒在电梯口,早7时许被发现。家属称,事发前他一…

中传博士雷霄骅,致敬雷神,永远感谢雷神

在中国传媒大学通信与信息系统专业攻读博士的雷霄骅,今年10月就将迎来自己26岁的生日,但7月17日凌晨他猝死在学校主楼五层,当天早上7时许被保洁人员发现。 据法制晚报(微信ID:fzwb_52165216)记者了解,其家属称&#xf…

关于雷霄骅博士的博客FFMPEG+SDL的音频播放器播放有杂音的问题

博主在这里怀着对雷霄骅最高的敬意修复了雷神的一点点bug。 雷神的以下博客,在播放时会造成卡顿。 最简单的基于FFmpeg的音频播放器系列文章列表: 《最简单的基于FFMPEGSDL的音频播放器》 ———————————————— 版权声明:本文为…

沉痛悼念CSDN博主、年仅26岁的音视频专家雷霄骅

CSDN的老朋友、连续两届CSDN博客之星、微软MVP、博客排名52位、在中国传媒大学通信与信息系统专业攻读博士的雷霄骅,于2016年7月17日凌晨猝死在学校主楼五层,并于7月23号安葬。据相关报道称,事发前雷霄骅一直泡在实验室忙碌,怀疑其是劳累过度导致猝死。(详见法制晚报的报道…

纪念音视频界前辈-雷霄骅

这是一篇记录文,纪念一位在音视频领域研究的博士雷霄骅。 雷霄骅生前是中国传媒大学通信与信息系统博士在读生,于2016年7月17日凌晨猝死在学校主楼五层,10月就将迎来自己26岁的生日。 雷霄骅在音视频领域有很深的造诣和贡献,指导了…

雷霄骅系列博客汇总

这两天快速浏览了一下雷霄骅的博客,相信看过他博客的人内心都是无比钦佩,说句天妒英才确不为过,可能雷神说过最多的话大概就是,...没有我想要的,打开源代码... 真的是厉害。雷神不仅分享了自己的学习经历,里…

分享一个免费分流抢票软件!一键全自动抢票

感谢您抽出 .. 阅读本文 小伙伴们注意:公众号的推送机制不再按照时间前后推送了,微信公众号信息流乱序。君哥建议大家把科技毒瘤君公众号置顶(设为星标⭐),以便第一时间看到推送,非常感谢~,方法…

抢火车票,出行必备程序(12306bypass)--可以抛掉同程什么的抢票软件了

一. 免费原则 分流抢票(12306Bypass)的发布和使用均不收取任何费用。拒绝任何人或任何实体进行出售,严禁用于商业谋利用途; 二. 无害原则 任何人不得使用分流抢票(12306Bypass)进行加价代购、倒票等任何与…

抢票系统详解

转载自:https://blog.csdn.net/qq_37095882/article/details/102777226 秒杀抢购系统选型: 火车票秒杀系统如何在高并发情况下提供正常、稳定的服务呢? 我们知道用户秒杀流量通过层层的负载均衡,均匀到了不同的服务器上,即使如…

程序员专用的抢票小助手,再也不用担心抢不到车票了。

作者:JackTian 微信公众号:杰哥的IT之旅(ID:Jake_Internet) 马上临近过年了,漂泊在远方的朋友,也都准备陆续抢过年回家的车票了,但是往年每次不管是十一假期还是年关,大家…

12306崩了,90%的人都用过这三款抢票工具

12306又蹦了 12306回应软件崩了:操作旅客过多,可尝试重装app或切换网络 有不少网友反映12306崩了,买票太难了。12306客服表示,可能是操作旅客过多,系统繁忙造成的,可尝试重新卸载安装客户端或切换网络。关…

Python 一百多行实现抢票助手

一. 代码使用PythonSplinter开发,Splinter是一个使用Python开发的开源Web应用测试工具,它可以帮你实现自动浏览站点和与其进行交互。 二. 安装好Python 3或2都可以,然后安装Splinter pip install Splinter 三. Splinter注意事项 1. Splinte…

分流抢车票软件

分流抢车票软件 下载地址 传送门 没积分的的可以私信取

抢票(python)

关注微信公众号: 程序工厂,不定期更新更新黑科技、脚本等资源 腾讯云服务器优惠购买链接: 1核2G云服务器首年88元:http://url.cn/5Z0ZWGI 阿里云服务器优惠购买链接: 服务器半年只需要54 https://www.aliyun.com/minisite/goods?userCo…

python实现云服务器上12306自动化抢票功能

本文将分为几大模块讲解python服务器上12306自动化抢票功能: 一、云服务器的安装与配置 1.1 云服务器与个人主机不同,不受时间、场所等条件的限制,将python代码运行在云服务器上可以实现真正意义上的解放。 1.2 这里,我选择阿里…