​云原生:重新定义云时代的技术标准 | 凌云时刻

article/2025/8/23 10:36:14


凌云时刻 · 洞见

导读:云计算、大数据、人工智能等新技术正迅速的改变着我们所处的时代,其巨大的影响力已经从量变到质变,数字化转型成为企业发展的必然选择。

作者 | 叔同

来源 | 凌云时刻(微信号:linuxpk)

如何在数字化时代实现弯道超车?

云原生开辟了一条捷径

据IDC报告,全球前1000的大企业中,67%的企业已将数字化转型变成企业级战略,企业数字化转型也正成为许多中国企业的核心战略。随着企业上云成为业界趋势,全面使用开源技术和云产品构建软件服务的时代已经到来。如何更好地拥抱云计算、拥抱云原生、用技术加速创新,将成为企业数字化转型升级成功的关键。

阿里云原生应用平台研究员丁宇(叔同)在2020阿里云线上峰会上提到了“以容器为代表的云原生技术,已经成为释放云价值的最短路径,云原生助力企业全面拥抱云计算”。在他看来,很多企业在数字化转型的过程中,付出了不少的努力与时间,但因为对云原生缺乏了解和实践经验,加之没有好的技术与产品来支撑,导致走了不少弯路。

我们知道,传统的开发模式在迭代速度、频率以及运维方式都难以满足市场快速变化的需求,而云原生追求的就是最大化地利用其技术模式,充分发挥云计算的生产力,使得应用从设计、开发、交付、到管理的思维方式与最佳实践有机结合,从而让这个应用可以最快地创造价值,也就是丁宇所说的“最短路径”。

以容器技术为例,容器就是在虚拟化的基础上向上封装了一层,作为云平台与客户交互的新界面之一,应用的构建、分发和交付在容器层面实现标准化,对于企业而言,可以大幅降低 IT 实施和运维成本,从而提升业务创新的效率。

叔同提到:“阿里云的核心优势之一就是阿里巴巴的核心业务运行在云上,形成最好的创新土壤,最先进的技术首先会在阿里巴巴自己的业务体系中进行尝试,得到了大规模的运用,证明其技术的普适性与价值后再开放给客户。”

从2011年迈进容器大门算起,阿里的云原生之路已经走了十年。这期间经历了十年双11的历练,例如2015年全面容器化帮助双11大促实现快速弹性扩容。由于业务的超大规模使得其复杂程度非常高,这也为容器技术带来了更大的挑战。例如在容器镜像分发过程中,一次发布分发几万个镜像,这样巨大的流量是一个不小的挑战。

为实现效率的极致要求,阿里云利用P2P技术,实现大规模大批量的快速分发,实现10秒内完成跨机房镜像下载容器启动。容器技术对于双11的显著影响还包括在具体的混部技术实施中,通过混部技术,阿里巴巴集团范围内能够节省30%左右的IT成本支出,在双11这个特殊时间段里,将每万笔交易成本下降超过75%。

Gartner今年4月发布2020年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如Serverless容器、服务网格、安全沙箱容器、混合云和边缘等领域,具备良好的技术发展策略。而在今年3月,Gartner第二次公开《竞争格局:公共云容器服务》年度调研报告,报告针对Serverless、Kubernetes、服务网格、容器镜像等十项功能维度进行对比,阿里云和AWS覆盖九项产品能力,产品丰富度领先Google、微软、IBM和Oracle四家厂商。


云原生裸金属

挑战性能极致,全新升级最短路径

过去几年,容器服务被各行业企业广泛接受,而阿里云凭借业界最丰富的容器产品家族和容器服务,已经连续数年以超400%的规模高速增长。在2020阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。

新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致,具备极致性能、高效调度、全面安全的特点:

  • 新一代神龙架构具备业界第一的 I/O 转发能力,提供最高 100G 网络带宽;阿里云高速 Terway 容器网络通过网卡直通和数据平面加速,延迟下降30%。

  • 第 7 代实例最大支持 192 个 vCPU。ACK 智能 CPU 调度可以轻松释放强大算力,无需应用调整可以实现 QPS 20~30% 提升;结合 ENI 网卡密度提升,可以缩减 50% 的计算成本。

  • 弹性裸金属实例支持阿里云安全容器,提升端到端安全隔离能力,与开源方案相比性能提升30%,也支持阿里云首发机密计算容器,基于软硬一体技术有效保护数据隐私。

在阿里巴巴内部,容器+神龙裸金属方案以超高性能支撑钉钉抗住有史以来最大的流量洪峰。以前,钉钉100%部署在普通物理机上,疫情突发之后,政府、企业和学校对在线协作的需求猛增。通过云上神龙裸金属+容器弹性部署方案,快速地实现了钉钉业务应用10万核扩容需求。

在外部,尤其是在这次疫情影响下,很多企业面临快速扩容的压力,如在线教育行业,短时间内爆发式的需求,对于任何一家在线教育企业既是机遇,更是挑战。据百家云CEO李钢江透露,疫情期间百家云的业务量在短时间内增长了数十倍,要满足如此迅速的扩容需要,还要在客户无感知的情况下完成扩容,其难度不亚于交付一个新系统。

幸运的是,在这场流量战役之前,百家云已经在阿里云团队的帮助下,优化了自身容器集群架构与规划,通过阿里云容器服务ACK、基于神龙架构的弹性裸金属实例的核心方案,足以从容应对流量洪峰。相比之下,一些没有使用容器的在线教育企业,面对突增的用户量和流量,只能成倍的堆积机器,导致部署时间拉长,业务成本急剧上涨,用户体验也不佳。

为什么要采用神龙裸金属+容器弹性部署方案?

因为百家云的需求是三天扩容数十倍,并且其K8s集群对性能要求极高,而“容器+弹性裸金属”的解决方案非常契合这种大流量、高并发的场景。

首先,阿里云弹性裸金属服务器规格较高,可以帮助百家云显著提升单个节点的容量。

其次,基于容器化构建方式,可以满足业务快速发放和弹性的要求。神龙服务器完全消除了虚拟化损耗,提升了8%的计算性能,其类物理机特性,可进行二次虚拟化。神龙的性能,加上容器的弹性,形成了天作之合。数据显示,容器运行在云上神龙反而比非云物理机的性能要好10%-15%。主要是因为虚拟化开销已经offload到MOC卡上,神龙的CPU/Mem是无虚拟化开销的,而上云后运行在神龙上的每个容器都独享ENI弹性网卡,能提升13%的网络吞吐量。

第三,神龙服务器的存储带宽和计算带宽分离,能满足百家云业务场景的大量读写需求。使用神龙服务器之后,计算能力大增。并且,百家云通过使用阿里云的高性能NAS服务,并通过水平扩展为4个集群,解决了I/O的瓶颈。

基于以上方案,借助自身的大规模集群管理能力,在短短几天之内,阿里云团队帮助百家云团队有效升级了原有的架构方案,实现了数十倍的扩容,大幅提升了其性能与稳定性,并拥有了应对爆发性规模的能力,用户毫无察觉。

丰富的云原生产品和解决方案背后

阿里云用四个"最"来践行最短路径

阿里云在云原生领域的投入广泛而深入,在容器、服务网格和Serverless均有丰富的产品服务,目前阿里云已经拥有国内最丰富的云原生产品家族、最全面的云原生开源贡献、最大规模的云原生应用实践、最大的云原生客户群体。其产品体系覆盖八大类别20余款产品,涵盖底层基础设施、数据智能、分布式应用等,可以满足不同行业场景的需求。

阿里云是国内在云原生领域的开源贡献最全面的科技公司,涵盖编排调度、作业管理、无服务器框架等,主导维护etcd、containerd、dragonfly等多个CNCF明星项目的发展,已有超过10个项目进入CNCF landscape。去年1月,阿里云资深技术专家李响成为首个入选全球顶级开源社区CNCF技术监督委员会的中国工程师,致力于推动云原生技术的落地。今年5月,阿里巴巴开源首个边缘计算云原生项目OpenYurt,推动社区在云原生和边缘计算交叉领域的协同发展。

近日,云计算开源产业联盟在OSCAR开源先锋日云原生专场活动上公布了“云原生应用十大优秀案例”评选结果,由阿里云提供技术服务的申通通用云原生计算平台和中国民生银行的场景化数据服务中台双双入选。这次评选的四大标准是:面向传统行业数字化转型,规模化应用云原生技术,提升企业资源利用率及研发效率,助力企业业务创新发展。申通和民生银行两大案例因为在云原生和数据服务中台的技术实践中表现出色,最终脱颖而出。

以申通为例,原有IDC系统帮助申通早期业务快速发展,但也暴露了不少问题,传统IOE架构,各系统架构的不规范,稳定性,研发效率等都限制了业务发展需求。在跟阿里云多次技术交流之后最终确定阿里云为唯一合作伙伴,为申通提供稳定的计算,数据处理平台。

申通原架构是基于VMware+Oracle数据库的架构,通过上阿里云,全面转型基于Kubernetes的云原生架构体系。主要有两点:

1. 应用容器化。跟虚拟机比起来,容器能同时提供效率和速度的提升,让其更适合微服务场景。通过应用容器化解决了环境不一致的问题,保证应用在开发、测试、生产环境的一致性。

2. 微服务改造。原先很多业务是基于Oracle的存储过程及触发器完成的,系统之间的服务依赖也是通过数据库OGG同步完成。存在的问题是系统非常难维护,也非常不稳定。通过引入Kubernetes的服务发现来做微服务方案,按业务域进行拆分,让整个系统更易于维护。

目前申通核心业务系统已经在云上完成流量承接,每天处理订单量在千万级别,处理物流轨迹在亿级别,每天产生的数据量在1T,使用1300+个计算节点来实时处理业务。正如申通上云总负责人提到的,“申通通过阿里云进行全面转型,基于Kubernetes的云原生架构体系,在成本、稳定性、效率、赋能业务四个维度获得显著成效,这些云原生技术带来的价值,是申通转为使用公有云作为主要计算资源的核心驱动力。”

在容器技术上,阿里云的目标是构筑新基石、新算力、新生态,帮助企业更好地支撑混合云、云边一体的分布式架构和全球化的应用交付。据 Gartner 分析,未来 80% 以上的企业都会采用混合云的架构,打造混合云和云边一体的方案也是阿里云一直在关注的方向。未来云的架构是动态、混合的架构——云边端一体,公共云能力向边缘设备端拓展,需将计算能力、AI推进到边缘,容器提供一致化的方式对云边端进行统一的应用部署和交付。基于云原生软硬一体化的创新技术,通过阿里云提供的强大算力来加速企业的智能化升级:容器服务结合神龙架构发挥性能和弹性,支持含光800芯片的调度、共享,极致优化深度学习场景的效率、成本。

容器、Kubernetes、云原生正在成为云时代的技术新标准,重塑整个软件生命周期,阿里云通过云原生正在帮助企业客户和开发者最大化利用云的能力,最大化发挥云的价值。

END

往期精彩文章回顾

我们能从Matlab被禁中学习什么?

申通上云?技术详解!

Python 命令行库的大乱斗

乘风破浪的中国数据库

SpaceX上天容易,Tesla自动驾驶难

与生命赛跑,Serverless提升AI诊断效率90%

技术创造新商业:云研发时代的效能挑战

生不出孩子怪天气?驳《我国工业软件失去的30年》一文

应云而生,原力觉醒——解读云原生基础设施

又一次全球第一!

长按扫描二维码关注凌云时刻

每日收获前沿技术与科技洞见


http://chatgpt.dhexx.cn/article/tujHN51p.shtml

相关文章

2020 有哪些不容错过的前端技术趋势? | 凌云时刻

凌云时刻 洞见 导读:2019 年的大前端热闹非凡,Serverless,Flutter,Vue3.0,桌面应用开发,小程序,WebAssembly 的火爆发展还是超乎我们预期,2020 的大前端又有哪些不容错过的技术趋势…

eBPF技术应用云原生网络实践:kubernetes网络 | 凌云时刻

凌云时刻 洞见 导读:eBPF起源于 Linux 网络子系统,由于其灵活性和高性能等特点,被迅速应用在不同领域。事实上网络领域中,eBPF由于其高性能支持更高的吞吐率、平均每GB带宽消耗更少的CPU等特性,已经逐渐成为网络领域中…

OpenAnolis社区致Linux开发者的一封信

凌云时刻 技术 导读:OpenAnolis社区官宣。 来源|OpenAnolis 亲爱的Linux开发者朋友们: 大家新年好! 今天,我们要给大家讲讲OpenAnolis的故事,她与每个Linux开发者都息息相关。OpenAnolis社区由阿里云于202…

云原生时代,消息中间件的演进路线 | 凌云时刻

凌云时刻 技术 导读:从虚拟化技术诞生以来,IaaS/PaaS/SaaS 概念陆续被提了出来,各种容器技术层出不穷。到 2015 年, Cloud Native 概念应运而生,一时间,各种云厂商,云服务以及云应用都加上了“…

Alibaba Cloud Linux 2 LTS OS 启动优化实践 | 凌云时刻

凌云时刻 技术 导读:Alibaba Cloud Linux 2 (原Aliyun Linux 2)是阿里云操作系统团队基于社区版 4.19 LTS 内核打造的一款针对云产品优化的下一代 Linux 操作系统发行版,不仅提供 Linux 社区的最新增强功能,也提供了云上最佳用户体验并针对阿…

云原生的What、Why、How | 凌云时刻

凌云时刻 洞见 导读:毋庸置疑,云计算的未来是云原生的。但是云原生到底是什么?在这场数字化转型的浪潮中,云原生扮演着什么角色?一千个人眼中,有一千个哈姆雷特。在本文中,从过去到未来&#x…

什么技术才值得你长期投入? | 凌云时刻

凌云时刻 洞见 导读:“每个人的时间都是有限的,在有限的时间里选择一项值得投入的技术会变得尤为重要。”那么,如何去选择一个值得投入的技术?一个值得长期投入的技术又具备哪些特性? 作者 | 简锋 来源 | 凌云时刻&am…

龙蜥社区首届理事大会圆满召开!14家理事代表出席

凌云时刻 编者按:2021年7月6日,OpenAnolis龙蜥社区成功召开首届理事大会,来自阿里云、统信软件、Intel、红旗软件、万里红、联通、电信云、移动云、龙芯、兆芯、飞腾、中科方德等14位家单位的理事代表出席。本次会议由龙蜥社区运营委员会主席…

SRS为何加入木兰社区孵化?

凌云时刻 SRS正式加入木兰开源社区孵化,我想很多朋友只是大概知道木兰社区是国家级的开源社区,是一件很值得荣耀的事情,其他的事情可能就了解不多了。 这次和大家分享下我对这个事情的理解和思考,如果有疑问欢迎评论区留言&#x…

陈绪:被疫情加速的云计算 | 凌云时刻

凌云时刻 导读:"疫情是云计算腾飞的一个推动力,只是突然而来的肺炎病毒,在给所有人带来损失的同时,也为云计算的生态格局创造了一个全新的变化。" 作者 | 陈绪 来源 | 凌云时刻(微信号:linuxpk…

申通上云?技术详解! | 凌云时刻

凌云时刻 技术 导读:如果说,快递行业上半场的竞争拼的是规模、服务乃至价格,进入下半场,快递企业们还需要比拼硬核的技术实力。 作者 | 周金龙(遥方) 来源 | 凌云时刻(微信号:linux…

eBPF Internal: Instructions and Runtime | 凌云时刻

凌云时刻 技术 导读:eBPF 是最近几年异常火爆的一门内核技术,从2011年开发至今,eBPF 社区依然非常活跃。eBPF 可以通过热加载的方式动态的获取、修改内核中的关键数据和执行逻辑,避免内核模块的方式可能会引入宕机风险&#xff0…

乘风破浪的中国数据库 | 凌云时刻

凌云时刻 洞见 导读:从80年代萨师煊教授的一行板书,到今天国产数据库的百花齐放,四十年科技自研,中国数据库都经历了什么? 作者 | 丹如 来源 | 杭派工程师 前言 “科技行业已经没有什么惊心动魄的大事了!”…

harmonyos开发者社区,HarmonyOS开发者创新大赛结果公布,社区渠道参赛队伍战果斐然...

HarmonyOS开发者创新大赛是华为HarmonyOS开发者生态建设的重要一环,致力于挖掘优秀的应用创新人才及项目。参赛队伍基于HarmonyOS的创新特性,结合应用场景,开发出具有全新体验、全新交互的终端应用。对有市场前景的项目,华为不吝帮…

凌云抒志 星海航帆 | 汇佳学校MYP社区设计展隆重举办

毕业,一个带着憧憬、喜悦和不舍的复杂字眼。在那些不曾预料的挑战和困难中,拥有不寻常经历的2022届MYP毕业生,通过为期一年的社区服务与行动,为这个词增添了新的注解:毕业,还需要“勇气”与“坚毅”&#x…

YOLOv2相比于yolov1的改进

1.Batch Normalization Batch Normalization可以提升模型收敛速度,而且可以起到一定正则化效果,降低模型的过拟合。在YOLOv2中,每个卷积层后面都添加了Batch Normalization层,并且不再使用droput。使用Batch Normalization后&…

YOLOv1,YOLOv2,YOLOv3解读

本文依次讲解YOLOv1,v2,v3。博客地址https://blog.csdn.net/hancoder/article/details/87994678 文章目录 YOLOv11.1 Introduction1.2 Unified Detection1.3 网络框架1.4 Loss解读LOSS: 1.5 test附:NMS示例: 1.7 YOLOv1结语待解决问题 YOLOv22.1 Better更…

Yolov2模型——pytorch实现

论文传送门:YOLO9000: Better, Faster, Stronger Yolov2的改进: 1.批标准化(Batch Normalization):在conv后加入BN(conv不再使用bias),改善模型的收敛性,同时去掉dropout; 2.高分辨率分类器(High Resolut…

【YOLO系列】--YOLOv2超详细解读/总结

本章论文: YOLOv2论文(YOLO9000: Better, Faster, Stronger)(原文+解读/总结+翻译) YOLO系列解读直通车🚀: YOLO系列-【YOLOv1】🚀 YOLO系列-【YOLOv2】&a…

YOLOv1、YOLOv2和YOLOv3对比

YOLOv1、YOLOv2和YOLOv3对比 R-CNN系列YOLOv1结构目标输出网络训练YOLOv1的局限性和R-CNN系列的对比 YOLOv2结构目标输出网络训练关于YOLO9000 YOLOv3结构目标输出网络训练YOLOv3系统做过的不成功的尝试 未来 YOLO深度卷积神经网络已经经过原作者Joseph Redmon已经经过了3代4个…