数据保护与容灾备份

article/2025/8/23 5:10:37

在云与大数据时代,海量增长的数据容量,给数据的存储和保护带来新的挑战,从传统熟悉的IT架构到以云架构、虚拟化、超融合为代表的技术升级迭代,使得数据保护的技术手段也要加速。

数据保护的重要性

数据是企业重要的生产资料,关键数据的丢失可能会给企业致命一击。比如在911事件中,Bank NewYork在数月后因数据的丢失被迫破产清盘。

为什么后果如此严重?因为数据是计算机系统存在的原因和基础,数据往往是不可再生的。一旦发生数据丢失,企业就会陷入困境:客户资料、技术文件、财务账目等客户、交易、生产数据可能被破坏得面目全非。

数据丢失的可能性

概括起来,数据丢失分三个层次。一是逻辑错误,包括软件bug、病毒攻击、数据块被破坏等;二是物理损坏,包括服务器、磁盘损坏等;三是自然灾害对数据中心的摧毁等。

数据的危害时刻都在发生,比如曾经发生过的“删库跑路、漏洞后门、系统本身脆弱性、云服务商故障、误操作配置、数据中心火灾”等事故,都是数据丢失方面最沉痛的教训。

数据复制技术

为了应对数据丢失造成的损失,必须对数据进行复制保护,并且企业信息化程度越高,相关的恢复措辞就越重要。一般数据从生产到存储,主要经过应用、中间件、数据库、操作系统、存储或者磁盘驱动、服务器硬件、网络、存储交换机到存储。在传统的数据备份恢复基础上,通过数据复制技术提供多数据副本,保证副本数据的可用性从而实现数据保护。

从技术角度看,分为中间件和应用层复制、数据库层复制、主机操作系统及存储层复制。

中间件和应用层的数据复制,是中间件或者应用层面的双写,根据业务需求,通过应用架构设计实现数据主本和副本的更新;根据需要进行强一致性、弱一致性、最终一致性设计,来保证主本和副本之间的一致性、完整性、时效性。

数据库层复制:不管是开放的数据库还是大机的数据库,都提供相关的数据复制软件,实现数据库数据的物理复制和逻辑复制。主要技术流派包括逻辑复制和物理复制两种。前者利用数据库的重做日志、归档日志,将主本所在站点的日志传输到副本所在站点,通过重做SQL的方式实现数据复制。逻辑复制只提供异步复制,主副本数据的最终一致性,无法保证实时一致性;后者通过Redo日志或者归档日志在副本站点的同步或者异步持久化写、Redo Apply来实现复制功能,同时副本站点的数据可以提供只读功能。

主机操作系统层、存储层复制:基于系统的IO、底层物理卷、数据块,通过存储硬件、备份恢复、存储虚拟化等技术实现数据复制,与上层的应用和逻辑无关。主要技术流派包括磁盘镜像技术、操作系统层基于卷管理的数据复制技术、存储层的存储虚拟化技术、优化的备份恢复技术及网络数据存储集中管理技术、英方特有的系统内核字节级数据复制技术等。

容灾备份

这实际上是两个独立的概念,备份不等于容灾,备份是保护数据,容灾是确保业务连续性。在灾备一体机出现后,这两个概念所代表的功能往往被包含在里面,所以也造成在一些用户在采购纯软件产品时,将备份与容灾产品混为一谈,以至于厂商不知道用户到底需要备份产品还是容灾产品,或者是备份+容灾的产品。

备份

备份,是预定义的数据集合的副本,是数据保护的根本方法,它反映了数据集合在某个时刻的静止状态,备份文件是所有数据保护架构的支柱,备份的目的在于恢复。

关于备份,存在两个误区:一是双机热备不属于备份;二是硬件备份≠数据备份。

在备份架构演进方面,有本机备份、网络备份、LAN-Free(SAN)备份、Server-Free (脱机)备份等四种架构。

本地备份:优点是备份速度快、结构简单;缺点是不适合多主机环境,多主机备份的管理复杂。

网络备份:优点是集中备份,集中管理,充分利用磁带库资源;缺点是占用网络资源,网络的瓶颈在大数据量备份时非常明显。

LAN-Free (SAN) 备份:优点是备份速度快,不存在传统网络所造成的备份瓶颈, 适合大数据量高速备份;缺点是价格比较高。

Server-Free (脱机)备份:优点是生产服务器中不会引起备份的额外开销,生产系统的性能不会有丝毫降低;缺点是必须具备特殊的设备。

在备份技术的演进路线方面,则遵从了定时备份——快照备份——实时备份的路线。

定时备份:优点是软硬件支持范围广,适合长期保存的备份;缺点是需要打开文件备份,文件夹内的文件发生变化,导致的不一致性问题,另外需要专门的备份时间窗口,RPO也非常大。

快照备份:为了解决打开文件、备份时文件发生变化的问题而生;缺点是快照备份的兼容性问题,快照备份时对生产系统性能影响较大,另外RPO也较大。

实时复制(如CDP):为了解决了打开文件、备份时文件发生变化的问题、快照的兼容性受限问题而生;可以实现任意时间点恢复RPO≈0。英方基于字节级的实时数据保护CDP技术就是代表性产品之一。

容灾

备份是对数据进行保护,容灾是在备份的基础上,保障企业的业务连续性,从这个层面,一般将容灾划分为数据容灾和应用容灾。

数据容灾是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。

应用容灾是指在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统,在灾难发生时,备端系统迅速接管业务继续运行。

关键术语: RPO、RTO

RPO(Recovery Point Objective)是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。RPO可简单的描述为企业能容忍的最大数据丢失量。

RTO(Recovery Time Objective)则是指灾难发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持业务部门运作,业务恢复运营之时,此两点之间的时间。RTO可简单的描述为企业能容忍的恢复时间。

GB/T 20988—2007

《信息安全技术信息系统灾难恢复规范》国家标准(GB/T20988-2007)是我国灾难备份与恢复行业的第一个国家标准。该标准由国务院信息化工作办公室领导编制的,并于2007年11月1日开始正式实施。该标准规定了信息系统灾难恢复应遵循的基本要求,适用于信息系统灾难恢复的规划、审批、实施和管理,并参照国际标准SHARE78的7个层级定义,确定了符合中国国情的6个灾备能力等级要求。下面,概括性地介绍各个层级的内容:

1级:数据定时备份+异地存放。

2级:数据定时备份+异地设备冷备。

3级:数据定时备份+异地部分业务热备接管。

4级:数据定时备份+异地业务热备接管。

5级:数据实时备份+异地业务热备接管。

6级:零数据丢失+远程自动接管支持。

容灾和备份的几点区别

关于容灾、备份这类概念,有几个比较容易混淆,其中包括而不限于“冷备”“热备”“集群”“高可用”“负载分摊/均衡”“备份”“容灾”“容错”“虚机迁移/vmotion/migration”之类的。

“容灾”与“备份”不是同一个概念,“容灾”是目的,而“备份”只是实现容灾的其中一种手段,不是唯一;“备份”只是将数据COPY一份,在其他介质保存,当数据丢失了,有“备份”可以用于恢复,无论手动还是自动,而有副本就相当于完成“备份”了,至于恢复不恢复,恢复完了没有,与“备份”是没有关系的,那属于“容灾”的范畴了。

我们日常将东西考到U盘,光盘,移动硬盘也就是备份了。而“容灾”是为了通过一些技术手段的部署,达到出现“意外”的时候,业务不会中断或者中断后会自动恢复(注意要自动,而且恢复时间很短)。例如服务器、网络、存储哪一点出现问题,都会中断服务,所以这个时候每个点都需通过技术手段做保护,这就是容灾要考虑的事情。

与“备份”不同的是,例如你的硬盘挂了,买一个新硬盘,你再将移动硬盘的数据拷过来就OK,但是这个过程中是要停止服务的,恢复过程是需要时间的。而“容灾”是要不中断服务的,例如说你有2台电脑,然后两边数据是实时同步的,忽然一台的硬盘坏了,不要紧,直接到另外一台办公好了,因为实时同步,坏了的那台的数据这边没坏的这台也有,这种就相当于容灾了。

接着对上面的词语逐一介绍:按照属于“容灾”与不属于“容灾”来分开。

容灾类

“高可用”:及HA(High Avaliable),一般实现方式是对2台服务器上面装HA的软件,这时候就和“双机热备”的概念一样了,一般正常服务时只有主机在工作,2台服务器中间会有心跳的hello包,备机会一直发hello包检测主机是否“活着”,超过一段时间主机没有应答hello包的话,备机就会认为主机死掉,然后主动接管业务了。这样子又实现了主机的容灾了。

“冷备”就没有什么好说了,相当于1台坏了,另外1台还要我们手动去启动,配置,才能接管坏了那台的工作。

“容错”:Vmware的虚拟化软件提出的一个概念,相当于1台虚拟机运行的时候,多开1台虚拟机,当一些操作在A虚机运行,会通过软件同步复制操作到B。当A虚机崩溃,B主机立刻托管业务,由于操作都是同步复制的,所以B不会丢失任何在A上的内容(包括内存里面的临时数据)。此种方式比“高可用”的更高级,“高可用”的方式B还要通过A没有应答hello才发现A崩溃了,中间还是有一段过度的时间会业务中断,但是可以实现自动的业务恢复。而“容错”这种方式业务完全不用中断,但是相应换来了成本需要增高,原来1台虚机,现在相当于要多开1台来与他同步,资源成本增高。

非容灾类

“负载均衡”:假设有5台服务器,如果有5个访问请求,没有负载均衡时,可能5个请求都访问机器A,这样可能引致访问速度慢,A机器崩溃等问题,而有了负载均衡,就会将5个任务按照策略进行分发,可能5台机器每台负责处理一个任务就OK了。

”集群”:多台服务器同时处理某一事务,听起来与“负载均衡”有点像,但是其实负载均衡是5个任务摊分给5台机器,而集群相当于一个任务拆分为5份,5台机器一起来处理同一个任务,分别完成自己负责的部分后汇总一起输出结果。例如有一个很复杂的计算任务,1台机要算5小时才能解决,那么5台同时计算,可能1小时就解决了,这个是“集群”的主要用途。

“虚机迁移”:与“高可用”与“容错”最大的区别,“虚机迁移”是计划内的,即需要人工手动或者安排好进行时间来实现的,所以不属于容灾的范畴。而后两者属于“容灾”范畴,可以在发生计划外的“意外”的时候,自动实现业务恢复。“虚机迁移”更合适用来处理资源池间的利用率平衡性,如A资源池80%符合,B资源池只有20%,那么可以适当“迁移”部分到B资源池,实现两边负载均衡

 


http://chatgpt.dhexx.cn/article/ZIhq5SQd.shtml

相关文章

云数据中心备份容灾设计方案

导读:云计算中心 涵盖系统多、类型复杂、关键性程度不一,因此对于恢复目标也有不同的要求,针对不同恢复目标的业务采取不同的灾备技术,同时考虑到数据中心重要性,需要建立同城灾备数据中心,并规划异地灾备中…

云呐数据库的容灾备份,数据容灾包括数据的备份和恢复吗

备份也是容灾的一种方式,应用级的备份是最传统的,在应用层进行复制,一般成本低廉。而这些中小型企业的备份容灾都十分初级,粗糙且不容乐观。这是因为备份容灾的市场,还普遍集中在如金融行业这样的大型企业上。头部厂商…

国内外主流容灾备份厂商介绍

国内外主流容灾备份厂商介绍 国内外主流的容灾备份厂商都有哪些?下面就来带大家了解一下! 1、赛门铁克 国外厂商,他们最早的产品是Ghost,这是一款非常强大的产品,相信很多人都有用过。后来赛门铁克收购了Veritas&…

“容灾”和“备份”的区别?原来如此!

点击上方“朱小厮的博客”,选择“设为星标” 后台回复"书",获取 后台回复“k8s”,可领取k8s资料 数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面…

备份容灾技术基础

备份概念及结构 备份的基本概念: 备份:指将文件系统或数据库系统中的数据加以复制;一旦发生灾难或错误操作时,得以方便而及时地恢复系统的有效数据和正常运作。 备份系统的组成: 备份服务器备份软件存储设备 备份…

【MySQL】数据库备份与容灾详解(实战篇)(MySQL专栏启动)

📫作者简介:小明java问道之路,专注于研究 Java/ Liunx内核/ C及汇编/计算机底层原理/源码,就职于大型金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的架构设计与演进、系统优化与稳定性建设。 &#x1…

数据中心“容灾”和“备份”的区别

戳蓝字“CSDN云计算”关注我们哦! 数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,容灾备份就是数据安全的最后防线&a…

云呐|什么是容灾备份

什么是容灾备份?帮助企业应对人为误操作、软件错误、病毒入侵等“软”性 灾害以及硬件故障、自然灾害等“硬”性灾害。主要也做容灾备份一体机。  一般而言,设计企业基础设施架构主要包括计算资源架构、网络架构、安全架构、灾备架构四个模块。 …

容灾和备份的区别

本文来说下“容灾”和“备份”的区别 文章目录 概述什么是容灾容灾的分类容灾和备份有什么联系容灾和备份的区别容灾的分类数据级应用级业务级 备份等级本文小结 概述 数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷…

容灾备份——备份技术

目录 基本概念: 备份与容灾的区别: 备份和归档的区别: 备份系统架构: 备份系统的三要素: 备份方案网络: LAN-Base: LAN-Free: Server-Free: Server-Less: 备份…

filter函数的妙用

filter函数的妙用 数组的 filter 函数有一个很重要的用处,可以过滤 null、undefined、 代码 var arr [1, , null, undefined, ] console.log(arr.filter(v > v))

filter函数 与filtfilt函数的效果区别

filter函数 与filtfilt函数的效果区别 filter滤波器称为一维数字滤波器。filtfilt滤波器称为零相位数字滤波。其滤波算法是基于filter而来的。只是filtfilt实现了零相位。其基本实现过程为先让信号用filter滤波,再将信号时域反转再次通过filter滤波,这样…

python filter函数

filter函数就是滤波函数的意思,可以参考信号处理的滤波定义理解。 直接上代码吧: 代码1:利用filter函数过滤掉奇数或者偶数 c[1, 4, 6, 7, 9, 12, 17] def is_odd(x):return x % 2 1 def is_even(y):return y%20 alist(filter(is_odd, c)…

MATLAB之Filter函数的C语言程序实现

MATLAB之Filter函数的C语言实现 前言一、MATLAB的Filter函数二、C语言实现Filter函数1.代码2.计算结果 总结 前言 MATLAB里面有很多现场的滤波器函数,我们在做数据分析的时候,可以直接调用,十分方便,但是有时候我们也需要在嵌入式…

c语言cross函数什么意思,通达信cross函数用法,通达信 filter函数 返回什么值

Q1:通达信 filter函数 返回什么值 结果:返回一个逻辑真值,当逻辑条件为真时,如果在N周期内已真过,将当前真值置为0,即过滤。 下面网页上有详细讲解。 http://www.chcj.net/thread-945487-1-1.html 希望对你有点帮助! Q2:求通达信公式满足条件CROSS(EXP1,EXP2)向左画水平射…

matlab怎么调用filter函数,如何在matlab中建立和调用filter函数

数字滤波是Matlab信号处理中的常用功能。具体步骤为: step1:设计好滤波器系数,b和a。其中b,a存储了滤波器响应传递函数的分子和分母系数。 step2:产生输入信号x step3:实现滤波yfilter(b,a,x),画出输出波形…

Power BI——Filter函数

1.定义&#xff1a; FILTER 接受一个表和一个逻辑条件作为参数&#xff0c;返回满足条件的所有行。 2.语法&#xff1a; FILTER ( <表>, <布尔表达式> ) 3.使用场景&#xff1a; 遇到如下情况使用&#xff1a; 4.案例&#xff1a;

html中filter函数的用法,filter函数怎么使用

JavaScript中的arr.filter()函数用于从给定数组创建一个新数组&#xff0c;该数组仅包含给定数组中满足参数函数设置条件的那些元素。下面我们就来具体看一下filter()的使用方法。 filter()的基本语法如下&#xff1a;var newArray arr.filter(arg_function[, this_arg]) filt…

matlab的filter函数,filter函数用法 matlab中filter函数的用法

matlab中filter函数的用法如果你深爱的人此刻在你身边陪你,你怎么会有时间来看这些文字呢 离散系统的差分方程为 2y[k]-y[-1]-3y[k-2]=2x[k]-x[k-1] x[k]=(0.5^k)u看楼主的意思主要是想实现差分方程 先从简单的说起: filter([1,2],1,[1,2,3,4,5]) 实现 y[k]=x[k]+2*x[k-1] y[…

【Python基础】内置函数filter详解

filter&#xff0c;顾名思义&#xff0c;就是一个过滤器。其作用是从列表&#xff08;或其他序列类型&#xff09;中筛选出满足条件的子列表&#xff0c;filter是python的内置函数&#xff0c;无须import即可直接使用。 1 filter的基础用法 对于列表&#xff08;或其他序列类…