MPP(大规模并行处理)简介

article/2025/11/9 4:02:16

1、 什么是MPP?

MPP (Massively Parallel Processing),即大规模并行处理,在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。

简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。

2、MPP(大规模并行处理)架构 

                                         (MPP架构)

3、 MPP架构特征

● 任务并行执行;

● 数据分布式存储(本地化);

● 分布式计算;

● 私有资源;

● 横向扩展;

● Shared Nothing架构。

4、 MPP服务器架构

它由多个SMP服务器通过一定的节点互联网络进行连接,协同工作,完成相同的任务,从用户的角度来看是一个服务器系统。其基本特征是由多个SMP服务器(每个SMP服务器称节点)通过节点互联网络连接而成,每个节点只访问自己的本地资源(内存、存储等),是一种完全无共享(Share Nothing)结构,因而扩展能力最好,理论上其扩展无限制。

5、MPPDB

MPPDB是一款 Shared Nothing 架构的分布式并行结构化数据库集群,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算平台,并广泛地用于支撑各类数据仓库系统、BI 系统和决策支持系统

6、MPPDB架构

MPP 采用完全并行的MPP + Shared Nothing 的分布式扁平架构,这种架构中的每一个节点(node)都是独立的、自给的、节点之间对等,而且整个系统中不存在单点瓶颈,具有非常强的扩展性。

                                        MPPDB架构

7、 MPPDB特征

MPP 具备以下技术特征:

1) 低硬件成本:完全使用 x86 架构的 PC Server,不需要昂贵的 Unix 服务器和磁盘阵列;

2) 集群架构与部署:完全并行的 MPP + Shared Nothing 的分布式架构,采用 Non-Master 部署,节点对等的扁平结构;

3) 海量数据分布压缩存储:可处理 PB 级别以上的结构化数据,采用 hash分布、random 存储策略进行数据存储;同时采用先进的压缩算法,减少存储数据所需的空间,可以将所用空间减少 1~20 倍,并相应地提高 I/O 性能;

4) 数据加载高效性:基于策略的数据加载模式,集群整体加载速度可达2TB/h

5) 高扩展、高可靠:支持集群节点的扩容和缩容,支持全量、增量的备份/恢复;

6) 高可用、易维护:数据通过副本提供冗余保护,自动故障探测和管理,自动同步元数据和业务数据。提供图形化工具,以简化管理员对数据库的管理工作;

7) 高并发:读写不互斥,支持数据的边加载边查询,单个节点并发能力大于 300 用户;

8) 行列混合存储:提供行列混合存储方案,从而提高了列存数据库特殊查询场景的查询响应耗时;

9) 标准化:支持SQL92 标准,支持 C API、ODBC、JDBC、ADO.NET 等接口规范。

8、 常见MPPDB

GREENPLUM(EMC)

Asterdata(Teradata)

Nettezza(IBM)

Vertica(HP)

GBase 8a MPP cluster(南大通用)

9、 MPPDB、Hadoop与传统数据库技术对比与适用场景

MPPDB与Hadoop都是将运算分布到节点中独立运算后进行结果合并(分布式计算),但由于依据的理论和采用的技术路线不同而有各自的优缺点和适用范围。两种技术以及传统数据库技术的对比如下:

特征

Hadoop

MPPDB

传统数据仓库

平台开放性

运维负责度

扩展能力

拥有成本

系统和数据管理成本

应用开发维护成本

SQL支持

中(低)

数据规模

PB级别

部分PB

TB级别

计算性能

对非关系型操作效率高

对关系型操作效率高

对关系型操作效率中

数据结构

机构化、半结构化和非机构化数据

结构化数据

结构化数据


综合而言,Hadoop
和MPP两种技术的特定和适用场景为:

Hadoop在处理非结构化和半结构化数据上具备优势,尤其适合海量数据批处理等应用要求。

MPP适合替代现有关系数据机构下的大数据处理,具有较高的效率。

MPP适合多维度数据自助分析、数据集市等;Hadoop适合海量数据存储查询、批量数据ETL、非机构化数据分析(日志分析、文本分析)等。

由上述对比可预见未来大数据存储与处理趋势:MPPDB+Hadoop混搭使用,用MPP处理PB级别的、高质量的结构化数据,同时为应用提供丰富的SQL和事物支持能力;用Hadoop实现半结构化、非结构化数据处理。这样可以同时满足结构化、半结构化和非结构化数据的高效处理需求。

 



http://chatgpt.dhexx.cn/article/Ii1Wxh3x.shtml

相关文章

基于WiFi的Android局域网即时通讯软件

基于WiFi的Android局域网即时通讯软件,通过自建WiFi热点的方式与其他移动设备进行通信,实现了文字聊天、语音留言、文件互传等功能,满足基本的日常使用需求。 下载地址:http://www.devstore.cn/code/info/670.html 运行截图&…

基于WiFi的Android局域网即时通讯软件——Android源码

基于WiFi的Android局域网即时通讯软件 基于WiFi的Android局域网即时通讯软件,通过自建WiFi热点的方式与其他移动设备进行通信,实现了文字聊天、语音留言、文件互传等功能,满足基本的日常使用需求。 下载地址:http://www.devstore.…

局域网即时通讯软件_企业即时通讯软件需要符合哪些要求?

随着网络信息的发展,市面上出现了大量的企业即时通讯软件,旨在帮助企业打通信息化的道路。很多企业不知道该如何正确选择一款符合要求的通讯软件,选择的标准应该从哪些方面入手。下面企达小编为大家详细介绍一下。 1、数据安全性 企业的商业部…

局域网即时通讯软件_远程桌面监控软件好不好用?哪个好?

远程桌面监控软件好不好用?哪个好?有时候经常需要进行远程协助,大家第一时间想到的就是QQ远程协助了,没错,QQ可以,但是 QQ远程协助很卡顿,响应不及时。电脑自带应用不会设置,这可怎么办?超级眼远程监控软…

局域网即时通讯软件_做企业即时通讯软件,我们是认真的

协同办公无非分为外部沟通和内部沟通两种局势,内部沟通则是企业协同工作的一部分,注重效率;外部沟通为企业社交,注重便捷,从而实现内部沟通的高效性,是协同办公工具所要解决的基础性问题。真心特别羡慕那些…

局域网即时通信软件都有哪些?要如何选择?

近些年来,由于企业内部敏感信息通过即时通信软件和互联网泄露的事件频发,许多企业对于内部信息安全保护越来越重视。除了使用局域网环境办公以外,还会采用局域网即时通信软件来作为内部沟通工具,降低信息泄露的风险。那么局域网即…

c语言即时通讯软件源码,即时通讯软件源码-基于c语言即时通讯软件代码实现

我不知道哪种语言无关紧要。开源,我不知道该用什么。 即时通讯软件源代码为JAVA语言 对于即时通讯软件源代码最好是用C语言编写的,想学一下,感谢您即时通讯软件有什么。 includewinscock2、h# includewinscock2、h# includesting。h# includewindows。h# includePROCESS。h#…

基于Qt的局域网即时通讯软件

以前写的一篇日志,不小心删了,竟然没得恢复。万恶的CSDN,重排版。 第一个写的软件。基本上还是很粗糙,而且代码也大多不是自己写的,不过也着实让我过了一把瘾。接下来简单地讲讲整个过程和学到的东西吧。 首先是软件的…

企业的财务部门为什么要用内网即时通讯软件

1、内网即时通讯可以提高内部沟通效率 财务部是企业中一个非常重要的部门,与其他部门进行沟通协调的频率非常高。使用内网即时通讯可以快速方便地与其他部门沟通,帮助快速解决问题。 2、内网即时通讯更加安全 财务部的工作涉及到财务数据,需…

Python 局域网即时通讯工具

刚刚接触Python, 小白一个 为了学习Python, 所以试着写了一个局域网聊天的小工具 如果代码有什么问题,希望大家能给予指正,非常感谢 源代码连接(GitHub)已生成EXE文件,可在Windows下直接运行。Python 版本 3.7.3GUI编程,需要安装…

为什么企业选择局域网即时通讯软件?局域网即时通讯软件哪家好?

在当今互联网普及的时代,企业内部的沟通对企业管理有着非常重要的意义,即时通讯软件已成为企业工作中广泛采用的沟通工具。 然而,随着企业内部敏感信息通过互联网泄露的频繁发生,例如在工作期间,企业员工自发地频繁使…

企业局域网即时通讯软件存在是必然趋势

自从21世纪以来,经济全球化趋势越来越明显,尤其是发展中国家。我国经济发展更是迅猛,各行各业之间的竞争也是日益激烈。 如果不想被飞速发展的社会淘汰,现代企业就必须以最快的速度应对复杂又变化莫测的市场环境。企业内部的沟通对…

企业选择局域网即时通讯软件的必要性是什么?

在互联网时代,很多企业不断进行数字化升级,想要摆脱沟通麻烦、流程复杂、资源利用率低的传统办公模式,推进线上办公或远程办公信息化建设,而这就离不开我们常说的“即时通讯软件”来进行连接。 那什么是即使通讯软件呢&#xff1f…

局域网即时通讯软件可以保护数据安全吗?

根据调查显示,出于安全考虑,现在很多企业已禁止使用个人即时通讯软件。因为个人通讯软件缺乏完善安全机制,容易出现内部资料泄漏问题。只有安全的通讯软件—局域网即时通讯软件才能提高企业工作效率,增强员工协同办公能力&#xf…

局域网即时通讯软件_什么样的企业即时通讯软件好用?应该如何选择?

企业即时通讯是目前最为流行的通讯方式,市场上的即时通讯软件层出不穷,种类繁多,我们一时也不知道怎么选择。为了方便企业更好的选择即时通讯软件,我对目前市面上的一些即时通讯软件进行了分类和总结,希望对大家有帮助…

局域网即时通讯软件应该怎么选择

现在,国内外做即时通讯软件的公司很多,产品也是多种多样。在国内,数得上名字的有腾讯QQ,微信,新浪UC,网易泡泡等等,国外比较排的上名的有著名的MSN以及跨平台Gaim等。这几种即时通讯软件都是需要…

局域网即时通讯软件怎么部署

如今,国家经济体系正逐渐完善中,科技领域也处于高速发展阶段,各企业都在加快内部工作节奏,以求获取更好的发展机会。以前企业内部通讯系统往往是电话、电子邮件等传统方式,这些方式往往需要等待很长时间才能得到回复&a…

如何部署局域网即时通讯软件

如今,国家经济体系正逐渐完善中,科技领域也处于高速发展阶段,各企业都在加快内部工作节奏,以求获取更好的发展机会。以前企业内部通讯系统往往是电话、电子邮件等传统方式,这些方式往往需要等待很长时间才能得到回复&a…

内网沟通软件都有哪些?

近些年来,互联网的迅速发展,给人们的生活和工作带来了许多便利性,但却给企业带来了一个问题,信息泄露。由于企业内部敏感信息通过互联网的泄露的事件频发,不少企业只能转用内网环境办公,企业内部原本的互联…

局域网即时聊天工具都有哪些?

在互联网普及的今天,使用即时聊天工具沟通交流在人们的日常生活和工作当中已经十分普及。但由于企业内部敏感信息通过互联网泄露的现象频发,不少企业出于安全性考虑只能转用局域网环境办公,在转用局域网环境办公后也只能使用局域网即时聊天工…