目前大数据技术平台有很多,主要可以分为哪几类?

article/2025/11/9 3:45:54

大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。对于互联网大数据而言,由于其具有独特完整的大数据特点,除了共性技术外,采集技术、结构化处理技术、隐私保护也非常突出。

大数据
  有很多算法和模型可以解决这些处理过程中的技术问题,并且为了最终用户的使用方便,它们大都被进一步的封装,形成了比较简单易用的操作平台。目前大数据技术平台有很多,归纳起来可以按照以下方式进行分类:

(1)从大数据处理的过程来分:包括数据存储、数据挖掘分析、以及为完成高效分析挖掘而设计的计算平台,它们完成数据采集、ETL、存储、结构化处理、挖掘、 分析、预测、应用等功能。

(2)从大数据处理的数据类型来划分:可以分为针对关系型数据、非关系型数据(图数据、文本数据、网络型数据等)、半结构化数据、混合类型数据处理的技术平台。

(3)从大数据处理的方式来划分:可以分为批量处理、实时处理、综合处理。其中批量数据是对成批数据进行一次性处理,而实时处理(流处理)对处理的延时有严格的要求,综合处理是指同时具备批量处理和实时处理两种方式。

(4)从平台对数据的部署方式看:可以分为基于内存的、基于磁盘的。前者在分布式系统内部的数据交换是在内存中进行,后者则是通过磁盘文件的方式。

此外,技术平台还有分布式、集中式之分,云环境和非云环境之分等。阿里云大数据平台构建在阿里云云计算基础设施之上,为用户提供了大数据存储、计算能力、大数据分析挖掘、以及输出展示等服务,用户可以容易地实现BI商业智能、人工智能服务,具备一站式数据应用能力。

不同的大数据技术平台提供了对这些处理过程的支持,有的平台可能会支持多个过程,但是侧重点也不同,支持的深度也有所不同,因此有必要熟悉各种平台的功能,并做出比较分析,以便在实际应用中选择适合于自己需求的技术平台。

选择一个合适的大数据技术平台是非常重要的,它能够使得大数据应用开发更加容易、让开发人员更集中精力在业务层面的数据分析与处理上。一些共性的基础问题,例如数据如何存储、如何检索、数据统计等,就可以由平台来完成。选择合适的大数据技术平台应当考虑以下因素:

(1)平台的功能与性能:由于不同平台侧重的功能不同,平台的性能也就有很多需要考察的方面。比如对于存储平台来说,数据的存储效率、读写效率、并发访问能力、对结构化与非结构化数据存储的支持,所提供的数据访问接口等方面就是比较重要的。对于大数据挖掘平台来说,所支持的挖掘算法、算法的封装程度、数据挖掘结果的展示能力、挖掘算法的时间和空间复杂度等,是比较重要的指标。

(2)平台的集成度:好的平台应该具有较高的集成度,为用户提供良好的操作界面,具有完善的帮助和使用手册、系统易于配置、移植性好。同时随着目前软件开源的趋势,开源平台有助于其版本的快速升级,尽快发现其中的bug,此外,开源的架构也比较容易进行扩展,植入更多的新算法,这对于最终用户而言也是比较重要的。

(3)是否符合技术发展趋势:大数据技术是当前发展和研究的热点,其最终将走向逐步成熟,可以预见在这个过程中,并非所有的技术平台都能生存下来。只有符合技术发展趋势的技术平台才会被用户、被技术开发人员所接受。因此,一些不支持分布式、集群计算的平台大概只能针对较小的数据量,侧重于对挖掘算法的验证。而与云计算、物联网、人工智能联系密切的技术平台将成为主流,是技术发展趋势。

当我们花很多时间去掌握熟悉某种技术平台后,可能新的更好的技术平台出现了,导致我们受累奔波于各种技术平台,因此,最好的策略就是全面系统地掌握大数据技术的原理和实现方案,这样学习新的技术平台就很容易上手。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
1.大数据时代,主要需要什么类型的人才?
http://www.duozhishidai.com/article-1554-1.html
2.对于大数据开发的学习,最经典的学习路线是什么?
http://www.duozhishidai.com/article-1544-1.html
3.Hadoop是什么,主要有哪几部分组成和Hadoop的影响力
http://www.duozhishidai.com/article-1152-1.html
4.大数据在各行业的应用和趋势
http://www.duozhishidai.com/article-477-1.html
5.大数据人才定义和分类
http://www.duozhishidai.com/article-405-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

http://chatgpt.dhexx.cn/article/AUHy5hVQ.shtml

相关文章

有哪些好的数据来源或者大数据平台?

分享下我自己平时收集的..共100多个O_O 网站分析类: 百度指数 - 以百度海量网民行为数据为基础的数据分享平台 Google趋势 - 了解 Google中热度上升的搜索 360指数 - 基于360搜索的大数据分享平台 Alexa - 网站排名 Google Analytics - Google出品,可…

大数据平台的软件有哪些?

查询引擎 一、Phoenix 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JDBC驱动。 Phoenix查询引擎会将SQL查询转换为一个或多个H…

[BigData]16家大数据分析平台

 对今天的企业来说,数据分析已经成为生死攸关的选择。我们分析一些著名的供应商,从Hadoop创业者到传统的数据库市场参与者。 革命 – 这个词汇十分准确地描述了我们所处的这个数据分析的时代。企业一方面紧紧握住大量不同类型的…

大数据网站汇总(数据搜集、大数据竞赛、)

一. 国家级大数据平台 1.1 国家大数据平台: 数据_中国政府网 (www.gov.cn) 1.2 司法大数据平台:中国司法大数据服务网 (court.gov.cn) 1.3 中国经济社会大数据研究平台:中国经济社会大数据研究平台 (cnki.net) 1.4 中国知网CNKI-总库&a…

linux cat命令的作用,Linux命令cat使用详解

cat命令功能: cat命令主要用来实现查看文件、创建文件、及合并、追加文件内容等功能。 cat命令主要参数: -n 或 –number:对输出文档的行数进行编号,从1开始。 -b 或 –number-nonblank:和 -n 功能相似,不同…

Windows 中使用 Linux 命令

如果要在 Windows 中运行 Linux 命令,那么 Cygwin 是一个推荐的工具。Cygwin 创建于 1995 年,旨在提供一个原生运行于 Windows 中的 POSIX 兼容环境。Cygwin 是由 Red Hat 员工和许多其他志愿者维护的自由开源软件。 二十年来,Windows 用户使…

设置 linux 命令别名

前言: 在操作 linux 的时候可能会碰到一些非常长的命令,这个命令平时用的比较频繁,每次输入执行感觉非常麻烦有木有。如果把一段长的命令设置成一个短的别名,是不是很方便? 1. alias 命令引入 找台 linux 机器执行一…

Linux命令之-telnet

使用telnet测试端口连通性 telnet命令是TELNET协议的用户接口,它支持两种模式:命令模式和会话模式,虽然telnet支持许多命令,但大部分情况下,我们只是使用它查看目标主机是否打开了某端口(默认是23&#xf…

Linux 命令执行流程

今天继续给大家介绍Linux基础知识,本文主要内容是Linux命令执行的流程,不仅介绍了当我们键入一个Linux命令时系统的执行流程,还介绍了Linux系统中内部命令与外部命令的区别、PATH环境变量的作用等等。 Linux的命令执行流程如下: 1…

Linux命令之sync

概述 sync 命令可以强制将内存中的文件缓冲写入磁盘,更新块信息。 在 linux/unix 系统中,在文件或数据处理过程中一般先放到内存缓冲区中,等到适当的时候再写入磁盘,以提高系统的运行效率。这样虽然可以提高磁盘写入数据的效率&a…

Linux命令:scp

目录 简介 一、语法 二、示例 2.1 将本地文件复制到远程主机目录 2.2 将本地目录复制到远程主机目录 2.3 将远程主机的文件复制到本机 2.4 复制远程主机目录到本机 简介 今天我们来介绍一个Linux命令:scp scp — secure copy (remote file copy program)&am…

使用node.js构建一个web服务器(适合自学)

使用node.js构建一个web服务器 先介绍node.js的安装,再介绍使用node.js构建一个简单的web服务器,最后通过一个简单的示例,演示网页与服务器之间的数据交互的实现。 WEB服务器 WEB服务器也称为WWW服务器。WWW(World Wide Web、翻译成中文&a…

node-php-server 游戏服务器框架

做游戏服务器8年多了,用过lua, 用过C, 用过nodejs ,最近用的是php,有些人会说php不是用在web开发吗,怎么能用在游戏服务器的业务逻辑开发,php 怎么跟客户端通信,肯定有很多人不解。 其实很多时候,技术原理都是都是相通…

如何快速用node在本地搭建一个服务器

众所周知,服务器是通过安装特殊的软件(或者运行特殊的代码)来提供网络服务的机器。那么我们的电脑可不可以弄成一个服务器,来供他人访问呢? 答案是可以的,这里我们需要安装一下node.js这个软件。传送门&am…

通过node启动服务器必须的会的几个命令

1 首先通过cd 目录 切换到当前目录下 2 通过node app.js 启动服务器(或者nodemon apo.js) 3 通过ctrl c来关闭服务器!

用node.js搭建自己的服务器

前提要点: 1、首先让我们了解一下什么是服务器和客户端吧! 服务器是提供网络服务的机器,通过安装特殊的软件(或者是运行某段特殊的代码)来提供服务。 客户端与服务器:提供服务的是服务器,享受服…

将node项目部署到云服务器详细教程 原创

前言: 需要有node项目,并且能在本地服务器成功运行成功 一、购买云服务器 云服务器种类很多,价格都差不多,我这里购买的是ecs计算型云服务器,配置2核4G5M的配置基本就可以运行项目。 服务器购买我选择的是ecs计算型…

node服务器项目部署 - (电影网站)

查看更多资源 一、域名解析 1.登录 阿里云 -> 域名解析 - > 域名 指向 二、本地文件启动端口 movie-server/app.js 增加var env process.env.NODE_ENV || development //获取当前环境变量 如没有 就为 开发模式var dbUrl mongodb://imooc_movie_runner:F**k9001$1…

linux(centOS)下搭建node服务器之一、 安装Node.js

本例系统环境:腾讯云 CentOS 7.4 64位 一、找相应node版本,复制链接 1. 打开网址 http://nodejs.cn/download/; 2. ctrlshifti(打开开发者工具) 如图: 二、登录腾讯云服务器,进入系统界面 三、用命令行下载node到服务器、解压文件…

使用node服务器简单启动本地项目

目录 一、使用node启动本地web服务器 1、使用express 1)项目安装express 2)app.js关键代码如下 3)启动服务 4)打开浏览器访问相应地址即可看到项目 2、使用 http-server 1)全局安装http-server 2&#xff09…