《大数据原理与应用》林子雨:一. 大数据基础

article/2025/9/24 6:01:16

《大数据原理与应用》林子雨:一. 大数据基础

思维导图

在这里插入图片描述

PS:边学边记

重点: 理解大数据的概念及其处理架构Hadoop
难点: 掌握大数据处理架构Hadoop的安装与使用方法

第1章 大数据概述

1.1 大数据时代

1.1.1  三次信息化浪潮IBM前首席执行官郭士纳的观点:IT领域每隔15年就会迎来一次重大变革**第一次浪潮**
时间:1980年左右 
标志:个人计算机 
解决问题:信息处理 
代表企业:intel,AMD,IBM,苹果,微软,联想,戴尔,惠普等**第二次浪潮**
时间:1995年左右 
标志:互联网 
解决问题:信息传输 
代表企业:雅虎,谷歌,阿里巴巴,百度,腾讯等**第三次浪潮**
时间:2010年左右 
标志:物联网,云计算,大数据 
解决问题:信息爆炸 
代表企业:亚马逊,谷歌,IBM,VMWare,Palantir,Hortonworks,Cloudera,阿里云等

1.1.2 信息科技为大数据时代提供技术支撑

信息科技需要解决的三个核心问题: **信息存储、信息传输、信息处理**

存储设备容量不断增加
CPU处理能力大幅提升
网络带宽不断增加

1.1.3 数据产生方式的变革促成大数据时代的来临

数据是构成信息的基本单位,比如:数字、文字、图像、声音等,被称为“未来的石油”1、运营式系统阶段;2、用户原创内容阶段;3、感知式系统阶段

数据产生方式的变革

1.1.4 大数据的发展历程

大数据发展的3个阶段

1.2大数据的概念

什么是大数据?
4V:数据量大(volume)、数据类型繁多(variety)、处理速度快(velocity)、价值密度低(value)

1.3大数据的影响

**科学研究:**
科研范式:实验、理论、计算、数据(第四范式)
**思维方式:**
大数据的三大显著特征:全样而非抽样、效率而非精确、相关而非因果
**社会发展:**
新的决策方式:大数据决策
**就业市场:**
数据科学家——热门人才
**人才培养:**
改变我国高校信息技术相关专业现有科研及教学体制

1.4大数据的应用

互联网
生物医学
物流等

1.5大数据的关键技术

数据采集
数据储存与管理
数据处理与分析
数据隐私与安全

1.6大数据计算模式

批处理计算
流计算
图计算
查询分析计算

1.7大数据产业

IT基础设施层
数据源层
数据管理层
数据分析层
数据平台层
数据应用层

1.8大数据与云计算、物联网

云计算
物联网
三者的联系

第2章 大数据处理架构Hadoop

Hadoop概述
Hadoop生态系统
Hadoop的安装与使用
实验1:Hadoop安装

大数据存储与管理

分布式文件系统

分布式数据库HBase

NoSQL数据库

云数据库

大数据处理与分析

MapReduce

Hadoop再深讨

Spark

流计算

图计算

数据可视化

大数据应用

大数据在互联网领域的应用

大数据在生物医学领域的应用

大数据的其他应用


http://chatgpt.dhexx.cn/article/JX3WS3Yr.shtml

相关文章

大数据技术原理与应用——期末复习

大数据技术原理与应用 大数据技术原理与应用第一章 大数据概述1、大数据的4v特征2、大数据的影响3、大数据的两大核心技术4、大数据计算模式及代表产品5、大数据与云计算、物联网的关系 第二章 大数据处理架构Hadoop1、Hadoop的发展历史2、Hadoop的特性3、Hadoop1.0与Hadoop2.0…

大数据生态与Spark简介

大数据技术概述 一,大数据时代 三次信息化浪潮: IT领域每个十五年就会发生一次重大变革。 信息科技为大数据时代提供技术支持:存储设备容量不断增加CPU处理能力大幅度提升网络带宽不断增加二,大数据概念 大数据不仅仅是数据的“大量化”,而是包含“快速化”,“多样化”,…

大数据与云计算期末复习

大数据与云计算期末复习 文章目录 大数据与云计算期末复习练习一选择题填空题 练习二选择题 练习三选择题 练习四思考题 练习五选择题填空题判断题简答题 练习六(详情见学习通PPT)简答题论述题 练习七单选题多选题 练习八第七章 大数据安全一、单选题二、…

大数据技术原理与应用笔记

参考: 课程教学(林子雨老师) 程序羊大数据学习路线 HDFS入门 Hbase入门 NoSql入门 文章目录 一、大数据概述1.1大数据时代1.2大数据的概念和影响1.3大数据的应用1.4大数据的关键技术1.5大数据,物联网和云计算1.5.1 云计算1.5.2物联网 检测题 …

大数据与Hadoop

大数据与Hadoop 目录 大数据与Hadoop1、大数据1.1、大数据时代1.2 大数据概念1.3 大数据的影响1.4 大数据的应用1.5 大数据关键技术1.6 大数据计算模式1.7 大数据产业1.8 大数据与云计算、物联网的关系1.8.1、云计算1.8.2、物联网1.8.3、关系 2、hadoop概述2.1 Hadoop简介2.2 H…

大数据时代,我们应该具有怎样的思维方式?

《飘》、《汤姆叔叔的小屋》之类的小说和故事在全社会激起的是强烈的“情感”共鸣,和故事相比,数据没有情节,它仅代表客观事实,数据激发的,更多的是理性思考。作为理性的人类,我们不会仅仅满足于感情的宣泄…

互联网思维PK大数据思维

我们在O2O时代做营销,到底哪种趋势和战略更加有效?这里有两种不同的思维方式,一个是互联网思维,另一个是大数据思维。 互联网思维与大数据思维有交集但又不重合。目前热炒的互联网营销案例,基本上剥离了大数据,更多是…

大数据与统计新思维

对大数据的初步认识 到底什么是大数据,不同的学科领域、不同行业的从业人员肯定会有不同的理解。与传统意义上的数据相比,大数据的“大”与“数据”都有了新的含义,绝不仅仅是体量的问题,更重要的是数据的内涵问题。或许&#xff…

大数据决策支持的优势

结合这学期的“决策支持系统”课程的课堂作业对"大数据决策支持的优势"有了更深的理解,整理内容如下: 结合大数据的5V特征:Volume (大量)、Velocity (高速)、Variety (多样)、Veracity (真实性)、Value (价值),我认为其…

一个人有没有大数据思维,主要体现在哪两个方面?

第一他是不是具有定量化的思维方式:就是我们现在看很多问题习惯从经验、定性地角度看问题,不习惯所有的决策都用定量化的方式来进行描述。例如我们经常说一个人漂亮,说一个人好,但是我们不习惯用一套图像识别的算法来真正计算这个…

【大数据】大数据思维的十大核心原理

感谢博主,转自:https://blog.csdn.net/supermapsupport/article/details/78741774 一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。hadoop体系的分布式计…

大数据思维与数据驱动

大数据的核心:实现商业价值 大数据的本质:消除一切不确定性 一:大数据的概念 时代的发展变迁,单从互联网的角度来讲,从最初的IBM巨型机到后来的单机时代,在到后来家家户户都拥有了PC机,笔者就…

大数据思维与技术——中国大学MOOC课程笔记

大数据思维与技术——中国大学MOOC课程笔记 第一章 大数据思维与技术认知 0 一些例子 总之 大数据分析现在已经存在于方方面面。但事实上,其首次提出仅仅是20世纪90年代,而直到2011年6月,美国麦肯锡全球研究院发布了题为《大数据&#xff1…

数据驱动决策的10种思维方式

很多人都说会数据分析的人比别人聪明,实际上他们“聪明”在拥有分析思维,今天我们就来说说常见的数据分析思维。 以下10种数据分析思维可能不会瞬间升级你的思维模式,但说不定会为你以后的工作带来“灵光一闪”的感觉,请耐心读完&…

数据思维,让决策更精准

数据分析正在渗入到各行各业的商业活动中以及各种细小决策中,判断一个人了是否有数据思维,最核心的因素是看他有没有通过数据分析做决策的习惯。 一个合格的数据分析师要掌握各种数据分析模型和算法以及熟悉SAS、R、Python等统计工具。有些人可能会说&am…

大数据决策的五个阶段

原创 HANSEN老师 汉森定理 2022-12-11 17:37 发表于北京 「配图摄影 by 汉森老师」 互联网和消费金融是大数据应用最为广泛的两个行业,产生了所谓大数据风控、大数据营销等细分领域。 大数据是指具有海量、高维、动态、多源、非结构化等特征的信息载体。本文所说…

变量foo 和 bar的由来

在计算机程序设计与计算机技术的相关文档中,术语foobar是一个常见的无名氏化名,常被作为“伪变量”使用。 单词“foobar”或分离的“foo”与“bar”常出现于程序设计的案例中,如同Hello World程序一样,它们常被用于向学习者介绍某…

转载:编程中常见的Foo,bar是什么意思

原始链接:编程中常见的Foo,是什么意思。。_xhmz的专栏-CSDN博客_foo是什么意思 编程中常见的Foo,是什么意思。。 xhmz 于 2014-07-28 13:08:34 发布 47963 收藏 66 分类专栏: 前端 文章标签: foo ​前端专栏收录该内容 8 篇文章0 订阅 …

2022-07-26

什么时候用Set,什么时候用List hashset与hashmap的区别 为什么使用线程?使用线程一般都是什么场景? 为什么使用线程池? 租户隔离? 权限控制? 拦截器? 为什么使用redis而不是本地缓存&am…

MATLAB破解版解决帮助文档需要许可证的问题

由于MATLAB是破解版的所以查看帮助文档时,总是需要关联许可证 一、点击"预设项" 二、按图示配置 ok,接下来就可以使用帮助文档了