10.可视化、可视分析、探索式数据分析

article/2025/5/9 13:42:52

前言:基于人大的《数据科学概论》第十章。主要内容为可视化的定义、可视化的意义、可视化的一般过程、科学可视化与信息可视化、可视化的原则、可视化实例、可视化的挑战和趋势、可视分析技术、探索式数据分析、可视化工具。

一、可视化的定义

可视化是数据的可视表现形式以及交互技术的总称。

它通过图形化的方式把数据给表现出来,方便用户进行观察和理解,并且帮助用户对数据进行探索、发现数据里面隐藏的模式,获得对数据的洞察力和理解。

二、可视化的意义

某些事物,用文字/数字来表达,相当地繁琐,但是用图形来表现,则更加容易把握和理解。

在大数据时代,数据来源多样,数据的规模巨大,可视化技术可以帮助我们对数据进行观察、理解、探索和发现。

三、可视化的一般过程

过滤,映射,渲染,交互

  1. 过滤,(Filtering)是选取原始数据集的一部分进行可视化。
  2. 映射,(Mapping)是指将抽象数据,转换为可视化表示的过程。
  3. 渲染,(Rendering)是通过图形渲染库和显示卡的帮助,把经过映射的数据,以二维或者三维图形的形式绘制出来。
  4. 交互,(Interaction)是指计算机对用户的某种特定动作,做出反应。比如,计算机可以识别用户的手势,适时地改变渲染的效果。

映射交互两个环节是达成这个目标的关键。

四、科学可视化与信息可视化

目前,可视化领域包括三个主要的分支,分别是科学可视化信息可视化、以及可视分析等。

五、可视化的原则

可视化的目的,是把复杂数据有效地展示出来,首要的原则是准确清晰

  • 准确是指可视化结果反映的是数据的本来面目或者本质
  • 清晰是指可视化结果,所表达的含义要明确。

此外,还要尽量做到

  1. 在更小的空间里,用最少的图形,在最短的时间里,传达给用户最多的信息。对数据进行合理简化,突出重点。
  2. 可视化的结果,需要阐明事物之间的相互关系,以及事物的变化趋势,对于类似的事物要方便用户进行比较。
  3. 使用用户熟悉的事物,对需要比较的数据进行比较
  4. 在可视化设计过程中,要考虑把交互方式和动画效果加进去。动画效果可以从时间和空间维度对事物的发展变化过程进行刻画,以便给用户创造沉浸式的体验。

六、可视化实例

散点图、直方图、线图、柱状图、饼图、树状结构、圆锥树、信息立方体、堆叠的河流、景区热力图、高维数据可视化、高维数据可视化。

七、可视化的挑战和趋势

  • 海量的异构数据的可视化,对算法设计和硬件基础设施,都提出了更高的要求。
  • 各种新硬件被应用到可视化领域,可视化系统将支持更高的显示分辨率
  • 可视化技术被应用到更多的业务领域
  • 可视化技术支持更多样的数据的可视化
  • 新的研究热点,是基于可视化、以及可视化分析结果,进行叙事,将一个故事,并且把故事讲完整、讲精彩
  • 可视化软件提供更加强大的可视化分析能力

八、可视分析技术

可视分析包括三个要素

  • 数据(Data),数据是所有可视化分析的基础
  • 模型(Model),包括统计模型、以及机器学习、数据挖掘模型。
  • 利用可视化(Visualization),探索数据中变量之间的关系。

在这里插入图片描述

可视分析包括三个回路:

  • 探索回路,描述分析者如何和可视化分析系统进行交互,目的是生成新的可视化结果或者调整模型,并且据此对数据进行分析。涉及动作发现
  • 验证回路,包括洞察和假设。
  • 产生新知识回路,分析者为某个假设寻找证据,或者从数据中学习到新的知识。从证据到知识,需要一个推理的过程。

九、探索式数据分析

所谓探索式数据分析,是指对已有的数据,在尽量少的先验假定情况下进行探索,逐步了解数据的特点。

当我们对数据的内在特点、它包含的信息,没有足够经验,不知道应用用什么统计分析、数据挖掘、机器学习方法进行分析时,探索式数据分析是一种有效的分析方式。

在探索式数据分析中对高维数据进行降维

降维,是把数据或特征的维数降低,一般分为线性降维、和非线性降维。

降维的方法有:主成分分析、线性判别分析、多维尺度分析等。

十、可视化工具

  • D3.js

  • Matplotlib

  • Prefuse

降维。

降维的方法有:主成分分析、线性判别分析、多维尺度分析等。

十、可视化工具

  • D3.js

  • Matplotlib

  • Prefuse

文章来源:https://blog.csdn.net/weixin_48931875/article/details/112118504
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://chatgpt.dhexx.cn/article/IpeIy3Ee.shtml

相关文章

国内外大数据可视化分析产品点评

一、KINETICA Kinetica 利用图像处理芯片提供计算支持,允许企业使用机器学习,商业智能分析和可视化技术更快速地分析海量数据; 点评:它的核心技术能力是类MapD的GPU数据库,功能性能较强大,非开源&#xf…

数据分析可视化之模型介绍

一 前言 “数据分析可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。 数据分析可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。 数据可视化已经提出了许多方法&…

5个最受欢迎的大数据可视化软件

数据可视化的本质是视觉对话,数据可视化将数据分析技术与图形技术结合,清晰有效地将分析结果信息进行解读和传达。 大数据可视化是进行各种大数据分析解决的最重要组成部分之一。 一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了…

软件架构-可视化

软件架构-可视化 当我们在讨论系统时,往往都会说这个系统的架构是什么样的,在你口述的同时,如果能借助某些图表,效果会更好,传统的uml建模比较复杂,目前的软件工程大家更关注效率(这里我不谈敏捷…

48 款数据可视化分析工具大集合

作者:DC君 来源:DataCastle数据城堡 本篇专门推荐48款数据可视化工具,全到你无法想象。 1、Excel 作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上…

爬取某小说榜单爬虫及可视化分析

爬取某小说榜单爬虫及可视化分析(仅用于学习) gitee代码链接:https://gitee.com/huang_jia_son/duoduo.git 介绍 GUI界面python爬虫数据清洗与处理pyecharts可视化展示软件架构 (1)通过tkinter制作GUI界面&#xf…

咖啡PowerBI可视化实例

目录 一、导入数据 二、构建指标 1、构架表之间的关系 ​ 2、完善表 3、构建指标 三、可视化 1、整体分析 2、省份业务 3、产品维度 4、地区维度 5、客户维度 6、价格分析 7、利润分析 8、其它分析 一、导入数据 二、构建指标 1、构架表之间的关系 软件会…

CodeScene - 软件质量可视化工具

CodeScene - 软件质量可视化工具 CodeScene https://codescene.com/ https://codescene.io/ The powerful visualization tool using Predictive Analytics to find hidden risks and social patterns in your code. 使用 Predictive Analytics 的功能强大的可视化工具&#x…

使用excel、python、tableau对招聘数据进行数据处理及可视化分析

招聘数据数据分析及可视化 数据来源前言一、观察数据删除重复值数据加工 二、利用python进行数据分析和可视化1.引入库2.读入数据观察描述统计,了解数据大概信息 3.数据预处理3.1数据清洗3.1.1 删除重复值3.1.2缺失值处理 3.2数据加工 4.数据可视化4.1城市岗位数量4…

可视化工具软件排行榜

市面上的数据可视化工具软件如此之多,有哪些可视化软件工具居于排行榜单的前列呢?你用的软件上榜了吗? 1、FineBI 来自帆软公司,虽作一个BI工具,但是可视化效果不错,可制作Dashboard。优势在于一旦准备好…

2020年六十款数据分析的可视化工具推荐

今天小编将为大家盘点六十款数据分析的可视化工具,让你妥妥的成为会议室乃至全公司最亮的崽~ 1、ChartBlocks ChartBlocks是一款网页版的可视化图表生成工具,在线使用。通过导入电子表格或者数据库来构建可视化图表。整个过程可以在图表的向导指示下完成。它的图表在HTML…

值得推荐的13款可视化软件,快收藏!

数据可视化力求用图表结合的方式把所有的数据整合在某一图像上,这样呈现在观众眼前的画面不仅仅是美观,且比以往长篇大论或是密密麻麻的数据表格更直观易懂,更便于观察分析。到今年上半年为止,国内外已经有了很多发展的较好的数据…

深入分析ArrayMap

前面我们分析了Android为了节省内存提供的一个HahMap<Integer, ?>的替代品SparseArray。SparseArray只能替代key的类型为int的Map。Android也提供了一个key不用局限于int的Map的实现&#xff0c;ArrayMap。老规矩我们通过调试来深入的分析一下ArrayMap&#xff08;看本文…

ArrayMAP介绍

它不是一个适应大数据的数据结构&#xff0c;相比传统的HashMap速度要慢&#xff0c;因为查找方法是二分法&#xff0c;并且当你删除或者添加数据时&#xff0c;会对空间重新调整&#xff0c;在使用大量数据时&#xff0c;效率并不明显&#xff0c;低于50%。 ArrayMap is a ge…

Android特别的数据结构(二)ArrayMap源码解析

1. 数据结构 public final class ArrayMap<K,V> implements Map<K,V> 由两个数组组成&#xff0c;一个int[] mHashes用来存放Key的hash值&#xff0c;一个Object[] mArrays用来连续存放成对的Key和ValuemHashes数组按非严格升序排列初始默认容量为0减容&#xff…

ArrayMap 源码的详细解析

最近在写framework层的系统服务&#xff0c;发现Android 12中用来去重注册监听的map都是用的ArrayMap&#xff0c;因此仔细研究了ArrayMap的原理。 目录 一. ArrayMap概述 二. ArrayMap源码解析 1.主要包含的成员变量 2.构造函数 3. public boolean containsKey(Object ke…

SparseArray和ArrayMap

首先我们来介绍一下HashMap&#xff0c;了解它的优缺点&#xff0c;然后再对比一下其他的数据结构以及为什么要替代它。 HashMap HashMap是由数组单向链表的方式组成的&#xff0c;初始大小是16&#xff08;2的4次方&#xff09;&#xff0c;首次put的时候&#xff0c;才会真…

SparseArray与ArrayMap

SparseArray SparseArray核心代码 两个构造函数默认数组容量10 public SparseArray() {this(10); } public SparseArray(int initialCapacity) {if (initialCapacity 0) {mKeys EmptyArray.INT;mValues EmptyArray.OBJECT;} else {mValues ArrayUtils.newUnpaddedObjectA…

arraymap android,深入剖析 Android中的 ArrayMap

数据集合在任何一门编程语言中都是很重要的一部分&#xff0c;在 Android 开发中&#xff0c;我们会实用到ArrayList, LinkedList, HashMap等。其中HashMap是用来处理键值对需求的常用集合。 而Android中引入了一个新的集合&#xff0c;叫做ArrayMap&#xff0c;为键值对存储需…

ArrayMap 笔记整理

源码基于 API 25 主要参考文章&#xff1a;面试必备&#xff1a;ArrayMap源码解析 1、概述 截图自&#xff1a;面试必备&#xff1a;ArrayMap源码解析 在开始讲解源码之前&#xff0c;需要说明 ArrayMap 的底层实现结构&#xff0c;即两个数组&#xff1a; int[] mHashes; /…