【独家】一文读懂数据可视化

article/2025/10/1 4:03:41

前言


数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。


早期的数据可视化作为咨询机构、金融企业的专业工具,其应用领域较为单一,应用形态较为保守。步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合、挖掘、分析、可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图、气泡图、树图、仪表盘等各式图形。表现之二是可用的开发工具越来越丰富,从专业的数据库/财务软件,扩展到基于各类编程语言的可视化库,相应的应用门槛也越来越低。


数据可视化,不仅仅是统计图表。本质上,任何能够借助于图形的方式展示事物原理、规律、逻辑的方法都叫数据可视化。


数据可视化不仅是一门包含各种算法的技术, 还是一个具有方法论的学科。一般而言,完整的可视化流程包括以下内容:


  • 可视化输入:包括可视化任务的描述,数据的来源与用途,数据的基本属性、概念模型等;

  • 可视化处理:对输入的数据进行各种算法加工,包括数据清洗、筛选、降维、聚类等操作,并将数据与视觉编码进行映射;

  • 可视化输出:基于视觉原理和任务特性,选择合理的生成工具和方法,生成可视化作品。


640?wx_fmt=png&wxfrom=5&wx_lazy=1


实际上,从“数据可视化”的命名,便很容易看出数据可视化从业者如何开始可视化设计,那便是:处理数据,设计视觉,完成从数据空间到可视空间的映射, 必要时重复数据处理和图形绘制的循环组合。


1. 分析数据


首先,我们需要对数据做一个全面而细致的解读,数据的特点决定着可视化的设计原则。每项数据都有特定的属性(或称特征、维度)和对应的值,一组属性构成特征列表。按照属性的类型,数据可以分为数值型、有序型、类别型,数值型又可以进一步分为固定零点和非固定零点。其中,固定零点数据囊括了我们大多数的数据对象,它们都可以对应到数轴上的某个点;非固定零点主要包括以数值表示的特定含义,如表示地理信息的经纬度、表示日期的年月日等,在分析非固定零点数据时,我们更在意的是它们的区间。


在对数据做过预处理和分析之后,我们就能够观察出待处理数据的分布和维度,再结合业务逻辑和可视化目标,有可能还要对数据做某些变换,这些变换包括:


  • 标准化,常用的手段包括(0,1)标准化或(-1,1)标准化,分别对应的是sigmoid函数和tanh函数,这么做的目的在于使数据合法和美观,但在这一过程中可能丢失影响数据分布、维度、趋势的信息,应该予以特别注意;

  • 拟合/平滑,为表现数据变化趋势,使受众对数据发展有所预测,我们会引入回归来对数据进行拟合,以达到减少噪音,凸显数据趋势的目的;

  • 采样,有些情况下,数据点过多,以至于不易可视化或者影响视觉体验,我们会使用随机采样的方法抽取部分数据点,抽样结果与全集近似分布,同时不影响可视化元素的对比或趋势;

  • 降维,一般而言,同一可视化图表中能够承载的维度有限(很难超过3个维度),必须对整个数据集进行降维处理。


2. 可视化设计


在开始设计之前,我们需要对人类视觉以及注意力作简要分析,这决定着我们如何在第一时间抓住受众的注意力。


人类视觉感知到心理认知的过程要经过信息的获取、分析、归纳、解码、储存、概念、提取、使用等一系列加工阶段,每个阶段需要不同的人体组织和器官参与。简单来讲,人类视觉的特点是:


  • 对亮度、运动、差异更敏感,对红色相对于其他颜色更为敏感;

  • 对于具备某些特点的视觉元素具备很强的“脑补”能力,比如空间距离较近的点往往被认为具有某些共同的特点;

  • 对眼球中心正面物体的分辨率更高,这是由于人类晶状体中心区域锥体细胞分布最为密集;

  • 人们在观察事物时习惯于将具有某种方向上的趋势的物体视为连续物体;

  • 人们习惯于使用“经验”去感知事物整体,而忽略局部信息。


这里引入一个概念——可视编码,它数据信息映射为可视化元素的技术,其通常具有表达直观、易于理解和记忆的特性。数据包含属性和值,相应可视编码也由两部分组成:标记和视觉通道,标记代表数据属性的分类,视觉通道表示人眼所能看到的各种元素的属性,包括大小、形状、颜色等,往往用来展示属性的定量信息。例如,对于柱状图而言,标记就是矩形,视觉通道就是矩形的颜色、高度或宽度等。


数据可视化的设计目标和制作原则在于信、达、雅,即一要精准展现数据的差异、趋势、规律,二要准确传递核心思想,三要简洁美观,不携带冗余信息。结合人的视觉特点,很容易总结出好的数据可视化作品的基本特征:


  • 让用户的视线聚焦在可视化结果中最重要的部分;

  • 对于有对比需求的数据,使用亮度、大小、形状来进行编码更佳;

  • 使用尽量少的视觉通道编码数据,避免干扰信息。


3. 可视编码的选择


如同只学过视听语言并不能设计出可用的电影分镜一样,数据可视化这一艺术设计色彩浓厚的工作绝非做过几个饼图、柱状图就能胜任。在开始涉足实践讲解之前,我们需要解决以下疑问: 


可视化设计中优先选择哪些视觉通道?有多少种视觉通道可供使用?某个视觉通道能编码什么信息,能包含多少信息量?视觉通道表达信息能力的区别?哪些视觉通道互不相关


http://chatgpt.dhexx.cn/article/rlheSqhJ.shtml

相关文章

4.2 数据可视化

一、 数据可视化介绍 1. 概念 数据可视化:是指以 图形、图像、地图、动画 等更为生动、易于理解的方式展现具体数据,诠释数据之间的关系和发展的趋势,以期更好地理解和使用数据。 大数据可视化分析利用支持信息可视化的用户界面以及支持分…

一图胜千言!这10种可视化技术你必须知道

全文共4549字,预计学习时长9分钟 图片来源:Willian Justen deVasconcellos on Unsplash 相比于浩如烟海的数据表格,大部分人还是更喜欢视觉资料,这一点已不足为奇。也是出于这个原因,人们通常才会在学术论文的前几页加上一张图表,并且清楚地标记上各种注释。 当数据科学家…

谷歌浏览器输入网址显示该网页无法正常运作

谷歌浏览器 是一款大家喜爱使用的浏览器,它为我们的生活提供了便捷, 可是,不少朋友还不知道怎么解决谷歌浏览器无法打开网页的问题 具体如下: 首先,请大家找到电脑中的“谷歌浏览器”,点击进入主界面&…

谷歌浏览器无法上网,其他浏览器正常,换chrome搜索引擎

谷歌浏览器无法上网,其他浏览器正常,第一种情况:打开代理设置,开启自动检测设置,重新打卡浏览器 情况二:打开windows注册表,删除配置,重启浏览器不废话,上图 情况三&…

chrome谷歌浏览器通过小米路由器访问网页一会儿后显示:无法访问Internet

近一个月,出现了chrome浏览器国内的网页也没法打开了,使用其他浏览器就能正常使用,比如:Edge。 家里宽带上使用的是小米路由器,用chrome访问网站出现如下截图: 经过网上查找相关资料,结合实践配…

一招搞定谷歌搜索、谷歌学术无法訪问的问题

近期,谷歌搜索、谷歌学术“突然”无法訪问了?我百思不得其解啊,禁不住想问一下:前辈们。你们这是要如何?我们写个论文easy吗?怒火燃尽,言归正传,事实上要解决问题也是非常easy的,原理不赘述。直接上菜。下面谨代表个人意见,大仙们有好的方法记得留言共享讨论。谢谢。…

解决Chrome中打不开Google搜索结果链接

由于Google的搜索结果都要经过Google跳转(Safari上视乎没有跳转,可以直接进入结果页面),默认跳转使用未加密的HTTP连接,经常被我国GFW拦截,导致无法打开Google搜索结果! 解决办法是,…

关于chrome浏览器地址和不能搜索访问的问题

正版的chrome浏览器地址 这里别下载错,我就是重装电脑之后下载chrome浏览器然后发现是盗版本的。正版地址:https://www.google.cn/intl/zh-CN/chrome/ 浏览器默认下载地址最好改为除C盘以外的盘,避免C盘以后爆满,在设置里面改。 不能搜索…

Google chrome谷歌浏览器,打开后是百度搜索或其他搜索怎么办?

如果遇到Google浏览器打开后是百度或者其他浏览器,说明我们在谷歌浏览器的设置有问题,只需要下面简单的操作就可以完成替换。 setting-on start-open a specific page or set of a page,在下面的框中手动敲入www.google.com就欧克了

搜索引擎突然无法访问问题

1.winR键运行 2.输入 inetcpl.cpl 打开 3.点击上方的高级 点击下面重置 勾选删除个人配置 4.最后重启

实用技巧:Google 搜索打不开的解决方法【图文教程】

很多人都喜欢用 Google 搜索,但自从 Google 服务器搬离中国大陆后,大陆用户用 Google 搜索时会自动跳转到 google.com.hk,不仅莫名其妙的关键字被过滤,而且经常出现“无法显示此网页”,相当悲催。 大家比较熟悉的解决方…

股票机械交易系统

最近有一个想法就是开发一个股票机械的交易系统,利用网格法去操作,没有半点人的感情。大家有什么想法可以和我交流,也可以提出您的宝贵意见。

Python +Echarts +PyQt5设计股票期货自动交易系统 一、软件界面设计

效果图: 1、python下 使用Qt Designer创建一个窗体 这里选择创建Main Window窗体 得到可视化可编辑窗体。 2、创建布局 每个界面采用Frame控件进行布局,以方便后期显示与隐藏,整体布局中将左侧与顶部位置空出来用于插入侧边菜单栏和顶栏。

Python +Echarts +PyQt5设计股票期货自动交易系统 二、软件界面响应(一)

Python +Echarts +PyQt5设计股票期货自动交易系统 二、软件界面响应 效果图: 上一章《 Python +Echarts +PyQt5设计股票期货自动交易系统 一、软件界面设计 》中我们进行了基本的界面样式、布局、和基础内容设计,其中布局部分包含了四大模块,即: 1、行情模块 (1)、行…

金融信息化及交易管理系统(股票交易系统APP)

目 录 1 绪 论 1 1.1 选题背景及意义 1 1.2 研究现状 1 1.3 研究主要内容 4 2 需求分析与实施方案 5 2.1 虚拟金融信息化交易系统的功能 5 2.2 可行性分析 5 2.3 系统开发技术 5 2.4 系统开发工具及环境 6 2.5 系统开发方式 7 3 需求分析 8 3.1 系统结构 8 3.2 系统描述 9 3.2.…

同花顺股票自动交易

本文转载自: http://www.cnblogs.com/lovebanyi/archive/2012/01/17/2324997.html 作者:lovebanyi 转载请注明该声明。 由于大部分的券商没有提供交易接口。只对顶级的一些机构或大公司提供接口。所以普通的股民大部分是没有办法享受到一些自动化交易的…

A股全自动化交易——从零到实盘20(完结)

本文是“从零到实盘”系列的最后一篇文章,将介绍实现全自动实盘交易的最后一个步骤,即实现定时更新股票数据任务。 schedule模块安装 我们使用schedule来实现定时任务,首先需要安装schedule模块,在终端中输入以下命令安装&#…

自动交易股票接口开发的关键是什么?

小编认为自动交易股票接口软件的开发的关键是要知道券商的股票交易接口,但是出于安全的考虑,券商对外是不公开股票交易接口。但是我们自己是无法开发股票自动交易软件的开发。不过,现在很多券商都提供了证券独立委托系统。如果我们利用券商都…

股票实盘交易接口怎样实现自动交易过程?

目前随着国内二级股市已处于相对较高的水平,但是对于高净值的用户来说,在量化投资市场上使用股票实盘交易接口具有低波动性和自动交易的定量对冲投资模型体系,包括了一些高性价比、大型基金和长期投资的资产品种,所以大家在选择股…

股票量化自动交易软件下单原则条件

股票量化自动交易软件下单原则条件是一系列的买卖方式,将常见的技术指标写入销售模式,为用户提供自动化的交易服务。如果技术指标已经研究,这些指标已经成为你交易中的一个或全部决策因素,但由于各种主观和客观因素,你…