文档介绍:数据可视化基础
内容提纲
可视化介绍
数据科学
高维数据可视化
什么是可视化?
定义[]
使某物、某事可见的动作或事实;对某个原本眼睛不可见的事物形成一副可感知的心理图片或视觉的过程或能力;一副因此而形成的图片.
绘制出可见图片的动作或过程.
可视化
通过使用电脑,对数据进行交互的可视表达以增强认知[Card, Mackinlay Shneiderman ’98]
通常被认为是一个生成图形图像的过程,实为认知过程
形成某个物体的感知图像
强化认知理解
可视化的目的是洞悉,而非图像
洞察:发现,决策,解释,分析,探索,学习
4
可视化的应用范围
数据分析技术
数据挖掘,数据库查询,机器学习
可视化尤擅于探索性数据的分析
不知道里面有什么
没有一个预先的探索假设
想知道存在那些疑问
I see what you’re saying 我明白你的意思
Seeing is believing 眼见为实
A picture is worth a thousand words 一图胜千言
5
为什么我们需要可视化
揭示想法和关系
形成论点或意见
观察事物演化的趋势
总结或积聚数据
存档、汇整
信赖、信任、求真
传播知识
探索性数据分析
为什么我们需要可视化
回答问题
做出决定
在上下文里看数据
扩充记忆和内存空间
支持图形化计算
寻找模式
展示论据
讲故事
激发智力和洞察力
可视化的三个功能
记录信息
成像、蓝图设计、…
支持对信息的推理和分析
过程与计算
数据推理
反馈与交互
信息传递
共享与说服
协作与修正
突出数据的重要部分
信息记录
绘图:月亮周期
伽利略于1616年关于月亮周期的绘图
信息记录
摄像:月亮周期