文档介绍:word
word
1 / 10
word
 阮一峰
"数据可视化"可以帮助用户理解数据,一直是热门方向。
图表是"数据可视化"的常用手段,其中又以根本图表----柱状图、折线图、饼图等等----最为常用。
用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合〔数据集〕?恐怕答得上来的人就不多了。
本文是电子书《Data Visualization with JavaScript》第一章的笔记,总结了六种根本图表的特点和适用场合,非常好地回答了上面的问题。
零、序言
进入正题之前,先纠正一种误解。
word
word
2 / 10
word
有人觉得,根本图表太简单、某某始,不高端,不大气,因此追求更复杂的图表。但是,越简单的图表,越容易理解,而快速易懂地理解数据,不正是"数据可视化"的最重要目的和最高追求吗?
所以,请不要小看这些根本图表。因为用户最熟悉它们,所以只要是适用的场合,就应该考虑优先使用。
一、柱状图〔Bar Chart〕
柱状图是最常见的图表,也最容易解读。
它的适用场合是二维数据集〔每个数据点包括两个值x和y〕,但只有一个维度需要比拟。年销售额就是二维数据,"年份"和"销售额"就是它的两个维度,但只需要比拟"销售额"这一个维度。
柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图的局限在于只适用中小规模的数据集。
通常来说,柱状图的X轴是时间维,用户****惯性认为存在时间趋势。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。
word
word
3 / 10
word
上图是英国足球联赛某个年度各队的赢球场数,X轴代表不同球队,Y轴代表赢球数。
二、折线图〔Line Chart〕数据
折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。
word
word
4 / 10
word
它还适合多个二维数据集的比拟。
word
word
5 / 10
word
上图是两个二维数据集〔大气中二氧化碳浓度,地表平均气温〕的折线图。
三、饼图〔Pie Chart〕
饼图是一种应该防止使用的图表,因为肉眼对面积大小不敏感。
上图中,左侧饼图的五个色块的面积排序,不容易看出来。换成柱状图,就容易多了。
一般情况下,总是应该用柱状图替代饼图。但是有一个例外,就是反映某个局部占整体的比重,比如贫穷人口占总人口的百分比。
word
word
6 / 10
word
四、散点图〔Scatter Chart〕
散点图适用于三维数据集,但其中只有两维需要比拟。
word
word
7 / 10
word
上图是各国的医疗支出与预期寿命,三个维度分别为国家、医疗支出、预期寿命,只有后两个维度需要比拟。
为了识别第三维,可以为每个点加上文字标示,或者不同颜色。
五、气泡图〔Bubble Chart〕
气泡图是散点图的一种变体,通过每个点的面积大小,反映第三维。
word
word
8 / 10
wor