数据新闻手册 中文 2.0
读取...
Custom Search
Web
 
 
 

不同的图表和图形讲述不同的故事

在当今数码世界中,我们期待着置身于3D体验,而倾向于忘记多年以来人们只有纸和墨。我们把这种静态的平面媒介当作二等公民,事实上追溯到数百年间,我们一直在书写和印刷,达成了难以置信的知识宝藏和在页面上表达数据的各种实践。虽然交互图表,数据可视化和信息图正在广泛流行,它们却放弃许多我们通晓的最好实践。只有沿着已然完成的图表和图形长河上溯,我们才会理解既有的知识宝库,并且把它引进到各种新的环境中。

一些最著名图表和图形的产生,是为了更好解释密集的数据表格。在十七世纪末到十八世纪初叶,苏格兰有位叫威廉·普雷菲尔(William Playfair)的先生,他通晓多种语言,并且独立完成了引入许多今天依然使用的图表和图形。在他1786年问世的书商业和政治地图(Commercial and Political Atlas)中,Playfair引入条形图,以便用一种新的直观的方法显示苏格兰入口和出口数量。

随后,在他1801年问世的书统计摘要(Statistical Breviary)中,推广了著名的饼形图。 这些新形式的图表和图形起源于商业,但随着时间推移,出现了另外一些图表,却是用于挽救生命。在1854年,约翰·斯诺(John Snow)创造了享誉至今的“`伦敦霍乱地图”,在报告灾情的每个地址处添加一个小黑条,经过一段时间便可以看到明显的爆发密集区,从而采取行动控制疫情。

随着时间推移,使用这些新型图表和图形的人们变得越大胆,而且深入进行实验,推动这种媒介发展到今天我们所知晓的状态。安德-麦克·古瑞(André-Michel Guerry)曾率先发表一个绘制地图的想法,其中每一个单独区域的不同着色是基于某种变量。1829年,他创建了第一个定量专题地图,通过选取法国各个区域并且打上阴影来表示犯罪水平。今天,我们看到用以显示政治投票区域的地图,谁投票赞成谁,还有财富分布,以及其他与地理相关的变量。看起来如此简单的想法,不过即使在今天,如果不能精明地运用,掌握和理解它还是困难的。

Figure 11. 早期条形图(威廉·普雷菲尔)
Figure 12. 伦敦霍乱地图(约翰·斯诺)
Figure 13. 法国犯罪各地等级地图 (André-Michel Guerry)

一个好的记者需要了解许多工具并把它们保存在工具箱里,以便构建可视化。自然不是要马上跳进深水,在图表和图形方面有一个良好的基础是重要的。你开创的每一件工作需要起源于一系列基本图形和图表。如果你能掌握这个基础,你可以进而构建更加复杂的可视化,而这是由这些基础单元构成的。

两个最基本的图表类型是条形图和折线图。虽然在应用场合它们十分相似,但在它们的内涵上可以相当不同。作为例子,我们采用年度内公司逐月销售额予以说明。我们要用12条竖线代表每个月中营收货币总量(Figure 14).

Figure 14. 简单的条形图:适于表现离散信息

我们来观察,为什么是条形图而不是折线图。折线图是应对连续数据的思想方式。我们的销售数字是该月的和数,不是连续的。作为条形图,我们知道公司在一月份营收100美元,而在二月份120美元。如果我们把逐月盈利做成折线图,在每个月第一天依旧代表100美元和120美元,但利用折线图我们会估计,15日这一天公司好像营利110美元,这是不对的。条形图用于表示测量的离散单元,而当我们处理连续数值时,比如温度,就要用折线图。

Figure 15. 简单的折线图:适于表现连续的信息

我们看到,8点钟温度是摄氏20度,而在9点是22度。如果我们仔细观察这条曲线来猜测在8点30分的温度,我们会说21度,这个估计是对的,由于温度是连续的而且每个节点不是其他温度值的和数,它代表那个时刻的精确值或者两处精确测量之间的估算值。

条形图和折线图两者都有叠放的变化(Figure 17)。这个优秀的故事说明,可以用不同的方式使用工具。下面考虑一个拥有三个营业点的公司作为例子

每个月相应三条条形,每条表示一个营业点,总共36条表示全年。当我们把这些竖线相邻排开(Figure 16),便能很快看出哪个月哪个营业点挣得最多。这是一个有趣而恰当的故事,但在这批数据中还另有隐藏。如果我们把三条竖线叠起来,对于每个月只有一条,因而不能轻易看出哪个营业点最能挣钱,但现在我们可以看到,本公司作为一个整体哪个月干得最好。

Figure 16. 一组条形图
Figure 17. 叠放的条形图

这两张图表都是同一信息的有效显示,但它们使用相同的原始数据讲述两个不同的故事。作为一名记者,工作中使用数据的要领在于,你首先要选择有兴趣讲解的故事。是哪个月经营最好还是哪个商店成为旗舰?这只是一个简单的例子,但它确实处于整个数据新闻的焦点,在走得太远之前要设问正确的问题。故事本身将引导对于可视化方式的选择。

条形图和折线图对于任何数据记者就像面包和奶油一样重要。由此出发,你可以扩展为直方图,水平图,微线表,流图,以及其他图表,彼此性质相似而适应于略微不同的场合,从文本角度着眼,这会涉及数据总量或数据来源,以及制图的坐落位置。

新闻工作中,经常使用的制图特质之一的就是地图。时间,总量和地理信息总是共同具备的。我们总是想知道,一个地区与另一个地区相比差距是多少,或者数据如何从一个地区流向另一个。处理新闻可视化时,收进你的技能包中的流程图和定量专题地图是很有用的工具。知道如何适当地用彩色标识一张地图,而不是误报或者误导读者才是关键。政治地图通常对某些地区用彩色填满或者留白,即使所在地区仅仅赢得1%。使用彩色不必是二进制的专业选择,基于群组的彩色梯度可以谨慎地予以运用。理解地图是新闻工作的一大部分。各种地图能够轻易地回答5W原则中的“Where”。

一旦你掌握图表和图形的基本类型,才能开始构建富于想象力的数据可视化。如果你不理解这个基础,那么,你好比在不牢固的地基上盖房子。类似于你学习如何成为一个好作家,保持语句简短,把读者放在心里,以及不要自作聪明地把事情复杂化,而在于传达意义给读者。你也不应当借助于数据鲁莽行事。从小处入手乃是讲述故事最有效的方式,仅当需要的时候,慢慢地构筑你的新闻信息图。

有力的写作是简洁的。一个语句不应包含不必要的词汇,一个章节不应包含不必要的语句,事同此理,一张绘画不应有不必要的线条,而一架机器不应有不必要的部件。此处不是要求作家把他的所有语句缩短,或者避免所有细节,以及只在轮廓上处理主题,并且要求言简意赅。

Elements of Style (1918)
— 小威廉·斯特伦克(William Strunk Jr.)

在你的故事讲述中,可以不使用每一段数据。为了简洁,你不必请求认可,这应当成为规则。

布莱恩·苏达(Brian Suda), (optional.is)