数据可视化:数字背后的故事

从数据到图片
从数据到图片 | 图片: © Colourbox | | © Colourbox

数据可视化是一种解读性的行为。在数据转化、筛选和描述的过程中,都存在着被歪曲的可能性。其中的核心问题是:数据可视化是如何反映现实情况的?

  为了使数据发挥效用,必须用一种既形象生动又具有说服力的形式将其展示出来。原始形式的数据基本上不会引起任何人的兴趣,就更别说能让人看懂了。这个问题对所有以数据为基础的领域来说,都是司空见惯的挑战。现在,许多富有影响力的政治经济决策都是从数据分析结果中得出的。因此,数据成了一种强有力的工具。由于决策者往往并不身兼数据分析师的角色,因此这两极之间的知识需要进行转化。可视化操作正是在此过程中起到了十分重要的作用。
 

  数据可视化要想令人信服,关键不仅在于数据的内容,更在于这些内容的展现方式。这项任务会由所谓的“数据美术师”来完成,他不但要掌握信息学、统计学、数据库分析等知识,而且还要具备艺术家的能力,了解图形设计知识。图形在美学上越有信服力,它的效果就越显著:下图是一部复杂的缩放动画的一部分,这部动画研究的是所有媒体频道的相互关系。粉色圆圈大约是灰色圆圈的十倍大,但实际的数字比例大约只有四倍大(图1-0)。

  可视化的美感遵循的是纯美术手段,来展现例如Youtube等网站与传统媒体相比的“压倒性的优势” (图1-1,图1-2)。然而这些图跟数字本身并没有什么关系

从数据到图片

  实时分析和大数据领域要处理的数据量如此巨大,根本看不过来。没有信息设计人们就无法从数据中获取认识。除了柱状图、饼图、统计地图、图表、网络结构图等常用的可视化形式外,人们还可以发挥无穷无尽的创造力。专用制图工具几乎可以实现任何人类想得到的表现形式。但是,数据是否得以形象化表现,还是有极限的,这也是人们从数据中获得认识的极限。

  肯尼亚首都尼日利亚地图上的亮点据称反映了该地过去几十年绑架案件数量不断上升的情况。

  我们不难发现,这张图上几乎处处是问题:一是地图并未显示出真正的绑架数量,而仅仅是网上发布的关于绑架的“报道”。首都地区尤其密集,这同样不符合实际。这是因为如果报道中没有注明具体的地点,就自动将犯罪地点归为尼日利亚首都阿布贾。一方面,可视化美术设计可以给传递的认识增加可信度,但另一方面信息的真实性却越来越难以验证。

形式与功能,还是美观与内容

  将信息浓缩为精炼的图象形式,这表示任务才完成了一半。数据记者和数据美术师一再证明,完全可以将数据以一种十分美观的形式表现出来。在此,艺术的美担负了吸引、转移和影响观察者视线的功能。通过采用适当的表现形式,人们可以在图上有意强调原本在现实中不太重要的某些方面。而选对了颜色和比例,可以使显示的内容更突出、更引人注目。

  在图2-0网络动画图上的大量不同颜色的连线表现了所有可能的设备和资料来源之间的整个关联情况。

图 2-0 (来源: http://mediacon.mabb.de/#ausgangssituation)

  仔细看的话(图2-1),会发现其中也有一些是完全没有意义之处,例如iOS、Windows Phone和Android这三种独立系统之间也分别画有连线。这是因为,在数据可视化过程中,图形的美感比实际的关联更为重要。


图 2-1 (来源: http://mediacon.mabb.de/#ausgangssituation)

阅读习惯和人为操纵的空间

  各种文化特有的阅读习惯也影响了人们对数据可视化的认知。例如,在某个文化圈内,人们习惯从左往右、从上往下阅读,他们在读图时也是遵循相应的原则。此外还有其他惯例:向右的趋势通常表示未来的发展方向,向上则表示增长的趋势。可能这些说法听起来再平常不过,但这当中也隐藏了有意进行人为操纵或无意出错的可能性。

数数与诉说——图片背后的故事

  数据可视化的过程并非是一对一的翻译转变过程,以此将抽像的数字化信息形象地显示出来。它更多是分析过程的一部分,追随特定的目标,并且为最后作出合理的解释留有足够的空间。数据的表现形式与要用这些数据讲述的故事密切相关。因此,可视化可以看作将单纯的数数行为转化为“讲故事”的过程。然而讲述的内容必须是可以量化表示并能够测量的。但这样一来也会导致信息的丢失。数据学家克拉斯·波尔霍夫(Klaas Bollhoefer)说:“数据仅仅是通过数据显示的一部分现实的一种映射,反映的并不是全部的现实,更不是现实的客观映射。”所以,数据可视化其实是一种映射的映射。当可视化成为进行决策的唯一依据时,人们就更有必要想到这种双重写照关系的事实。有可能数字和图片背后的现实讲述的是完全另一个故事。