数据新闻在BBC
“数据新闻”一词涵盖了一系列的学科,并被广泛应用于各大新闻机构,了解这一点对我们理解“数据新闻”在BBC是大有裨益的。大体说来,“数据新闻”是指通过使用数据来实现以下一个或多个目标:
-
帮助读者找到对个人有重要意义的信息
-
报道一些重大却鲜为人知的新闻
-
帮助读者更好地理解一些复杂的问题
以上三方面可能会有所重复,而如果在线使用的话,不同层面的数据可视化则有益于这些目标的实现。
个性化
以上三方面可能会有所重复,而如果在线使用的话,数据的视觉化则有益于这些目标的实现。
最典型的例子是我们在1999年首次推出的学校排行榜,榜单所使用的是每年由政府公布的数据。读者只要输入邮政编码,就能找到当地的学校,并根据一系列的指标进行对比。跑教育新闻的记者为了先于出版物拿到数据做报道,常常和开发团队的人一起合作。
我们刚开始做这件事时,还没有一家政府网站能为市民提供数据查询,但现在,英国的教育部已经有了类似的服务,而我们的工作重心也转向以挖掘数据中的新闻为主。
现在,这一领域所面临的一大挑战是,如何让市民能够查询到那些与公共利益明确相关的数据。最近的一个例子是,我们推出了一个通常不为公众所知的庞大数据库“每条道路上的的每例死亡”,用户通过使用邮编进行搜索,就能找到过去十年中每场道路事故发生的具体位置。
简便的工具
除了为用户提供大型数据库的搜索渠道外,我们还成功创建了一批简便的工具,为用户提供他们所需要的信息。这些工具大大赢得了那些诸事缠身者的喜爱,因为他们通常没有时间去做冗长的分析和搜索。此外,个人信息分享的便利性也开始成为我们开发新工具的标准之一。
在这方面,一个极为轻松愉快的尝试是我们做的一个专题“70亿人口的世界:你是第几个出生的人?”该应用程序的发布日期与世界人口达七亿的官方日期刚巧一致,用户只要输入自己的出生年月日,就可以立即计算出自己是全球第几个出生的人,并通过Twitter和Facebook分享自己在全球的出生排名。该应用使用了联合国人口发展基金提供的数据,并大受欢迎,成为英国2011年Facebook上人气最旺的分享链接。
另一个新近的案例是BBC推出的预算计算器。用户通过使用该计算器,可以预见财政大臣的预算一旦生效后可能产生的更好或更坏的的影响,然后分享计算结果。我们与全球四大会计师事务所之一的毕马威建立了合作,他们根据年度财政预算为我们提供计算器,而我们则致力于创建一个抓人眼球的界面,以鼓励用户完成任务。
挖掘数据
然而,在这一切中“新闻”又在哪里呢?对于数据新闻,一个相对传统的定义是报道数据中的新闻故事。作为一名借助数据或电脑做报道的记者,面对数据,你首先得问问自己,这些数据中是否潜藏着某条独家新闻?数据是否精确?是否证明或反正了某个问题?不过要想在一个庞大的数据库中发现有价值的新闻,就必须花大量的时间对数据进行筛选。
而在这方面,我们已经找到了最快捷有效的方法,那便是与一些调查性团队或项目进行合作,他们在新闻调查方面十分在行,而且时间充足。比如,BBC的时事节目《全景》与新闻调查中心合作,花费数月时间,收集了有关公共部门薪酬的数据,不仅制作出了一部电视纪录片,还在网上推出了一个“公共部门薪酬:一些数字”的特别报道,并从行业分析的角度,对所有已公布的数据进行了可视化处理。
除了与调查记者合作外,拥有具备专业知识和数学头脑的记者也是至关重要的。当政府提出削减开支审查的数据时,团队中的工商记者在经过分析后能得出这样的结论:实际上的削减数字并没有他们所宣称的那么大。就是这条充分理解数据,加以清晰的可视化呈现辅助的独家新闻"Make sense of the data",赢得了英国皇家统计学会奖。
理解问题
不过,数据新闻不必成为那种不能被别人报道的独家新闻。数据可视化团队的工作就是将一些很棒的设计和编辑叙述结合起来,从而为用户提供引人入胜的体验。对一些准确的数据进行可视化处理有助于用户更好的理解某一问题或报道,这一招儿在BBC的新闻报道中屡试不爽。热力图数据技术的运用,就能够清晰地追踪英国救济金领取随时间的变化。
我们在欧元区债务网上的专题报道,探讨了欧元区各国错综复杂的国内贷款,我们运用颜色和比例箭头,并辅之以简明易懂的文字,以视觉化的方式来阐释复杂的问题。其中极为重要的一个考量是,如何鼓励用户去关注这样的网站,阅读其中的报道,并不会被这些数字吓到。
团队概况
我们的团队由20人组成,包括记者、设计师和研发人员,负责为BBC的新闻网站制作数据新闻。
除了承担数据项目和视觉效果的制作外,团队还包揽了新闻网站所有的信息图表和多媒体专题的制作。这些综合起来催生了一种新的新闻报道模式,即所谓的视觉新闻。 虽然,团队中并没有哪个记者专门司职处理数据,但所有的编辑人员都必须熟练掌握一些基本电子表格的应用技巧,如Excel 和谷歌文档等,以便对数据进行分析。
研发人员的技术和建议,以及设计师的可视化处理技术构成了每一个数据项目的核心组成部分。尽管我们首先是记者、设计师或研发人员,但我们努力工作,勤于学习,不断增加对彼此专业领域的熟悉和了解。
审校数据最常用的工具是Excel,谷歌文档和聚合图表(Fusion Tables)。不过,对于比较庞大的数据集,我们使用MySQL、Access数据库和全文检索进行处理,此外通过运用关联数据技术,我们还会用RDF数据模型以及SPARQL查询语言和数据访问协议,来模拟事件的发生,但总的来说这些都不太常用。研发人员也会使用自己首先的编程语言,如ActionScript, Python , Perl,来对我们正在做的数据进行比较、分析,甚至提出严厉的批评。Perl经常用于一些出版物。
在探索地理数据,并对其进行可视化时,我们则使用必应地图和谷歌地图,以及美国环境研究所(Esri)的ArcMAP程序。
在制图方面,我们采用Abode 套件,包括影视特效,Illustrator, Photoshop 以及 Flash软件等。尽管如今JavaScrip,尤其是JQuery和其他JavaScript 函数库诸如Highcharts, Raphael 和 D3 越来越符合团队制作数据可视化效果的要求,但我们仍很少发布Flsah 文件。
— 贝拉·赫里尔(Bella Hurrell)和安德鲁·莱姆德菲尔(Andrew Leimdorfer),BBC