数据新闻手册 中文 2.0
读取...
Custom Search
Web
 
 
 

为何记者要运用数据?

新闻业正腹背受敌。过去,媒体能够成为一种产业,是因为我们是唯一能利用技术大规模生产和传播新闻,告诉大众昨夜发生了什么的机构。印刷媒体就像一条必经之路,如果有人想要知道第二天某城市的人或某地区发生了什么事,印刷媒体是他们的唯一选择。然而这种光景已经一去不复返了。

而今,新闻在事情正在发生的时候就通过目击者的记录、博客等多种途径扩散开来。并且这些消息在传播过程中被巨大的社会关系网络所筛选,同时被排名与评论,但更常见的则是被忽略。

这就解释了数据新闻为何如此重要。收集、筛选、并呈现那些表象背后的原因与真相有着越来越高的价值。例如,你早上喝的果汁和泡的咖啡——在今天全球经济的背景下,这些商品与你和他人之间就存在着某种无形的联系。而讲述这种关系的语言就是数据:一个孤立的事件当中的少量信息往往缺少关联度,但如果从正确的角度观察却能发现极为重要的价值。

眼下,一些具有开拓精神的记者已经向我们展示了如何利用数据更深层次地洞察正在发生的新闻事件,以及这些事件可能对我们产生的影响。

数据分析可以为我们呈现“故事的轮廓”(Sarah Cohen语),或提供“新的视角” (David McCandless语)。对数据的使用使得记者的工作核心由追求最先报道新闻向讲述某一事态变化展背后的真正含义转变。话题的范围十分宽泛。从“正在孕育中的下一个金融危机”到“我们消费的商品背后的经济规律”,以及“基金滥用”或“政治失误”,这些问题通过强大的数据图表展现出来清晰明了且极具说服力。

这就是为什么新闻记者应该把数据视做机会。比如,他们可以告诉不同年龄、性别和教育背景的受众,诸如“失业率”这样抽象的威胁会对其产生怎样的影响。利用数据使每个人都能够好的理解这些抽象的事务,并与他们自身的情况联系在一起。

他们还可以制作人性化计算器来帮助人们做出决策。这些决策可以是买车买房,也可以是教育或专业的道路抉择,还可以是进行支出核算避免债务问题的发生。他们也可以透析诸如社会动乱或政治争议这些复杂情境下的态势发展,去伪存真,让每个人对解决这些复杂问题的可能方案都了然于胸。。

通晓搜索、清理并呈现数据是对专业信息搜集工作的巨大变革。掌握这些技能的记者对于撰写新闻事实与事件洞察将会十分容易。不必费心推测,也不必四处引证——相反,记者能够在数据佐证的基础上写出一篇观点有力的文章,这深刻地影响新闻业所扮演的角色。

此外,对数据新闻实践也预示着未来。如今随着新闻业的萎缩,大部分记者开始希望转战公共关系,而数据记者和数据研究者则成了一个越发吃香的团体。这种现象不仅存在于媒体界,全世界的公司和相关机构也都在寻求这种“(数据)意义建构者”和业内专家,因为这些人知道如何充分挖掘数据并把它们转变成有形的实体。

数据有着巨大的前景,这令媒体兴奋不已,促使他们开始寻求这种新型报道人才。对于自由职业者来说,熟知数据也能够带来新的工作机会和稳定的收入。从这种角度来看,与其雇佣记者向报纸版面与网站页面塞满低劣内容,还不如使用数据来创造编读的双向需求,而唯一的办法就是用一个星期来解决一个问题。这对于媒体业的各个部门来说都是一个令人欣喜的变化。

而限制记者挖掘这块潜在领域的阻碍在于: 他们需要接受训练才能够知晓从问出第一个问题到做出一个由数据驱动的重磅独家新闻的所有步骤。

同数据打交道就如同踏入广袤的未知领域。第一眼看过去,原始的数据令人眼花缭乱、头脑混沌。这种繁杂得数据,的确难以恰当地将其可视化。它需要经验老到的记者,这些人拥有从混淆、乏味的原始数据中“看出”其中暗藏故事的能力。

米尔科·洛伦兹(Mirko Lorenz),德国之声

调查

欧洲新闻中心进行了一项调查,目的在于了解新闻工作者对于职业能力培训的需求。我们发现他们对于跳出传统新闻模式的安全地带,想要花时间去掌握新的技能有非常大的意愿。调查的结果显示新闻工作者看到了机会,但是缺少一点点对于他们刚开始接触数据工作所遇到的困难的帮助。但是应该对数据新闻的工作流程、所需要的工具、所得到的应用及其结果将会很快进步发展充满信心。像卫报、纽约时报、德克萨斯论坛报、德国时代周报这些先驱者已经在提高数据驱动新闻数量上继续前行。 数据新闻能继续保留一小部分为之发展不断探索的人吗?每一家新闻组织都能够很快拥有自己的专注于数据新闻的团队吗?我们希望这本手册能够帮助更多的新闻工作者和新闻编辑室能够在这个新兴领域中保持优势。

Figure 2. 欧洲新闻中心对记者培训需求所做的调查

===数据新闻为何重要?

我们曾向数据新闻领域的领先实践者和提倡者发问:为什么他们认为数据新闻是一个重要的发展领域?我们得到如下回答。

过滤数据流

以前信息匮乏的时候,我们的大多数精力都放在寻找和搜集信息上。而如今信息日益丰富,信息处理变得更加重要。我们处理数据时,分两个层面进行:(1)分析数据,从无限的数据流中建构意义与结构(2)展现数据,让消费者能够理解并记住那些重要且息息相关的信息。同科学研究一样,数据新闻所告知的研究方法与展示研究结果是应当能被重复检验的。

菲利普·梅耶(Philip Meyer),名誉教授,北卡罗来纳大学教堂山分校

新闻叙事的新方法

在我看来,数据新闻是一个概括性术语,它囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法,涵盖了从传统的计算机辅助报道(使用数据作为“信源”)到最前沿的数据可视化和新闻应用等一切叙事方式。其统一的目标是新闻业意义上的:提供信息和分析以帮助告知我们一天内所有最重要的事件。

阿隆·菲尔霍夫(Aron Pilhofer),纽约时报

就像用笔记本电脑完成的图片新闻

“数据新闻”和“文字新闻”的唯一不同在于我们使用了不同的工具包。我们都以探寻、报道和讲述故事为生。“数据新闻”就像是“图片新闻”;无非是把相机换成了笔记本电脑。

布莱恩特·博耶(Brain Boyer), 芝加哥论坛报

数据新闻是未来

数据驱动的新闻代表着未来。新闻工作者需要精通数据。过去你可能通过在酒吧和人聊天获取新闻故事素材,尽管现在这种方式有时可能仍被采用,但目前你同样要钻研数据并借助数据工具进行分析和筛选出令人关注的信息。并对信息加以正确地处理,帮助人们真正看到它反映了什么,在这个国家正在发生什么。

蒂姆·伯纳斯-李, 万维网创始人

当数字运算遇上文字游戏

数据新闻打通了统计技术人员与写作为生的人之间的差异。定位离群值和识别趋势不只在有显著的统计意义,还与解码当今的复杂世界息息相关。

戴维·安德顿(David Anderton),自由撰稿记者

更新你的技能组合

数据新闻是一套用于搜索、理解和可视化数字信源的全新技能组合。在如今的时代,单纯掌握传统新闻学的基本技能已经远远不够。数据新闻不是要代替传统的新闻业,而是它的一个补充。

在这个信源走向数字化的时代,记者可以而且必须要更接近信源。互联网开辟的各种可能性已经超出了我们目前的可知范围。数据新闻正处在革新过去的操作手法以适应互联网的初始阶段。

数据新闻可以帮助新闻机构达成的两个重要目的:寻找独特的故事(而不是从通讯社获得)和执行看门狗的功能。尤其是在金融危险的时候,这两者都是报纸设法达到的重要目标。

从地区性报纸的立场来看,数据新闻是至关重要的。我们有一句谚语是,“你门前一块松散的瓷砖被认为比一个遥远国家发生的暴乱更为重要”。它出现在你面前,并且更直接影响你的生活。同时,数字化是无处不在的。由于当地报纸对周围居民有如此直接的影响,而信源逐渐数字化,所以记者必须知道如何利用数据寻找、分析和可视化新闻故事。

杰里·维曼(Jerry Vermanen),NU.nl

一种信息不对称的补救

信息不对称并不是缺乏信息,而是赶不上信息出现的速度和数量,因而无法吸收和处理这些信息。这是市民选择如何生活所面临的最关键的问题之一。从印刷、视觉和听觉媒体所提取的信息影响着市民的选择和行动。优质的数据新闻有助于对抗信息不对称所造成的负面影响。

汤姆·弗莱斯(Tom Fries),贝塔斯曼基金会

数据驱动公关的答案

测量工具变得可获,且其价格不断下降,加上对社会各方面的表现和效率的重视,导致决策者量化政策的进展,监测趋势和寻找机会。

企业不断更新展示他们的表现的数据。政客喜欢吹嘘他们减少了多少失业人扣和增长了多少国内生产总值。安然,世通,麦道夫或Solyndra等公司事件所表现出的新闻洞察力的缺乏,证明了许多记者无法清楚地看懂数字。相对于其他事实,数字更可能被粗浅地解读,因为数字被蒙上了象征严谨的神圣光环,即使是完全捏造的也不例外。

数据的熟悉运用将帮助记者提高他们在遇到数字时的批判意识,并很可能帮助他们在与公关部门交易时占据有利地位。

尼古拉斯·凯瑟-布瑞尔(Nicolas Kayser-Bril),Journalism++

提供对于官方资料的独立阐释

日本是一个数据新闻发展滞后的国家。2011年的破坏性地震和随后的福岛核电厂灾难发生后,数据新闻的重要性已经被日本的媒体人所认识。

对于灾难所造成的破坏,政府和专家的提供的数据并不可靠,这让我们感觉迷茫不知所措。当官员隐藏SPEEDI数据(预测放射性物质扩散)不让公众知道时,即使它被泄露了,我们也无法解码数据。志愿者开始通过使用自己的设备收集放射性数据,但我们并不了解统计学、插补、可视化等知识。记者需要获得原始数据,并要学会不依赖于它的官方解释。

功松波(Isao Matsunami),东京新闻

处理海量数据

数字革命带来的挑战和机会将继续分裂新闻业。在一个信息丰富的时代,所有的记者和公民都需要更好的工具,无论是用于21世纪在中东的地下出版物,一个在深夜进行的数据转储处理,还是为某国消费者寻找最好的可视化水质的方法。尽管我们需要设法解决如何消化海量数据的难题,然而我们需要意识到,新兴的发布平台赋予了每个人数字化收集和共享数据并把它转化为信息的能力。虽然记者和编辑是传统的信息收集和传播的载体,然而扁平化的信息环境已经使得2012年现在的许多新闻最先在网上出现,而不是新闻采编部的桌上。

事实上,世界各地的数据和新闻之间的纽带都在不断增强。在大数据的时代,数据新闻日益增强的重要性取决于其从业者所提供的背景和清晰度的能力,而也许最重要的是,在全球不断扩大的数字内容中找到真相的能力。这并不意味着今天的综合性媒体组织没有起到关键作用。事实恰恰相反。在信息时代,记者们比以往任何时候都更需要组织、验证、分析和综合数据的洪流。在这种情况下,数据新闻具有深刻的社会意义。

今天,理解大数据,特别是非结构化数据,将是世界各地的数据科学家的一个中心目标,无论他们就职于新闻编辑室,华尔街还是硅谷。值得注意的是,越来越多的常用工具将使这一目标变成可能。开放芝加哥的政府技术专家,医疗保险专家或者编辑部程序员都可能使用这些工具。

亚历克斯·霍华德(Alex Howard),O”Reilly Media

我们的生活就是数据

做出好的数据新闻很难,因为做出好的新闻本身就很难。也就是说,如何寻找数据,如何理解数据,还有如何找到故事都是很难的。有时你会陷入僵局,有时没有好的故事。毕竟如果新闻只需要按部就班去做,它就不叫新闻了。而这种困难正是使得新闻有价值的原因。我们的生活是不断增加的数据, 在这样一个世界里,新闻对于一个自由和公平的社会至关重要。

克里斯·塔格特(Chris Taggart),OpenCorporates

一种节省时间的方法

记者不必再浪费时间在手工抄写和试图从PDF获取数据上了。学习一点点代码,或知道去哪里找人帮助,是非常有价值的。

一位来自圣保罗之报负责报道地方预算的的记者打电话给我,感谢我们在网上发布了圣保罗市市政财务数据(这是一个黑客两天的工作量!)。他说,他在过去3个月都在手工抄写这些数据,试图构筑一个故事。此外我还记得我曾为“Contas Abertas”解决了PDF方面的问题,这是一个监督议会的新闻机构:15分钟和15行代码解决他们一个月的工作量。

佩德罗·马昆(Pedro Markun),Transparência黑客

记者的工具包的基本组成部分

我认为强调“新闻”或“数据新闻”的报道方面是重要的。这项工作不应该只是目的性的分析数据或数据可视化,而是把它作为一种工具来接近世界上正在发生的事情的真相。我认为能够分析和解释数据的能力是当今记者的工具包的一个重要组成部分,而不是一门独立的学科。归根到底,它关系到能否写出好的故事,还有能否在最恰当的方式来叙述故事。

数据新闻是审视世界和监管权力的另一种方法。随着越来越多的数据可获得,记者必需了解数据新闻技术,这一点在现在比以往任何时候都更重要。任何一位记者的工具箱中都应该有这个工具:要么学习如何直接处理数据,要么与可以处理数据的人合作。

数据新闻真正的用途在于帮助你获得用其他方法很难找到或证明的信息。史蒂夫·多伊格分析了安德鲁飓风的破坏模式,这是一个很好的例子。他使用了两种不同的数据集:一个映射飓风造成的破坏水平,一个显示风速。这让他得以查明缺少建筑规范的地区和恶劣的施工将加重灾害的负面影响。凭借这个新闻故事,他在1993年获得普利策奖。这是一个很大的启发,让我们了解到数据的可能性。

在理想的情况下,你可以使用数据来指出异常值,人们感兴趣的领域,或是令人惊讶的事物。在这种情况下,数据可作为导语或内幕信息。虽然数字可以富含趣味,但仅仅写出数据是不够的。你仍然需要新闻报道来解释这些数据意味着什么。

辛西娅·奥墨楚(Cynthia O”Murchu),金融时报

适应我们信息环境的变化

新的数字技术为整个社会生产和传递知识带来新的方法。数据新闻可以被理解为媒体为适应和回应我们的信息环境变化所作出的尝试 – 包括增强互动性,讲述多维故事,帮助读者探索新闻相关信息,并鼓励他们参与到创作和评估故事的过程中。

塞萨尔·维亚纳(César Viana),巴西戈亚斯州大学

一种独一无二的看待事物的方法

有些故事只能通过分析或者可视化数据才能被理解和阐释。有权势的人和团体之间的联系很难被揭露,药物政策所造成的死亡人数将被继续隐藏,破坏景观的环境政策将继续有增无减。但上述的每一项都因为记者在获取、分析数据,并向读者揭示之后取得了重要的变革。数据既可以简单如电子表格或手机通话记录,也可以复杂如学校考试成绩或医院感染数据,但共同点是这些数据都蕴含着值得讲述的故事。

谢丽尔·菲利普斯(Cheryl Phillips),西雅图时报

一种使新闻故事更加丰富的叙事方式

我们可以用我们所留下的数字轨迹描绘出我们的全部生活。从我们消费和浏览过的物品,到我们旅行的时间和地点,从我们的音乐喜好,到我们的初恋,从我们的孩子的里程碑,乃至我们最后的愿望,都可以被跟踪、被数字化、被存储在云里并被传播。通过这个数据的世界来讲故事,回答问题,传递对生活的理解正逐渐开始被人采纳。这种方式胜过重现最严谨细致的名人轶事。

莎拉·斯洛宾(Sarah Slobin),华尔街日报

你并不需要挖掘最新的数据

有时数据是已经公开并可用的,但不是每一个都被深入挖掘过。比如美联社关于4500页记录伊拉克战争期间私人安保承包商行为解密文档报告的案例中,实际上这份材料已经被独立记者通过向美国国务院的信息自由申请拿到有很多年了。他们扫描了这些纸质结果并且传到了云端,这就让我们有可能进行更深入的分析。

乔纳森·史特里(Jonathan Stray),The Overview Project