数据新闻手册 中文 2.0
读取...
Custom Search
Web
 
 
 

《卫报》数据博客利用众包的报道奥运票务

我认为,大众反响最热烈的众包项目就是对奥运门票抽签的调研。成千上万的英国人都想得到2012奥运会的门票,那些没买到票的人就很生气。人们花了几百英镑订票,但最后得知什么都没买到。但其实谁也不知道实际情况,说不定大多数都很满意,而只有少数人在大声抱怨。于是,我们试图查明事情真相。

我们认为,由于没有任何相关的数据,最好的办法就是去问人们的想法。由于样本的不平衡性,我们觉得这不是小事。

我们做了一个谷歌问卷,在其中问了非常具体的问题。这份问卷本身比较长,包括订了多少钱的门票,信用卡扣款多少,最后结果如何等等诸如此类的问题。

Figure 13. How many Olympic tickets did you get?: the readers' results (the Guardian)

我们在网站的上方放了一小张图片,很快这份问卷就传播开来。这里有一个关键,你不能只是想“关于这个故事我想要知道什么?”,而是“大家现在有什么愿意告诉我的?”。只有当你勾起大家的交流热情,众包才会成功。虽然这是我们对众包服务的初期尝试,但大家对这个项目的回应异常热烈。头一个小时我们收到一千份调查结果,而到了第一天末就有七千份了。

拿到这么多数据,我们对数据的展示也变得认真起来。最开始我们不知道这个项目能做成什么样。所以我们添加了一些说明:比如《卫报》的读者群可能比其他人富有一些,购票时比较失望的人可能更愿意回应我们的调研,等等。

我们当时还不知道这些调查结果有多大的价值。最后我们整理出七千份不错的回复用于数据分析,发现大约一半订购门票的人一无所获。我们把数据整理出来,由于大量民众的参与,结果也非常有意思。

几个星期后官方报告出来了,结果和我们的数据令人震惊的接近。几乎是完全正确。我觉得这个项目的成功有部分运气的成份,但这么多人的参与也是原因之一。

比如一开始你只是让读者对这个事情进行评论,那么你得到的结果将会非常有限。所以从开始就要考虑:“对于我想要的信息,最好的工具是什么?”是论坛评论么?或是做一个应用程序?如果需要做应用程序,你必须考虑“中间投入的时间是值得的么?还有投入的资源是值得的么?”

在这种情况下,我们想到了谷歌调查问卷。别人回答了问卷,返回给你的结果就是电子表格中的一行。这意味着,即使数据仍在更新,结果仍在产生,打开电子表格就可以很直接看到所有的结果。

我可以用谷歌进行后续分析,但我还是把结果下载到微软Excel里面进行整理,比如从低到高排序之类的。有人在花销一栏填写的是文字而不是数字,我也要把这类问题进行修改。我决定尽量少的剔除调查结果。所以我不光选取了符合标准的问卷,而是试着解决各种书写问题。有人使用外国货币,所以我得把它们换算成英镑,这些事做起来是有点辛苦。

但整个分析也就用了几个小时,我去掉了那些明显胡填的结果。很多人在问卷中承认他们在门票上没花一分钱。这有点搞笑,但也没问题。在超过七千万个条目中只有不到一百个是这样。

还有几十份问卷想扭曲结果,说他们花了大笔的钱在门票上面,这些数字一看就是假的。比如有人写了一千万英磅。最后我拿到一份整理好的结果,可以用每天常用的一般数据分析方法进行分析。我做了所谓的“数据透视表”。我算了一些平均值。诸如此类的分析。

我们最开始也不知道这个项目会有多大规模,所以就是我和体育博客编辑两个人。我们商量了一下,觉得这可能是个有趣的项目。我们做到了,从开始到结束不到24小时。我们想出工作思路,在午餐时间设计好问卷,并把它放在网站上方。接着,问卷受到高度的关注,我们把它在网站上挂了一天,第二天一早结果就发表出来了。

我们之所以决定使用谷歌文档,就是因为它可以完全控制结果。不需要借用其他任何分析工具。我可以很容易的把结果导入数据库软件或者电子表格。如果你开始的时候使用专门的调查软件,通常会受到这些工具的限制。如果问题比较敏感,我们可以会在使用谷歌工具之前慎重思考一下,考虑是否只做“内部”调研。但一般来说,把谷歌问卷挂到《卫报》网页上非常容易,而用户基本上不知道我们在用谷歌来做调研。所以这很方便。

对那些想要使用众包服务的数据记者而言,我的建议是,你必须设计非常具体的问题。而且回答的选择越多越好。对你的调查对象尽量做一些基本的人群信息分析,这样你可以知道你的样本是否存在偏好。如果询问某一事物的数额或者类似的问题,尝试去让大家填写数字,限定使用某一货币单位,等等。这些引导很多可能不会有实际效果,但问卷对民众的引导越多,你得到的结果也会越好。还有一件事,就是记得设计一个评论栏。因为许多人虽然会把问卷填完,但他们真正想做的是让你倾听他们的想法。特别是对消费或者暴力事件的调研项目。

摘自数据新闻博客的 玛丽安·包查特(Marianne Bouchart) 对 卫报西蒙·罗杰斯(Simon Rogers) 的采访