数据新闻手册 中文 2.0
读取...
Custom Search
Web
 
 
 

芬兰议会选举与竞选经费

最近几个月来,有关芬兰2007年大选经费的案件正在审理当中。

2007年大选过后,有报道称选举的宣传经费没有落实到政治家们身上。竞选经费一般是用来给政治家们买支持,但后来他们未能澄清自己的经费用途符合芬兰法律。

经历了这些事件后,法律也愈发严格起来。2011年3月份的大选过后,赫尔辛基决定全面查究一切有关竞选经费的数据。新的法律规定竞选经费必须进行申报,只有低于1500欧元的捐款可以匿名。

1. 找到数据与开发者

赫尔辛基自2011年3月起就开始举办”HS公开黑客联赛”。芬兰编程员、记者和图表设计师受邀来到我们大楼的地下室。参赛者们被分成三人一组,被鼓励开发应用程序和使其形象化。三次活动至今,每次都有大约60人参赛。我们决定将2011年5月第二届HS公开赛的主题定为竞选经费数据。

芬兰国家审计署是持有竞选经费记录的官方机构。这是最容易的部分。首席情报官Jaakko Hamunen建立了一个能实时访问他们竞选经费数据库的网站。国际审计署应我们的要求后仅用了两个月时间就做到了这点。

从现在起,每一次竞选的经费相关新闻和公共信息将刊登于Vaalirahoitus.fi这个网站上。

Figure 12. 竞选经费 (赫尔辛基新闻报)

2. 集思广益

第二届HS公开赛的参赛者由20个不同的数据处理原型所组成。所有的原型均可在我们的网站上获取(网站为芬兰文)。

一位名叫 Janne Peltola 的生物信息研究人员发现竞选经费数据和他们研究的基因数据有很多类似的互相依赖性。在生物信息学中,有一项用来勘察这种依赖性的开源工具称为Cytoscape。我们通过Cytoscape 运行数据会得出非常有趣的原型。

3. 将想法落实到纸上和网上

有关竞选经费的法律规定,议会当选人必须在大选两个月后申报自己的经费。这实际上意味着我们能在六月中旬取得真实数据。在HS公开赛进行时,我们只有国会议员在截止日期前提交的数据。

数据格式也存在着问题。国际审计署以两份CSV格式的文件提供数据。一份文件包含了竞选的全部预算,另一份罗列出所有的捐助者。我们必须建立一个结合这两者的文档,并分为三列:捐赠方,接受方与金额。如果政治家用的是自己的钱,在我们的数据格式里显示时就是政治家A捐赠了X欧元给政治家A。也许有点违反直觉,但它在Cytoscape里起效。

当数据被清理和转置之后,我们只需用Cytoscape来运算数据。然后我们的图形部门就会制作出一页完整的图形。

最后,它将以完美的可视化图呈现在我们网站上。这不仅是网络分析图形。我们希望以简单的方式告诉人们竞选经费的数额以及捐赠者的姓名。第一种观点显示了国会议员之间经费的分配。当你点击一位国会议员时就能查看他/她的经费明细。你也能对捐助方的合理与否进行投票。可视化由Satumaa广告代理机构的Juha Rouvinen和Jukka Kokko开发。

竞选经费可视化的网络版与网络分析使用了同样的数据。

4. 发布数据

当然,国际审计署已经公布了这些数据,所以无需重新发布。但是,既然我们已经清理并赋予了数据更好的结构,我们决定对这些数据进行发布。我们给予数据Creative Commons署名许可证。 随后几名独立开发者已经让数据可视化,我们也已发布了其中一些数据。

用于此项目的工具有:Excel、Google数据清理分析优化、Cytoscape网络分析以及用于可视化的Illustrator和Flash。Flash应该为HTML5支持的,但我们时间不够了。

我们从中学到了什么?也许最重要的一课是:我们数据构造的复杂性。如果初始数据的格式不符,那么重新计算和转换需要花费很长时间。