大数据与新闻报道

发布时间:2020-08-11 15:24:12 点击次数:243

大数据指在互联网保留下来的远超出传统数据库的海量数据。新闻媒体通过使用一定的运算方法对大数据进行分析可以深化新闻叙事和对事实作出准确判断,对未来进行预测报道,满足用户的定制信息要求,使得数据可视化和具有交互性。然而,利用大数据做新闻,记者还面临着一系列值得注意的问题。我国新闻媒体运用大数据报道新闻方面尚处于初级探索阶段,需要借鉴国际同行的经验。

关键词:大数据;数据新闻;新闻生产;深化新闻叙事;信息定制

【本文提要】大数据指在互联网保留下来的远超出传统数据库的海量数据。新闻媒体通过使用一定的运算方法对大数据进行分析可以深化新闻叙事和对事实作出准确判断,对未来进行预测报道,满足用户的定制信息要求,使得数据可视化和具有交互性。然而,利用大数据做新闻,记者还面临着一系列值得注意的问题。我国新闻媒体运用大数据报道新闻方面尚处于初级探索阶段,需要借鉴国际同行的经验。

  【关键词】大数据;数据新闻;新闻生产;深化新闻叙事;信息定制 

  【作者简介】陈力丹系中国人民大学新闻与社会发展研究中心教授,李熠祺、娜佳系该校新闻学院研究生。

  【基金项目】本文为国家社科基金重大项目(批准号:13&ZD182)研究成果。

  【中图分类号】G212

  如今从每天日常开销的记录,到手机里成堆的电话号码,再到全世界、全中国的社会经济发展数据,都可以被记录下来。我们已经被海量的数据所包围。于是“大数据”这个词流行起来了。大数据,即我们使用互联网的各种路径和形态时留下的海量信息和信息痕迹。最近两年,人们在互联网留下的信息和运用各种社交媒体留下的信息痕迹,等于自有记载以来人类保留的信息总和。仅一个百度搜索引擎,每天获得的人们点击搜索的数据,便有60亿次。大数据的数据量之大,远超出传统数据库软件工具的抓取、储存、管理和分析的数据量。对此,我们从计算机中储存信息的单位之间的关系可以有所体会。

  计算机最小的存储单位是byte,1K=1024Byte,1M=1024K,1G=1024M,1T=1024G,1P=1024T,1E=1024P,1Z=1024P。2011年时,全球的数据量就已经达到1.8Z,预计2015年将接近8Z。面对这样巨大的数据量,我们传统的数据组织和处理模式已经无法满足其需求,再加上大数据具有规模大、价值高、交叉复用等特征,①不同行业、不同领域的数据之间的交换与相互利用也变得十分频繁。这就意味着对于数据的处理、分析、分享、挖掘等能力有前所未有的提升。

  显然,大数据对人类把握自身整体发展具有重大意义。大数据也对社会各个领域把握自身的发展具有重大意义。大数据对新闻报道呢?尽管新闻是具体的,可一旦大数据的运算加盟新闻报道,便催生出大数据新闻,对新闻生产方式的影响也是巨大的。对不同领域、层面的大数据进行分析、处理后,可以通过可视化和叙事化的手段,创作出一种新的新闻报道方式。②这种报道方式主要包括四个环节:对原始数据的收集、对数据的分析和过滤、将数据可视化、形成具体的新闻报道。

  大数据新闻不是一夜之间就有的,它的萌芽是从计算机辅助报道(computer assisted reporting)③开始的。20世纪50年代,美国就有媒体记者利用大型计算机对政府提供的数据库中信息进行分析,以发现和调查新闻事实。④记者在政府机构、企业等所发布的有限数据中,发现新闻选题或者将这些数据作为佐证发现、拓展报道深度的重要资料。而在如今大数据的背景之下,记者能够获取和利用的数据相较而言是那时的天文数字的倍数。

  大数据新闻有别于精确新闻和数字新闻。精确新闻由美国学者、新闻记者菲利普·迈耶在20世纪60年代提出,⑤指记者在采访新闻时运用调查、实验和内容分析等社会科学研究方法来收集资料、查证事实,从而报道新闻。这类新闻报道20世纪70年代风行于美国新闻界。80年代,中国新闻界开始运用这种新闻报道方法。它的特点是用精确的具体数据分析新闻事件,以避免主观的、人为的错误。它侧重于微观的具体调查、实验和内容分析。而数字新闻,则指以数字、公式、字母等静态形式来辅助文字报道。现在所说大数据新闻,显现的是对大数据的挖掘与处理的结果,可以通过复杂的交互式、动态化的图片和视频来呈现这类新闻。

  一、大数据新闻的功能与优势

  目前,在大数据新闻制作上已经积累了经验的国际媒体有《卫报》《纽约时报》《华盛顿邮报》等,但它们也处于探索阶段。通过对国内外代表性媒体的大数据新闻实践进行研究,可以总结出大数据新闻的四个功能,即描述、判断、预测、信息定制。

  1.新闻叙事

  《卫报》网页2012年1月5日发布了一个有关“阿拉伯之春”的大数据新闻报道。⑥报道利用动态图表,以时间轴为主线描述了自2010年12月一突尼斯男子自焚至2011年12月的一年间,17个阿拉伯国家发生的一场政治运动。网民可以通过这个四维动态的报道,清楚地从宏观到微观,全面了解阿拉伯之春在不同国家的不同表现形式。图表上方设置了时间的推拉按钮,网民推拉到自己想观看的时间点,可以清楚地看到相同时间点上不同国家发生的相关事件。画面的下方是各个国家的标签,网民也可以通过国家标记,来关注某个具体国家在纵向时间轴上的政治演变进程。不同的政治事件用不同颜色来标示:绿色为群众性抗议活动,浅蓝色为国际上的相关反应,黄色为政治事件,红色为政权更替。如果网民想了解某个事件的具体内容,点击不同颜色的标示,随即获取深度报道的链接。这种新闻报道方式,将涉及十几个国家、时间跨度长达一年的复杂的“阿拉伯之春”,以明晰的动态方式呈现出来,纯文字报道难以达到这样的传播效果。

  大数据新闻还能够描述那些看不见的短期过程,比如流言如何在社交网络上传播。⑦《卫报》通过追踪分析260万份推特内容,利用可视化动态图表描述了从流言开始传播到辟谣结束的整个过程。它也是以时间为轴,利用圆圈大小、颜色变化来描述整个过程,绿色的圈代表散布流言的推文,红色的圈代表更正这个流言的推文,灰色的是中立的评价推文,黄色的是对流言持怀疑态度的推文。圈的大小代表了推文的影响程度,圈越大影响程度越大。如果想了解具体的内容,点到哪个圈,屏幕旁边即刻呈现这个圈所代表的推文的发布者、发布日期、转推人数等等信息。通过这个动态的演进过程,人们可以清楚地看到,社交网络并不像一般想象的那样,是一味扩散虚假消息的场所。其实在假消息出现不久,社交网络上各种辟谣的消息就已经出现了。

  从这两个例子可以看出,大数据新闻的报道方式能够在宏观上对某个事件看得更加清楚与全面,事件复杂的演进过程以及这个过程中的各个方面,都能描述得直观且有趣。