除此之外,商业、制造、交通出行、教育等传统行业也都与大数据产生了交叉点,他们的运行方式也必将随着大数据应用的不断进步而有所改变。
正在发生的未来2
21世纪初,曼哈顿地区检察官办公室有一个名为麦克·弗劳尔的律师,在他从事律师期间,负责过从谋杀案到华尔街金融犯罪等多种诉讼案件,可以说是闻名遐迩。后来,他转到一家大型的企业律师事务所工作。但在一年以后,他发现,这种生活对他而言是毫无意义的。于是他决定离开,并想要去帮助重建伊拉克。所以,他委托朋友向公司高层提出了自己的请求。最终,他如愿以偿地被委派到了绿色区域,即美军驻巴格达市中心的安全地带,成为萨达姆·侯赛因审判律师团中的一名律师。
在这里,麦克·弗劳尔主要负责将证人安全运送到绿色区域。但这个过程却是非常艰难的,其间需要通过避开无数个每天都会上演随时都会出现的简易爆炸装置的袭击。在这个过程中,他了解到了军队人员是如何将这当作数据问题来进行处理分析,并预测出一个较为安全的运送路线的全部手段。
所以,在他回到纽约后,麦克·弗劳尔便想利用这些方法去打击犯罪。之后,他被任命为专案组成员,研究可能揭露2009年次贷丑闻罪犯的数据。弗劳尔利用自己所了解的数据分析方法将这个任务完成得非常出色,这也让当局认识到了数据分析的重要性。一年后,纽约市市长布隆伯格要求扩大规模,弗劳尔则成了第一个“分析主任”,而他的任务则是寻找一些优秀的数据科学家组成一个团队,对城市尚未开发的信息进行分析处理,收获一切可能的效益。
起初,弗劳尔也找到了一些颇具权威的统计学家,但却发现他们大多利用传统的思维去分析问题,所以他便果断放弃了他们。弗劳尔说:“我需要的是拥有敏锐洞察力和强大执行力的人,一些只懂喋喋不休研究数字的人,并不是我所关注的。”最后,弗劳尔一共选择了五个人,其中四个都是刚走出学校的学生。用弗劳尔的话说,这些人都具备常人难以企及的创造力。
事实也正如弗劳尔所料想的那样,利用通过对大量数据进行分析和处理,他们在短短几年时间就取得了很大的效益。其中,他们负责的“非法改建”一案,就是一个经典的解说。
最初,他们的工作也会遇到很多困难,因为可以利用的许多数据的形式过于多样化。就拿“非法改建”一案来说,他们在进行过程中就遇到了很多问题。比如说,在一座城市里,对某一地段的地理位置的描述是多种多样的,所谓见仁见智,其价值也就各不相同。而且,每个机构和部门也都有自己的描述方式。这就导致了数据难以统计,并且使这些数据拥有了不确定性。
但这些困难并没有让弗劳尔退缩,他和他的伙伴们在不断的探索中,还是找到了处理的方式—以笛卡尔坐标系为基础,取用周围建筑物周围的一片辐射范围,并从其他机构的数据库调取出地理位置数据,并将这些数据整合,建立一个系统系统。这些数据并不精确,但是由于信息量的巨大,恰好弥补了这点不足。
虽然他们的工作得以顺利进展,但弗劳尔和他的团队并不满足于仅仅对数据进行运算更多的时候,他们会亲临现场,对现场工作进行观摩和记录,并且询问一切流程的开展效果。随着时间的推移,弗劳尔和他的团队对数据采集分析处理的手段也越来越多,数据也越来越精确,可以说为城市的发展,绘上了浓重的一笔。
时至2011年,弗劳尔和他的小伙子们已经能够利用他们的系统和方法,对“非法改建”之类的投诉进行全面系统的分析,并将他们认为前5%有火灾危险的投诉转交给检查员立刻跟进。事实上,他们分析的结果总更是让人瞠目结舌,所有案件的后续发展都与他们推断的结果惊人地一致。再想想他们的工作方式,更是令人惊心动魄。他们所能够利用的仅仅是一些搁置了多年的数据而已。而他们正是运用了自己的新方法对这些信息进行了管理分析,从中提取出它们真正的价值。想要做到这一点,除了需要敏锐的洞察力之外,最为重要的一点,就是大量的数据。只有在大数据的前提条件下,他们才能够做到如此精确的预算,而这在较小数据中是做不到的。
这也就是大数据的缩影。
至此,通过弗劳尔的经历,我们可以得知,大数据的运用已经代表着“信息社会”正式降临。也就是说,我们所收集到的所有数字信息,都可以利用现在已有的技术手段进行分析,然后加以利用。
现在,我们能够获取信息的渠道已经越来越多,可以用来分析的数据也越来越充分。因此,我们可以毫不夸张地说,数据已经不再是限制我们努力的因素了。我们可以利用更多的数据,甚至是全部的数据。但是这需要一个前提,就是利用非传统的方法,改变理想中我们想要知道的有用信息的因素。可以肯定的是,随着大数据应用的大量涌现,数据量将继续增长,与之相对的处理信息的能力也会逐步增长。但是,现在很多人的思维还存在一个误区,那就是将大数据当作一个技术问题,认为大数据的发展应该侧重于硬件或软件。其实不然,硬件或软件的问题固然会影响到我们对数据的利用,但我们现在更应该考虑的是,在我们利用数据做出分析后,我们应该去做什么,或者说是会发生什么。
在这个问题上,我们在分析数据的准确性、正确性、纯洁度和严格度时,也要允许一些不精确的存在。要知道,某些数据本身就是模棱两可的,并没有绝对的完全对或错的限定标准。尤其是当数据的规模和幅度扩大时,这些数据上的混乱所能带来的影响就微乎其微,甚至可以忽略不计了。相反,或许这些数据还能给我们带来一些意想不到的好处。比如说,当我们只想使用一小部分数据时,就根本没必要捕捉这么多的知识细节,我们只需要了解信息的大概,就能够解决问题。这样一来,这些稍微有所欠缺的数据就成为我们的首选,既不会影响大局,又能使我们达到目的。同时,利用这些数据,我们也可以用更快捷便利的方式找到数据的相关性,而且效果还会更好。所以,我们就可以省去寻找因果关系的努力。当然,很多时候,我们对于数据还是要严谨对待的,尤其是某些行业,我们更是需要利用一些精心策划的数据来做因果关系的研究和控制实验,只有这样才能不带来负面影响。比如,测试药物的副作用等。但在日常情况下,我们只需要知道“是什么”就已经足够,根本没有必要去弄清楚“为什么”。由此可见,大数据的相关性比人们探索数据的“因果关系”更有前景和领域。
另一方面,我们也要了解到,大数据在给我们带来巨大利益的同时,也会给我们带来巨大的风险。首当其冲的一点,就是它会使得一些保护隐私的法律手段和核心技术失去效果,部分个人隐私将不再属于私密范围。比如,名字、社会安全号码、税收记录等。这还只是其中之一,更为让人揪心的是行为倾向的问题。随着大数据预测的准确性越来越高,能够预测行为的发生已经不足为奇,一些国家甚至仅凭数据分析,就在人们犯错之前做出惩处,这是让人非常难以接受的。这不仅违背自由意志的原则,同时也否定了人们会突然改变选择的可能性。因此,在利用大数据对个人进行评估分析时,必须要保证人类意志神圣不可侵犯的权利。
与此同时,从个人出发也应该做出一些相对应的方案,来面对大数据的汹涌来袭。首先便是建立一个规范自身的新准则。随着大数据的特征和缺陷越来越被人所熟悉,我们需要把进行隐私保护的责任从个人转移到数据使用者身上。意思就是说,数据使用者要以负责任的态度使用数据。
另外,大数据的深度开发和数据应用的广泛涌现,也使得大数据成为理解和解决当今许多紧迫的全球问题所必备的工具。比如气候变暖问题。在这个问题上,我们需要对污染相关数据进行分析,并利用分析的结果制定合理的方案,来指导努力的方向。而世界贫困人口迫切需要提高医疗保健服务、降低医疗费用等问题,在很大程度上,也可以利用数据的自动化来实现。甚至现在许多需要通过人为判断才能进行的事情,都可以利用大数据,通过电脑完成。如癌细胞活检、传染病爆发前期的模式预测等。
当然,大数据所能够带来的价值远远不止这些,它在发展经济和预防冲突方面所带来的作用也是不容小觑的。基于手机动向数据显示,非洲许多贫民窟地区的经济活动十分活跃,这就表示着这片区域还有极大的市场有待开发。同时,大数据还能从侧面揭示出最可能引发种族关系紧张的社区,并分析出解除难民危机的方式。当然,所有这一切的前提,都需要一个与之相对的科技水平,只有科技应用至生活的方方面面,大数据的应用范围才能进一步被扩大。
在我们享受大数据给我们带来便利的同时,我们也要谨守根本,断然不能忘记数据本身的概念。要知道,大数据并不是魔术棒,不能带来世界和平,也无法从根本上解决贫穷问题,更不能创造出另一个爱因斯坦。所以,我们对大数据的使用,要秉持尽量开发、最大程度实现其价值的观点,而不要对其产生盲目的依赖。否则,就会如同前文所讲的英国板球教练一样,最终被大数据所累。
但我们却不能否认,时至今日,大数据已然成为我们日常生活的一部分。而且因为它的出现,人们对未来的看法也发生了巨大的改变。
也就是说,因为大数据的广泛开发,未来对于我们已经不再那么的神秘。通过大数据预测分析,我们对未来的发展就能够有一个模糊的蓝图。这就代表着,我们可以根据大数据分析出未来某一阶段内,自己可能会做出什么样的行为,并做出相应的调整。说起来或许有点匪夷所思,好像算命先生的趋吉避凶一样,但大数据确实能够起到这样的效果。只是,我们想要精准地分析出一个结果,确实殊为不易。而且,想要改变以往的行为方式去做出完全背道而驰的行为,也是十分困难的。因此,通过大数据做出分析,也仅仅说明,未来的可塑性空间变大而已。真正想要改变未来,至少现在的手段还是无法满足的。但在很多方面,因为大数据的分析,我们还是可以有所作为的。比如,我们能检测到微小的癌变,并能够赶在疾病完全爆发之前进行治疗;或是预测到某种犯罪苗头,然后想办法去阻止。这样就可能减少一些悲剧的发生。甚至,我们还可以在发现某一区域存在火险的时候,及时做出防范措施,这样就可以免除一场致命的火灾。
因为大数据的作用,所谓“命中注定”这一原理,就不攻自破了。我们能根据手中的信息而制定出相应的对策,就能够改变一些事情发展的固有轨迹,甚至是将其提拔到另一条新的轨迹上。但我们也要认识到,大数据的预测结果也并不是完全正确的。只能说,它提供了一种可能性,而我们也只能根据这种可能性去施为。如果这种可能性成为了现实,而我们也已经有所准备,那么,我们可以毫不夸张地说,我们已经改变了未来。
未来正在发生3.既然大数据能够改造我们的生活,也能优化和提高工作效率,那是不是说,我们所坚信的信仰,我们根据生活经验总结的直觉,还有事物发展的不确定性,都已经被推翻了呢?
我们必须承认,大数据的开发应用,让我们对很多曾一无所知的领域有了认知,也帮助我们取得了更好的表现,拥有更高的效率。之前,我们已经提到,大数据并不是一个充斥着运算法则和机器的冰冷世界,“人”在其中依然扮演着至关重要的角色。因为只有人,才是对这些数据的直接作用者;也只有人,才能够让这些数据具有价值。从这个角度考虑,人类固有的情绪和性格,就会直接影响到大数据,包括弱点、错觉、错误都是这一过程中必然会出现的因素。因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。
也就是说,人类只有利用自己的特性,才能对大数据进行更有效的开发和利用,从而更好地服务人类社会。从这点说,大数据和人类特性中所存在的信仰、直觉、冒险精神、意外和错误等因素,是相辅相成的。试想一下,如果人类没有了特性,只有共性的理智,那么总结出来的数据就会如出一辙,其对人类社会发展是否还能起到作用,也就不言而喻了。
还有一点,我们必须认识到,人和大数据的关系是人在前、数据在后。只有人发现及发展出一些东西之后,数据才能对其进行完善。固然,大数据让我们试验的速度更快,发现的线索更多,为人类创造出更多新成果提供了一个深厚的理论基础。但却不能否认,发明的火花往往只存在于数据未显示出的信息之中。既然还未发明,那么它便没有真实存在,所以再多的数据也无法对其加以印证。在大数据的发展过程中,对包括创意、直觉、冒险精神和知识野心在内的人类特性的培养,是最为重要的原动力,因为进步正是源自我们的独创性。