当前位置: 首页 >> 书院学刊 >>《背景》第四十三期
大数据时代:计算将会改变世界……………………………涂子沛
作者: 发布时间:2016/12/22 点击次数:637 字体【

  

大数据时代:计算将会改变世界


   大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创新新价值,从而为社会带来“大知识”、“大科技”、“大利润”和“大智能”等发展机遇。


  用“社会计算”解决社会问题


  人类能以非常低廉的成本保存海量的数据,这是大数据时代的物理基础。大部分科学家相信,到2020年,只需花上一杯咖啡的钱,就可以把一个图书馆的全部信息拷进一个小小的硬盘(大约1T)。而社交媒体和可穿戴设备则把每个人变成了潜在的数据生成器,在此基础上,利用恰当的数据挖掘,大数据就可以产生大价值。
  大数据时代最大的亮点就是人和社会的计算,越来越多的社会问题都将通过计算得到解决。可以计算的原因是,个人在真实世界的活动和社会状态被前所未有地记录。
  2011年,美国佛罗里达州《太阳哨兵报》的记者克斯汀通过大数据调查警察超速行驶问题。她首先向当地的交通管理部门申请数据开放,获得了110万条当地警车通过不同高速路口收费站的原始记录,然后选取两个特定的收费站并测算两点之间的距离,再在110万条记录中找到每一辆警车通过这两个不同收费站的时间点,两点之间的距离除以其时间差,即为该警车在这段路程中的平均行驶速度。
  克斯汀的分析得到了令人震惊的结果。她发现,在13个月期间,当地的3900辆警车一共发生了5100宗超速事件,也就是说,警车超速的行为几乎每天都在发生,当地1/5的警车都有时速超过144公里的“劣迹”,而且,时间记录表明,绝大部分超速行为发生在上下班时间。这意味着,他们开快车并不是为了执行公务。
  克斯汀的报道一见报,舆论一片哗然,当地警务部门则发生了一场“大地震”,5100宗超速案件涉及12个部门近800名警察,一些被“坐实”的警察陆续受到处理。
  那么,警务部门的整顿是否有效呢?2012年12月,克斯汀又向交通管理部门申请开放了最新的原始数据。数据分析表明,从2012年2月到10月,警察超速的个案已经从2011年同期的3179宗下降为495宗,下降幅度高达84%。
  可以想象,如果没有上百万条充沛的数据记录以及成熟的数据分析手段,类似于“警察群体普遍开快车”的社会问题,人类可能永远都无法在法庭上得到证实,这种知法犯法的特权行为,也永远得不到有效的治理和纠正。
  2004年,社交媒体产生之后,社会软件的功能被发挥得淋漓尽致,个人的行为和思想通过脸谱网、推特、微博等工具被广泛记录,有学者进一步明确主张,将基于社交媒体的行为分析称作“社会计算”。近年来,随着大数据的崛起,越来越多的学者认为,关于人和社会本身的数据现在已经极为丰富,而且这类数据还在快速增长,未来一切的社会现象、社会过程和社会问题,都可以而且应该通过以计算为特点的定量方法分析解决,这样更加精确、更加科学。
  社会领域的计算、对类似知识和关系的捕捉,不仅能够有效推动社会治理,还能产生商业价值。
  2012年6月欧洲杯足球赛期间,中国国内出现了多篇《男人一看球,女人就网购》的相关报道。报道称,根据淘宝网的销售数据,欧洲杯开赛以来,女性网购的成交量明显上升,而且“网购的高峰期延时两个小时,变成了23点到24点”,此外,在“凌晨1点45分第一场球结束到凌晨2点45分第二场球开始前”,出现了一个新的网购高峰,这个新的高峰和赛前的同时段相比,成交量“增长超过260%”。
  在小数据时代,“男人一看球,女人就网购”永远是一个猜测,无法得到证实,但在大数据时代,很容易就能证实,甚至连成交的商品有什么特点,都可以进行分析。等第二年球赛再开始的时候,商家的广告就可以更有的放矢,不仅可以把广告对象瞄得更准,推广的商品也会更有针对性,猜测上升为知识,知识将创造利润。


  3D打印时代“想法即产品”


  2012年以来,第三次工业革命、新工业革命、数字工业革命等各种工业革命论的提法频频在全球激起讨论,虽然这些提法各异,但其中心思想是一致的,即全球的制造业正在面临一场挑战和变革,未来的工业制造将呈现数字化、智能化、定制化、互联化以及绿色化等特点。而且,无论哪种提法,都离不开对3D打印机的关注和讨论。
  学界的共识是,3D打印已经成为第三次工业革命当中最活跃的因素之一,它将终结人类大规模工业生产的历史,引发商业组织和管理形态的重大变革。而3D打印对未来设计、生产、流通和消费等各个环节产生的影响,离不开数据的驱动和协同。也就是说,第三次工业革命离不开数据!
  首先,3D打印是以“数据包”为基础的生产,只要这个数据包在打印机上运行,并且具备打印的原材料,生产就可以完成。2013年5月,美国有人把制造枪支各种零部件的数据包上传到了互联网上,在美国政府发布禁令之前,该数据包被下载了数十万次,民间就有人利用这些数据包打印出了可以发射子弹的塑料手枪。半年后,美国的科技工程公司SolidConcepts公司又用3D打印机打印了一支真正的金属手枪,并试射了几十发子弹。除枪支这种高危管控物品外,近一两年来,可以打印的物品种类迅速增多,大到飞机的零部件、房子的建筑材料,小到下颚骨、心脏瓣膜、电路板等不断刷新人们的想象力。可以肯定,随着数字化生产的扩大,未来任何可见的物理实体的背后都会有一个数据包与其对应存在。从这个意义上来看,3D打印为大数据时代贡献了一种新的数据种类:物理实体数据。
  除了可以打印的物品越来越多,更重要的改变是,由于摩尔定律的持续作用,3D打印机的价格也在不断下降。目前,不少3D打印机只需要一两千美元,可以预计,就像其他曾经“高大上”的硬件设备一样,3D打印机也将快速走进普通家庭。
  3D打印机的普及对人类的意义非同小可。在全面畅想其对未来社会带来的冲击和改变之前,我们还必须了解一个重要的概念:众包。
  “众包”是美国的两位记者在2005年发明的新词,意思是利用互联网将工作打包分配出去,其关键在于,分包时并不知道接包人是谁,这正是“众包”区别于“外包”的地方。众包最经典的例子是维基百科,目前仅仅英文词条就有近450万个,全部由志愿者完成。
  除了基于兴趣和公益的志愿贡献,众包也已经成为一种可以创造价值和利润的商业模式。2002年,卡内基梅隆大学的博士生路易斯发明了验证码时,《纽约时报》正面临一个令人头痛的任务:他们试图把100多年的历史报纸全部电子化,当时最可行的方法就是通过扫描进行光学字符识别。但路易斯想到了一个天才的办法:全世界每一天都有几亿个验证码在被校验,他把《纽约时报》的文章切成小片,把它当作验证码发给全世界的人,这些人在使用验证码的时候,在不知不觉中就帮助《纽约时报》完成了输入和校对。对于难以识别的字符,系统可以发给多个校验者,当几个人返回的结果一致的时候,就说明识别的结果是正确的,然后再把这个结果返回系统进行整合。2007年,路易斯成立了验证码公司reCAPTCHA,该公司利用这个办法把《纽约时报》几十年的报纸都电子化了。2009年,该公司被谷歌收购。
  随着3D打印机的普及,众包这种新的商业模式,将从服务业进入制造业,改变整个社会的生产制造方式。
  数字化制造不需要在流水线上定制,只需要找到数据包,对其中的代码和数据进行修改,在3D打印机上再运行一次,一款新的产品就生产出来了。
  不妨假设一位女性消费者心仪的高跟鞋是这个样子:玫瑰花的立体花形;5.5厘米的高跟,后跟为圆形,圆形面积为0.8平方厘米;鞋面有细条纹,条纹间隔为1.5厘米……其要求可能无比细致且千奇百怪,传统制造业绝对无法实现,但在3D打印时代,“想法即产品”:首先上网搜索类似产品的数据包,或者搜索懂得修改这个数据包的设计师,再委托他按照新的要求进行修改,一个有经验的设计师可能在几分钟之内就能够完成修改;这之后,进入生产环节,消费者要寻找愿意给她提供打印服务的3D打印机,这又需要搜索,她最后可能就在自己居住的小区附近找到了合适的打印机,双方达成协议之后,就可以委托生产。
  当然,未来可能出现一个互联网平台,拥有3D打印机的生产方也可以在这个平台上通过搜索主动寻找其潜在客户,提前感知并且响应用户的个性化需求。这个平台将不仅仅是现在的“电商”平台,还将是“互联网制造”的平台!生产方和消费方在平台上通过搜索对接,完成整个设计、生产和消费流程。也就是说,通过搜索和计算,全社会的生产需求和社会资源将在最短的时间内,以最经济的方式实现对接,数据和计算,将是未来生产制造的CPU(中央处理器)!


  未来企业会变小而非变大


  2012年8月,谷歌宣布,其旗下十多辆无人驾驶汽车已经完成了50多万公里的安全行车测试。在整个过程中,车队只发生过两起轻微的交通事故,事后的判定还证明,责任并不在无人驾驶汽车。
  对谷歌无人驾驶汽车而言,价值最昂贵的部分是其全身上下装备的激光雷达、摄像头、红外相机、GPS和一系列传感器等感应设备,仅仅激光雷达一项就7万美元,约占其全部装备价值的一半。这些设备实时收集数据,就相当于人类的眼睛,对无人驾驶汽车非常重要,但这还远远不够。在汽车上路之前,谷歌必须派出大量工程师亲自驾车在所有的道路上行驶,以收集各个路段的物理特点数据,然后把这些数据添加到一个高度详尽的立体地图上。当无人驾驶汽车在路上行驶时,它通过从传感器和摄像头上收集来的数据,首先与系统已有的数据进行对比和分析,以快速识别自己的方位和环境。这种对比分析,每秒钟进行上百万次。根据这些分析结果,算法在极短的时间内,判断是应该减速、加速、换道还是拐弯。
  可见,无人驾驶汽车完全是个大数据项目,而且其成功的关键,首先在于数据的收集。汽车是工业时代兴起的标志,大数据是信息时代半个多世纪结出的硕果,通过无人驾驶汽车,两者正在融合对接。这种融合对接标志着人类正在进入一个全新的时代:智能化时代。
  而且,和谷歌无人驾驶汽车一样,这个智能时代也是由数据驱动的。
  这是因为,无论是信息、知识,还是机器智能,在大数据时代,都是以数据为载体存在的。数据是对客观世界的记录,当我们赋予数据背景时,它就成为信息;当把信息提炼出规律的时候,它就上升为知识;当电脑、网络、机器能够利用某种知识进行自动判别并采取行动为人类服务的时候,机器智能就产生了。
  从无人驾驶汽车、智能学习平台、个人语音助理以及机器人领域取得的进步中,我们可以看到这个智能型社会的种种端倪。这将是一个由数据驱动、由算法定义的世界,自动化将接管越来越多的工作。毫无疑问,这是人类的福祉,人类将从中获得更大的解放,但同时,这个新的社会形态也将给人类带来空前的挑战。
  2012年9月,美国重思机器人公司推出了一款名为“Baxter”的商用机器人,这款机器人具有基本的“学习”能力,通过一小时的培训,它就可以在流水线上独立完成装货卸货、打包拆箱、检查和装配零件等重复性工作,一台Baxter的售价仅为2.2万美元,远低于一名普通美国工人的年薪。更重要的是,机器人不需要公司购买医疗保险、不会请假、不会抱怨、不会要求涨工资,可以保持同样的工作状态5年、10年甚至几十年!
  大部分科学家、经济学家相信,随着智能时代的到来,那些重复性的、日常性的工作将逐渐被机器人接手。2013年9月,英国牛津大学马丁学院的科研人员研究了自动化对人类就业市场的影响,他们在报告中总结说,在未来20年内,今天美国社会45%的工作,都可能被自动化和机器人接手。
  45%!这是任何社会都无法承受的失业率。
  今天的企业,首先在基因上就完全不同于工业时代的劳动力密集型企业。未来智能社会的主流企业,一定是知识密集型企业,就企业的大小而言,它将变小,而绝不是变大。Instagram,一款基于互联网的照片分享应用程序,拥有3000多万用户,直到2012年4月被脸谱网用10亿美元的高价收购时,整个公司只有13个人。WhatsApp,一个基于智能手机的社交媒体软件,在全球拥有4亿用户,在2014年2月被脸谱网用190亿美元的天价收购时,整个公司只有53个人。而脸谱网本身,在全世界拥有10多亿用户,全公司不足2000人。相比之下,几乎在全世界都拥有用户的推特公司更小,只有300余人。但在2013年被数字化技术击垮、宣布破产的柯达公司,其雇员最多时高达15万人,堪称工业时代的行业巨人。
  这场智能化的革命,将像旋风一样,逐步席卷整个世界。在全球化大背景下的今天,向智能型社会的迈进其实也是一场世界范围内的竞争,中国如何应对,值得认真思考,特别是在变化发生的早期阶段,有效的战略部署将对未来的发展起到决定性的作用。

  上一条:杂文家鲁迅和小说家鲁迅“有时会打架”…………………孙绍振  ()
  下一条:办一家只借钱给穷人的银行……【孟加拉国】穆罕默德·尤努斯  ()  

  发表评论
  相关文章             更多...