奇迹之流WonderfloW

Nothing Replaces Hard Work!

《大数据时代》

| Comments

从古至今,无论是东方的神灵还是西方的巫师,人们都一直怀揣着想要预知未来的美好愿望。如今,大数据时代来临了,就像显微镜让人们观测到了微生物的世界一样,对大数据的收集、分析、处理给我们预知未来带来了极大的可能。

自从人类进入了信息时代,每十年都会出现一次巨大的技术革命。从1980年开始,信息技术的基础设施开始在各地搭建起来;1990年,个人电脑开始普及,各类桌面应用程序如雨后春笋般涌现;2000年,互联网普遍进入了人们的视野,上网慢慢变成了习惯,打开浏览器就能做你想做的事情;2010年,云时代的序幕业已拉开,移动互联网新兴,人们的数据在云端存储同步,随时随地都可以访问,你可以使用的设备也变得五花八门起来;不久的将来,到了2020年,接入网络就会变得像呼吸空气一样简单,信息和数据会像供水和供电一样变成生活的常规。

毫无疑问,正是因为这历次信息技术的变革,我们学会了如何用数据记录下我们的行为,我们学会了如何理解我们记录下的包括文字、音频和图像这样的数据,让我们开始拥有数据化这个世界的能力,让大数据成为了可能。当文字变成数据,人可以用之阅读,机器也可用之分析;当方位变成数据,地球本身变成了可量化的基础,人们的行为开始变得可预测起来;当沟通变成数据,数据化就已经触摸到了我们的关系、经历和情感,社交网络无形中把我们的态度和情绪也转变为了可分析的形式。

只需要一点想想,万千事物就能转化为数据形式,“黑客帝国”中尼奥眼中的世界似乎并不遥远。

《大数据时代》一书中,把大数据的利用归为以下几类:

  1. 数据再利用。亚马逊利用用户在买什么、看什么这样的数据,提高了推荐引擎的性能;移动运营商记录人们手机在各地连接基站的信息,来微调网络的性能、决定哪里需要升级基础设施。

  2. 数据重组。丹麦癌症协会通过匹配1985年手机推出后所有手机用户和癌症患者的数据,来分析使用手机和患癌症的关系。随着大数据的出现,数据的总和比部分更有价值。把多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和来的大。

  3. 可扩展数据。数据收集起来后,往往还能起到设想之外的用途。比如,零售商店内安置的摄像头,除了防止扒手以外,还能跟踪在商店里购物的客户流和他们停留的位置,以设计最佳的布局并判断营销活动的有效性。

  4. 数据的折旧值。也许你会认为亚马逊存储一个客户十年前购买的某本书的数据已经因为过时而一文不值,然而通过与新数据的同期对比,旧数据依旧会产生价值。

  5. 数据废气。微软和谷歌的拼写检查系统的实现就是对数据废气利用的鲜明对比。微软每年耗费数百万美元通过不断编译和更新最新的字典,创建和维护它的拼写检查程序。而谷歌则根据每天处理的30亿查询中输入搜索框的错误拼写,通过反馈循环将用户实际想要输入的内容告知系统。在你输入错误时,搜索结果页面顶部会显示:“你想要搜索的是不是:大数据时代”,用户通过点击正确的术语来告知系统之前的拼写错误。谷歌的拼写检查系统把那些“不标准”、“不准确”、“有缺陷”的数据也派上了用场。

大数据这条庞大的产业链也由数据、技术和思维三足鼎立。分别产生了大数据掌控公司、大数据技术公司以及大数据思维公司和具有创意的个人。

然而让数据主宰一切是有风险的。人们时刻暴露在“第三只眼”之下,淘宝监视着我们的购物习惯、谷歌监视着我们的网页浏览习惯,微博似乎什么都知道,手机上的GPS系统在方便我们导航的同时也暴露了我们的行踪。大数据时代的人们,很难保有真正的隐私。

所以《大数据时代》又提出了关于数据管理的变革:

  1. 个人隐私保护,从个人许可到让数据使用者承担责任。以往的在收集数据时告知用户风险并获得许可的方式不再管用,应该通过对数据使用者的规范让责任由使用者承担。

  2. 保护个人动因。人们无需为通过数据分析预测出来的行为倾向负责。

  3. 大数据“算法师”。他们有两种形式:在机构外部工作的独立实体和机构内部的工作人员——正如公司内部的会计人员和进行鉴证的外部审计师。他们的存在是保证数据分析和预测的公平与保密。

  4. 反数据垄断。防止权力的滥用。

凡是过去,皆为序曲。大数据时代的到来,给未来充满了无限的遐想。