北极星

搜索历史清空

  • 水处理
您的位置:电网信息化云计算评论正文

大数据时代的“爆发”论

2012-09-12 11:37来源:新浪关键词:大数据数据库信息系统收藏点赞

投稿

我要投稿

只要遇到无法理解的事情,我们就会说那是偶然,似乎这种表面上的偶然行为推动了历史的演进,而事情发展之迂回曲折似乎如掷骰子一般。但这种偶然真正意味着什么?而法国数学家泊松指出,一旦我们承认人类行为是最随机的,它突然之间就可以被预测了。

悖论吗?其实有一个最适合说明的例子,正是掷骰子:虽然每次掷的点数无法预测,但整体是有规律可循的。也就是,大约每掷5到7次就会出现一次6,而掷100次都不出现6的可能性几乎为零。泊松的理论即为概率论中著名的泊松分布,而著名物理学家巴拉巴西则在《爆发》一书中进一步将观点明确为“人类行为93%是可以预测的”。

那么,当我们的电子邮件都在服务商的日志中;我们的通话记录、行踪都在运营商的存储上;我们买了什么东西、品味以及支付能力都在信用卡记录里;我们所有的微博、空间、个人主页,干脆展示在网站上……

这些记录的存在引爆了个人隐私危机,但它同时也创造了前所未有的历史机遇——它第一次毫无偏见地为我们提供了成千上万人、而不是少数人的详细行为记录。借助这些数据和强大的计算技术,物理学家、心理学家以及经济学家得以对某些问题仔细研究。他们有充分的证据证明,人类的大部分行为都受制于规律,而且它们的可重现性和可预测性与自然科学不相上下。这些发现并不只是科学家在纸上谈兵,其中一些模型和原理已经价值数亿,像谷歌和雅虎这样以追踪人类行为为商业模式的公司都身价不菲。可以说,它们颠倒了乾坤。在过去,如果想了解人类的行为和想法,你必须去考个心理学家证书,但现在,你可能需要先拿到计算机专业的学位。

推而广之,“无论什么事,如果不断收集材料,积之十年,总可成一学者”,每天进行的事情将成为这种“爆发”的基础。这意味着,时间是我们最宝贵的不可再生资源,如果我们尊重它,就必须剔除无关紧要的事;只有优先清单确定,幂律规律和你所期待的爆发,才会不可避免的出现。

同样,“历史不会重演,却自有其韵律”,如果能洞悉其中的规律,那么我们的未来,或许就掌握在大数据的手中。

《爆发》作者艾伯特·拉斯洛·巴拉巴西(Albert-LászlóBarabási)

本文后半部分为书摘,节选自湛庐文化《爆发——大数据时代预见未来的新思维》,作者为全球复杂网络研究权威、冯·诺依曼奖获得者艾伯特·拉斯洛·巴拉巴西。

作者或许并不为广大读者熟知,电信市场营销专家王煜全甚至在微博上发问:格拉德威尔的《引爆点》人人能懂,成了超级畅销书;凯文凯利的《失控》多数人读不懂,但人人奉为经典;巴拉巴西才是真正理解复杂网络的专家,他的《链接》同样系统而宏大,却没什么名气,这是为什么呢?有网友解释为网络时代的快餐文化,亦有人认为这是因为巴拉巴西的写作特点:大量举例描述,甚至看起来像小说,结论则需要概括才能得出。

投稿与新闻线索:陈女士 微信/手机:13693626116 邮箱:chenchen#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

大数据查看更多>数据库查看更多>信息系统查看更多>