相当吸引人的内容,这几年大家一致在炒作大数据的概念,仔细想想也是很有趣的事情。大数据,或者叫海量数据(可能是那些公司暂时想不到一个能让公众理解的比这个词更能形容无限大的词了),本质是什么?就是碎片数据,所有的碎片数据,包括你每天眨眼的次数,你早上坐公交车的时候你身后那个女人的衣服颜色,你同事看到你说的第一句话,你的狗狗今天掉了多少根毛,这些都是最基础的数据,而互联网企业做的是收集所有互联网上的碎片信息,比如某个词被搜索了多少次,某个IP地址在某个时间内都访问了哪些网站。所以信息的收集是所谓大数据的第一步,收集到了以后要做什么?找到数据的关联性,如果有100个叫张三的人,他们的手机号码不同,但其中有23个人来自北京,其中11个人去过香港,找到数据的关联性就是要做的第二步,当然这些都必须由计算机完成。接下来呢?最重要的是查询,提供基础信息,比如张三+13000000000+香港+北京,简单的基础信息输入系统,系统要帮你找到所有这个人在互联网上的信息,主要是那些你不知道的(如果都知道也就不需要查询了)。
上面也许是互联网针对大数据能做到的东西,当然目前的这些互联网企业也没有实现,没有实现的原因很多,大而全就不可能精准,关键还有隐私问题,最主要的是对于企业盈利是关键,所以广告的精准定位也许是目前大数据在互联网行业的主要应用,简言之就是根据你在网上都做了什么知道你的兴趣点,给你推送不同于别人的广告信息。
而沃尔夫勒姆也许想做的是寻求宇宙的规律性东西,这个很恐怖的,如果可以实现,那么就能模拟当初爱滋病毒是在什么条件下诞生的,就能准确预测微软未来的股市走向,呵呵,有趣。