您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

纯技术之间的争夺 大数据会被区块链摧毁吗

发表于:2018-04-02 作者:李富刚 来源:中关村在线

笔者在写这个标题的时候,已经做好被喷的准备。

你随便搜索一下“大数据 区块链”会发现,大数据与区块链的结合几乎是所有人都看好的。笔者并不反对这个观点,但如果从当下来看,大数据与区块链之间仍然存在着一些分歧,而这些分歧从某种意义上让大数据与区块链处在了对立的位置。

纯技术之间的争夺 大数据会被区块链摧毁吗

我们先看近期两个非常热门的例子。

第一个例子是大数据杀熟。一些平台的老用户发现,在花钱买服务的过程中,服务商报出的价格比新用户的要高,甚至苹果用户看到的价格要比安卓用户的高。而且这种情况非常普遍,在车票、机票、打车、酒店、电商等平台上都有一定程度的出现。经济学中称这种现象为价格歧视,大众则称之为大数据杀熟。

严格意义上来说,这只能算是数据杀熟,而非大数据杀熟。大数据有几个显著特点,除了海量,还有价值密度低的特点,可以理解为数据量很大但杂乱。而以上杀熟情况其实只是综合了用户的消费习惯、能力等几项数据,而且针对的是个人,更有小数据的特征。真正的大数据杀熟还会包含你的社交、位置数据,到那时候,即使你分享给朋友,也不会发现自己被杀熟了。

纯技术之间的争夺 大数据会被区块链摧毁吗
大数据杀熟

第二个例子是百度李彦宏说中国用户更倾向于用隐私换取便捷性。这是一个被动的事实,更准确的说法应该是中国用户被动的共享自己的隐私换取便捷性。这里面说的隐私数据其实可以算作大数据的一部分。通过云计算,对大数据中杂乱无章的数据进行分类检索,提取有价值信息,然后为用户提供便捷性服务。

为什么大家对李彦宏的说法这么反感呢,因为这其中涉及到隐私安全的问题。无论用户的隐私数据是否安全,随便获取隐私数据都是让人不舒服的,即使在中国这已经是事实。再联系到Facebook用户隐私数据泄露事件,隐私大数据的安全在当下依旧是个问题。

那上面这两个例子和区块链有什么关系?

2大数据与区块链的分歧

从上面两个例子我们能够看出,大数据的运用在目前仍然存在着一些问题。首先在运用方面还谈不上大数据,更多的是对小数据的处理,这样的好处就是更加精准,但数据的价值并没有全部用上。事实上这是一种无奈,因为企业已经能够收集用户很多数据了,现在随便注册个用户,都需要手机号,甚至有些还需要各种证明,用户早已经是裸奔状态。但如何分析这些杂乱的大数据,目前并没有好的解决方案。将大数据当作小数据用,是当下的无奈。

其次是企业应该怎么处理用户的隐私数据。企业收集到的数据是用户被动共享的,这一点非常不友好;企业利用用户数据时只是为用户提供了便捷性,有些服务甚至需要用户付费;用户在享受便利性服务的同时,也饱受广告的影响。

纯技术之间的争夺 大数据会被区块链摧毁吗
用户隐私数据已经成为商品

区块链在这些方面则提供了完全不同的解决思路。

狭义上的区块链可以理解为数据库,只不过这个数据库存储的位置比较分散,但这个数据库有着非常重要的特性,那就是不可篡改。这意味着这个数据库里存储的数据是完全真实的,而且还可以溯源,具有一定的规律性。它看起来像小数据,但数据量却是非常庞大的,而且涉及范围很广。它比目前大数据所提供的海量杂乱数据更加有序、精准、可靠。

同时区块链上存储的数据是不会被企业轻易获取到的。我们以购物数据为例,很多人的购物数据存储在区块链(公有链)上,也可以是运行在国家相关机关(可信任)的私有链上,刚开始的时候系统生成一个专有密钥(钥匙)。企业想要分析你的购物信息,就必须通过国家相关机关(锁)才能访问你的信息,但如果你不同意的话,国家相关机关这把锁就不会打开,企业自然就看不到你的数据了,用户就不会被迫共享自己的隐私数据了。

区块链似乎把当下企业利用大数据获取利益的路给堵上了。

网络上充满了广告,尤其是社交网络和搜索引擎,这让互联网变得乌烟瘴气,到处都是通过低劣手法吸引眼球的广告,其中还不乏虚假信息,像野火一样在互联网上肆无忌惮的燃烧。而企业则通过大数据更加精准的燃烧着每一个用户。区块链则递给了用户一盆水和一个木棍,浇灭了火,保护了自己的隐私。

纯技术之间的争夺 大数据会被区块链摧毁吗
互联网上充满了虚假信息

似乎区块链要是成了,企业利用大数据的手段就要完了一样。事实是这样吗?不全是。想必在笔者得出大数据与区块链对立的结论之后,很多人都有想喷的冲动。先别着急,继续往下看。

3区块链与大数据是CP

笔者做了一次标题党。

大数据与区块链之间不存在竞争关系,而且两者也无法直接进行对比。区块链是底层技术,大数据则是对数据集合及处理方式的称呼。所以“大数据会被区块链摧毁”是完全不会发生的。相反,区块链让大数据更加完美。

前面笔者提到大数据在当下所面临的问题,更多的是使用者在利用大数据的做法上存在单一性,大数据仅仅是技术,技术没有对错之分,但如何利用这项技术就存在着诸多争议。目前企业的做法是通过牺牲用户的隐私数据,形成一定程度的便携性服务回报用户,通过广告和收费制度获取利润。但对于大数据的运用,目前仍然存在着问题。

目前大数据确实能够收集到数量庞大的信息,其中的数据甚至掺杂着很多不实、不良信息。如何将这些不实信息从大数据中筛选出来,并对准确的信息进行分类整理、提取关键数据并形成联动,这是大数据目前面临的最大考验。现在很多企业依旧靠改进算法来提高对大数据的利用效率,耗费了很多人力物力。

纯技术之间的争夺 大数据会被区块链摧毁吗
区块链与大数据是一对CP

而区块链上存储的数据则不会出现这种情况。区块链上的数据是会形成链条的,它就有真实、顺序、可追溯的特性,相当于已经从大数据中抽取了有用数据并进行了分类整理。所以区块链降低了企业对大数据处理的门槛,而且能够让企业提取更多有利数据。

另外,大数据中涉及到用户的隐私数据问题,在区块链技术的加持下也不会出现。 用户完全不用担心自己的私人信息被偷偷收集,也不用担心自己的隐私被公之于众,更不用担心自己被杀熟。隐私数据使用决定权完全在用户自己手里,甚至可能会出现,企业会通过一定的付费手段获取隐私信息,用户从中能够盈利。

区块链与大数据是一对CP,区块链让大数据变得更加精准,甚至让大数据的特征与当下对大数据的定义有一定出入,笔者更喜欢称其为精准大数据;而大数据则让区块链中的数据更有价值,通过对区块链数据进行整合、分析、计算,得出更具有价值的规律和法则。

当然,区块链依旧方兴未艾,与大数据结合更是遥遥无期。不过两者之间的结合已经被认定是大势所趋,我们不妨静观其变。