Google中日韩文搜索算法主要设计者吴军:区块链可能是大数据安全解决之道

2018-11-07 13:58:00 来源:巴比特

今年的大会主题是「大数据推动数字经济(Big Data Drives the Digital Economy)」,CNCC 邀请到近 400 位国内外计算机领域知名专家、企业家到会演讲。大会次日,共有九位嘉宾带来特邀报告,第二位特邀嘉宾是 Google 中日韩文搜索算法的主要设计者吴军,他的报告题目是《超级智能时代》。

吴军博士认为人工智能的发展趋势是「超级人工智能」,未来的世界应该是强连接的,而这种强连接带来的好处包括:更好地保障食品和药品安全以及交易安全,还能够更好地追踪健康,让人能够更加及时发现病症。同时,他也指出这种强连接会带来隐私隐患、风险和危害,例如,IT 巨头掌握并控制大量的数据信息,一旦泄露就会导致巨大的隐私风险;黑客犯罪成本接近零,巨大的收益将会鼓励他们进行网络犯罪。这些问题可能是用法律无法解决的,所以我们需要尝试从技术的角度来解决它们。

针对大数据带来的隐私隐患,他表示,区块链是可能的解决方案。这是由于其具备如下特点:

一是这项技术将所有权、使用权和验证分开了,更好地保证了公正性;

二是较高的安全性,其理论上是无法破解的;

三是方便性,可随意合并打包和拆解,能很好地进行追踪,极大方便了溯源;

四是低成本;

五是透明化程度高。

至于区块链在具体应用场景中的作用,他提到两点:第一,去中心化,能够存放病例等数据信息,使得使用者和拥有者都能从中获益;第二,是智能合约方面的应用,能够使用区块链监控贷款还款以及拨款等问题,所有的执行完全由算法监控,这使得相关人员都无法进行人为违约。

以下为他的演讲内容,雷锋网 AI 科技评论做了不改变原意的编辑整理。

1

Google 中日韩文搜索算法主要设计者、博士吴军

这是一个学术会议,我发现在中国,冠以「中国」开头的会议都是最高的,冠以「世界」的会议我都不参加——因为可能没有什么收获。在座的各位都是专家、学者,我站在这里显得有些班门弄斧,而且有时候我发现学术界存在一个鄙视链,做理论研究的看不起做应用研究的,而我是在鄙视链的最底层。

今天我讲的题目跟人工智能有关,因为我发现本次会议,大概有三分之二的报告内容跟人工智能有点关系。如果在十年前我们开这个会议,一定不会出现这样的情况,那为什么今天会出现这种情况呢?很大的原因是,2016 年 AlphaGo 赢了李世石,这成为了人工智能技术的一个节点。

人工智能的发展趋势:「超级人工智能」

从 2016 年至今,我的感受是人工智能的发展有这么一个趋势:它从类似于人的单一的智能单机或者说系统智能变成了网络智能,所以我把它叫做「超级人工智能」。

很多人问我怎样判断一个人研究的课题是真是假?我说很简单,如果要造飞机,那些在研究鸟类飞行的就是骗子,因为他需要研究的,其实是空气动力学。如果我们能够找到他所做研究的一些科学基础,那他就是在真正做人工智能研究。

2

今天,人工智能有三个基础:

第一个是摩尔定律,我们计算机从业者原本都对它有一个理解,我将换一种方式来讲怎样理解摩尔定律;

第二个是数据,今天的人工智能之所以成功是因为有大数据的支撑;

第三个是数据模型。

两年前,一位原来做深度学习的同事跟我说,他过去每次参加机器学习类会议,大概能够坐 100 人的会场只坐了 10 个人,这 10 个人还都是去做报告的。深度学习本身是一个数据模型,我们可能还会找到更好的数据模型,不过这是机器的特长,而不是我们人的特长。

除了人工智能,还有两件事发展得非常快,一个是 IoT,这使得我们跟踪东西变得不再那么困难;另一个是区块链。

最近有一个热门的话题叫做 5G,今天你的手机上网,哪怕是看 4K 电视,网速都是够的,那为什么还要 5G?在场有一千多位参会者,如果把我们的桌子、椅子都连接到一起,不管带宽多少,当我们同时上网时,网络都会变得非常阻塞,所以我们需要一个更好的上网方式。在 5G 时代,如果将所有的东西都连到网上,会怎么样?带来的第一个好处是我们可以跟踪很多事情。

讲两个很简单的真实例子。第一个例子,在教室装上摄像头来了解每一个学生是否有好好听课(这件事有没有侵犯隐私我们另说);另外一个是更现实的应用,如果你有孩子的话,当课后送他去补习班后,他可能在那边玩手机、橡皮,而在这样智能化的教室里,你就可以很好地监控孩子的动态。

3

在生活中我们还可以用这项技术来追踪更大的问题,比如说食品安全。阿里巴巴的人跟我说,中国的食品安全问题还很严重,这个问题也很难解决。后来我还通过一些做药品的人了解到,很多药店卖的是假药,一种情况是他不知道自己进的是假药,另一种情况是制药厂可能都不知道自己制造的是假药。还有反欺诈的问题,刚才黄教授讲了智能合约这个概念,如果我们将合约都变成这类智能合约,是可以解决违约、欺诈问题的。

此外,我们还可以进行健康跟踪。现在任何一架商用客机上都装有一千多个传感器,每天能产生超过 1 G 的数据,可以很好地监控里面的温度、湿度以及其他运行情况。但是人体内没有传感器,以至于今天很多人在得知自己得了癌症的时候,已经是晚期了。我们对自己身体的监控,做得远没有像对很多设备的监控那么好。今天特斯拉汽车里面装了几百个传感器以及计算功能强大的芯片,你买个非电动的汽车都有 200 个传感器。我们为什么不去做追踪人体健康这件事?一是因为有难度,二是因为存在隐私隐患。

4

今年 Facebook 出了一件大事,被曝卖掉了 5000 万客户的数据,而扎克伯格作证时则说他们卖了 8700 多万客户的数据。我们说云计算好,很大程度上是因为它安全,有专业的团队替你管理数据,不过有时候,专业团队的管理并没有我们想象中那么好。更重要的是,我们的信息安全需要建立在大公司的善意的基础上,一家大公司作为一个经济实体可以有这个善意,然而公司里面操作业务的人是否有这种善意,我们就不得而知了。所以,我们需要从技术的角度来解决这个问题,因为有时候我们不能完全靠法律——法律总是滞后很多。

区块链可能是大数据隐私隐患的解决方案

对于网络连接带来的隐私隐患、风险和危害,区块链是一个可能的解决方案。不过因为这个概念实在被炒得太热了,以至于现在大家都还在怀疑它是否是泡沫。

为什么说区块链可能是一个解决方案?因为它有一些很重要的特点:

第一,它在数学上很漂亮。它使用非对称的加密,公开密钥;你可以确认真伪,但是不需要拥有;你可以访问信息,但是无法修改。

第二,从理论上来说,区块链是无法被破解的,它很安全。

第三,区块链的使用很方便,你可以随意合并打包和拆解。这也让商品和药品的溯源变得更简单。

此外,区块链还有成本低、透明等特点。

5

然而,现实的情况其实不是这样的。

一是区块链使用起来很不方便,因为它的协议还很粗糙。

二是成本非常高。大家可以猜想一下,如果我们用比特币来买咖啡,成本有多高?大概是 12-15 美元。此外,还存在交易延迟问题,平均的延迟时间大概为两三个小时。刚才黄教授提到以太坊十分之一秒就能完成一笔交易,不过吞吐量是一回事,真实的交易又是另一回事。

三是透明性问题。今天真正实现了应用的区块链,从逻辑上来看是透明的,但是在现实应用中企业会考虑很多中间环节,因此最终也变得没那么透明了。

不过我认为,任何一个问题都是一个机会,如果世界很完美,我们就都没有工作了,而恰恰就是因为世界不完美,才需要我们在座的计算机科学家去做一些事情,比如说刚才讲到的效率或者说延时问题。

第一代区块链协议是比特币,第二代是以太坊,以太坊是怎样提高效率的呢?打个比方,滴滴司机有两种方式接单:一是抢单,谁抢到就是谁的;二是由滴滴来进行订单分配。比特币的协议采用的就是抢单的方式,有很多交易需要验证真伪,最终会由第一个抢到的人进行验证,如果他验证出来了,这笔功劳就是他的,当他验证的足够多的时候,就会得到一个比特币的奖励。在大家一拥而上抢单的时候,整个验证过程的效率就变得很低,以至于每一次交易验证都需要花很多时间。

6

而以太坊的协议是,如果你想参与我们的验证工作,就要先买以太币,然后再根据你们手上所买的以太币数量,按比例进行分配。这样,区块链就从技术上解决了延时问题,从而提高了效率。

以太坊今天的价值为几百亿美元,虚拟货币市场是两千亿到三千亿美元。当到第三代区块链的时候,有可能把延时从以太坊的几分钟减少至几秒钟。

区块链的具体应用

区块链到底有什么用?

一是能够保护跟踪我们的隐私。斯坦福大学的一位教授发现,现在所谓的医疗病例数据共享在美国几乎是不可能实现的,病例数据共享在中国谈了这么多年,到目前为止也还没能实现,原因就是大家对隐私的担忧。有些人是坚决的反对者,他们认为一旦病人的数据泄露出去,比信用卡的数据泄露还要严重得多。

此外,还有两个严重的问题:一个是医院不愿意共享数据,另一个是病历的归属问题。从现在的实际情况来说,无论中国还是美国,病历都属于医院,医院内部的信息系统是很难对外开放的。另外,即使法律上将病历归属于病人,你也没有办法把它放到你家的计算机里。

如果有一个去中心化的地方存放病历呢?如果将一个病历开放给医院,每次访问收费十美元,医生都愿意支付查看。这就意味着如果你真有一个疑难杂症,一年收入可达十万美元,另外当一些研究者对这个病历感兴趣时,他们也会买来查看。而今天大家对 BAT 不满的是,他们卖你的数据,获利的却是他们。区块链则提供了一个可能性:将数据还给大家,让所有者从中获益,同时也让使用者从中获得更大的应用。

二是智能合约的应用。中国过去在商业上有一个词——三角债,这个问题很难用现有的技术从根本上解决。为什么?比如在之前还欠别人的款的情况下,你再去向银行贷款建工厂,因为所贷的这笔款是可以很快被挪用的,经银行批准后,你就可能把钱挪做他用,最后就形成三角债,从而导致经济运行效率的下降。只要是由人来进行拨款,三角债问题就很难被解决。

人工智能发展到现在会进入一个新阶段,而人工智能和人的区别在于群体效应,比如无人驾驶汽车,将来会将整个城市的所有车都连成一张大网,从而带来极大的网络效应。

如果把人工智能想象为一个人,IoT 相当于是它的五官,计算机程序就是它的大脑,许多连接会带来大量安全隐患,在这种情况下,区块链有可能成为一个很好的解决办法。

虽然区块链现在还存在很多问题,跟它相关的项目可能 99% 都是骗人的,但是我们确确实实看到区块链可以用来做跟踪,来解决现有技术所解决不了的一些难题。

最后与大家分享我的观点:任何时候当你碰到问题,倒过来看可能就是机会。这个世界上有各种各样的问题,当应用上出现困难的时候,可能就是在座每一位计算机科学家的机会。

相关阅读:

贵阳将建河湖大数据平台

联通大数据进入数智新阶段 大数据战略图谱逐步完善