亚虎娱乐中心-亚虎娱乐平台-亚虎娱乐游戏

互联网

红杉中国合伙人、原阿里巴巴副总裁车品觉:数据驱动智能变革

来源:艾瑞网    作者:yangkun      2018-11-16

导语:我们用大数据的能力帮我们开始进行开发,开发的过程中我们把AI的能力放在里面。

【艾瑞网 直播】2018首届粤港澳大湾区产业互联网峰会将乘势集结,于2018年11月16日在东莞万达文华酒店隆重举行。大会以“智无界·链万物”为主题,汇聚国内产业互联网巨头、智能科技领域的领军人物及政府相关领导,从智能创新、智慧商业等多角度探讨大湾区未来智能化建设及产业互联网发展空间。

以下是红杉中国合伙人、原阿里巴巴副总裁车品觉发表题为“数据驱动智能变革”的演讲实录。

车品觉.png红杉中国合伙人、原阿里巴巴副总裁车品觉

大家看一下我们在2018年领域中看到过的Gartner所讲的大数据的趋势,从2018到2019年有几个方向的趋势在里面,其中不止是我们汽车未来变成自主化的汽车,我们发现身边的很多生意也会变成自主化的。

因为有大数据的支持,会让基础化的设备变得更多,以及有正常的分析,我们以前的分析往往很多的时候,是基于我们已经有的数据来做分析,但是现在你发现进入很多智能城市建设的时候,你会发现当你要知道你今天所做的东西到底对不对的时候,很难用以往的数据来做分析的,你必须要用一种仿真的数据,假设如果在东莞,你把几个酒店从一个区域移到另外区域,人流、物流等等会怎么样。

我们用大数据的能力帮我们开始进行开发,开发的过程中我们把AI的能力放在里面。以往在阿里的时候,AI往往是在生产系统里面,搞了很多智能的东西放在里面,结果你旁边在生产这个东西,包括开发新功能。但在互联网领域,往往不太用AI的东西在里面,你会发现好像还可以一样,以便在说我们AI做了很多的东西。

尽管在科技的世界,其实了解东西的区别还是蛮大的。

我们现在边缘计算已经touch到AI、VR,好像刚才冯总所讲的,我们今天所讲的space已经不一样了,不像以前是物理的space,所以我们如果感觉空间有变化了,所产生出来的数据实际也不一样了,当你是用VR的时候,其实你前面看的东西并不是现场有这么多人,戴VR眼镜之后看到的其实是一个海洋。

当然所影响出的行为也是很不一样的,因为我看的是海洋,我不是看的是会场里的各位。

所以边缘计算跟整个AR、VR以及到我们刚才所讲的整个的智能空间,会建立更大量的数据,而这种数据往往可以是无中生有的,像以往我们看的数据都是我们真实行为所产生的,但是未来会发现有些数据并不是我们真实的行为,而且你也可以说,什么是真实?我戴着VR眼镜玩游戏的时候,那个行为是不是真实行为,区块链跟整个的智能空间又是不是真实。

比较刚才的2018年和2019年,Gartner里面对十大趋势的一个最不一样的东西可能就是最近更加引发关注的数据的隐私保护。

我们不断有数据的泄露,这让我们行业的人对数据的使用,比过去谨慎了非常多。有可能说我们对数据的看法,跟几年前的看法很不一样,几年前我们觉得什么都可以用的,今年来讲的话很多人在使用数据的时候,说“等等,你的数据从哪来的?千万不要给我黑数据,做出来东西之后害了我”。

所以对数据本身能不能用科技来解决,是未来非常重要的赛道。从宏观投资来讲,特别是今天讲的粤港澳大湾区里的人流、物流等等背后都是信息流,在流通粤港澳中间里面有三个不同的法律体系,在这个空间里会影响。香港的数据要到广东的话,其实也会受当地的法规所影响,你可以想像三个地方对法律数据的传输,再加上隐私数据的话,实际上是一个非常好的固化数据安全,通过计算大家就知道了。

如果我们今天说云有多厉害,但是对于我们做计算数据的来讲还是觉得挺慢的,有很多的场景我们都没有办法突破,也是有很多的计算能力,所以从计算能力我们也可以说,今天我们存储能力也不是真的很好,虽然我们存储已经很便宜了,但是今天的存储方法和我们今天整个需要还是有距离的,起码我们今天发现,有很多的这个图的计算,以及对数据的存储方法还是有很多的空间。

包括我们今天的大数据,只读不写了,写进去的能力,还是很弱的,所以你发现刚才我讲的安全,特别对安全这块,它是未来一块很重要的东西,也是我们物联网、大数据跟AI里面最关键的一块,没有了这块,其实你将来想发展很多的东西,上面的时候,你都会发现,上面的东西有很多是不是这么容易你就可以去使用。当中我们就知道了,非常多年等待很久的一个其中一个功能我们是叫同态加密,在加密数字底下,我依然可以使用这个数据,来作为分析,等于说用比较朴素的话就是数据能用不能看,这样的情况下,隐私就可以保护。

所以数据的安全合规的功能跟技术也是我们非常希望未来可以支持更大面积的AI,以及大数据的使用,刚才王博士说了,AI的能力无外乎就是这几个,变化还是蛮大的,我们是可以看到不仅仅是刷脸,也能看到它的这个表情,你以为这个是不能再产生新的创新吗?我就看到有公司用这种方式来做面试,使用这个技术大概能知道这个人说的话是真话还是假话,当然用上这样的技术的公司,是用来面试一些销售,不是那么高级的职位。

现在在美国发现比如说一条街拍一张照,以往来讲你是知道他穿的衣服是怎么样,但是今天有人有能力可以把它描述的很清楚,这个东西对零售业的发展很重要。

在这有一个争议,广告是AI产生出来的,所以你在搜索AI生产出来的广告,未来会发现越来越多,AI生产的广告根据场景会变化,以及有人就说这种内容的未来,很难知道这个内容的可行性是怎么样,包括四个奥巴马在这你也不知道哪个是真的,你也不知道有没有说过话,这里面可以看到AI产生的口型自动的改变在同一个场景里面,所以你看到我现在在台上讲的话,有可能会把别人讲的东西放在我的嘴里讲出来,结果你不知道我当天有没有讲这句话,所以内容的真实,未来也很难分别。

安全是一个关键词。我们讲安全不是家里面人家会盗用你东西的安全,也不是隐私安全这么简单了,是真真假假,这里面到底能知道的多少有真的,你看到新闻朋友发给你的,你看到这个新闻,可能觉得这个新闻是真的,但是无法判断是真是假的,那么AI是一个单独的技术,既不是我们说现在弱AI到常AI。

大致上来说弱AI到常AI的时代,分别最大的有可能就是它会变得更通用,当聊天时你问机器人附近有没有茶餐厅,然后列出好几个列表来,但是你要说找一个不平凡的茶餐厅,什么叫不平凡的茶餐厅,什么叫经典的茶餐厅,这个东西对人类并没有什么难度,但是对机器来讲是有难度。

我们在阿里用AI代替客服,这个客服根本不知道新的产品和功能是怎么样的,怎么问他都没有办法回答你,刚出来的新产品,按照A怎么样,B怎么样,怎么都学会读这个菜单,如果自动学会读到菜单的话,这个机器人是没有用的,只能闲聊几句话。

大数据是一种能力,可以按照算法支持很多的东西,但是有人说它就是云计算,我今天想给大家说,有一点大家想谈到的协议怎么来的,是数据,在当中如何流通和加工,这个地方往往是我们今天我想给大家说,你要关注,数据的流通、数据怎么来的、数据为什么稳定、包括数据的隐私有没有解决。

其实今天整个AI领域的开发,不一样的东西跟以前,就是数据本来就等同于代码,在AI的年代,再以往来讲我们发展这个东西的时候。但是今天有一个问题,微软跟谷歌制造出更多的工具出来,我们未来户更简单,我们在国内做AI开发的时候,这个事情并没有那么简单。

人工智能里面一点实践是非常重要的,如果做开发的时候,要分享是第二条。在一个可行的产品里面,我们AI的精度能到达85%、95%的时候我们一定要问一下,但是如果它的容错能力在边缘的其他不准确的5%、15%的风险是有多少,我们发现人脸识别开始的时候,我们准确率两三年前只有百分之六十几开始的。

到今天其实我们人脸识别的能力,已经超过了95%,98也有了,你会发现海关很多地方都已经自动的使用,包括在座有些人的公司,员工上班都是刷脸的,一刷到我的时候,这不是我公司的员工,所以人脸识别已经发展到了这样的地步。

但是如果它不准确会怎么样,让无缘无故进到这个公司随便会拿到我们很多的东西,所以容错能力在AI来讲是非常重要的,要注意这个事情,其他的东西我就不一一来讲这是非常明确的,当这个东西变成产品化的时候,就有用户体验的问题,就是有容错的问题,很多AI的智能需要数据来优化的,得到数据的路径也非常的清楚。

这里说一个题外话,当我们一旦把整个产品关联起来的时候,我们就一定要知道有一天当这个数据没有的时候会怎么样,因为你跟数据是强关联的,强关联的产品数据再不全,我们今天导航,这些导航从香港早上,如果数据没有了,就变成这个没法用,所以我们要注意,到底有没有数据的路径,以前来讲做很多的产品来讲,是不拿钱的,但是今天当我们讲的是,技术未来没有一件产品是信息产品或者不是数据产品,对于数据的获取以及稳定性也变成一个非常关键的点。

但是当我们讲很多机器学习的好坏,是我们要求它优化什么东西,所以你发现当我们做很多AI与大数据项目的时候,第一条问的问题是老板如果你觉得当我们做的好的时候,什么叫做得好,因为如果我不知道这个事情要优化的是什么,我没有办法有目的帮我去做到这个结果,用营销作为一个例子的话,我们优化营销的目的,是为了增长,为不仅仅只是为了效率。

我们一天天的效率很好,不代表我们营销就做的很好,因为我们有没有真正的识别获取精确的客户,以及我们有没有良好的客户关系,种种的关系都会影响到整个优化,也许这个老板给我说我想AI帮我把生意做得更好,这个不是优化的东西来,把商业做得更好,更多的是我想便宜一点获取更多的客户,那我就问他什么是更好的客户。

所以你会发现只要前面定义好的时候,这些学习就很容易得到它的效果。

大部分的公司在数据化里面都会经历,我现在所讲的1到8这样几个进程,当中你会发现第一点你要注意的在整个公司里面,今天做很多决策的时候,是否知道哪些决策是可以用数据分析的能力来把它加强的,另外知道了,这个有没有建立资源帮你把决策做得更好,一般来讲大部分的公司在这个阶段的时候,我们知道怎么做BI了。

但是这样的话,其实还没有到第四个步骤,当你有海量数据的时候,以往的BI或者以往公司所用的服务数据分析能力,在这个时候,到底有什么不一样,这是分水岭,当有master data到big data这个分析使用都有差异的,步骤5到6,一般是公司到一定体量的时候,就知道外部数据的影响到底有多大,到第7的时候,已经像谷歌、阿里巴巴、微软这样的,聪明的人不在你公司里,你如何让他们成为你一部分,也就是说很多的人帮助你公司解决问题,而不是公司内部的员工做这个。

所以刚才讲的第1点到第8点大部分的公司会有这样的竞争,但是我发现有一个我朋友从阿里出去做了滴滴,他们进去的时候往往一进到3,1和2不做,数据本身和划分有关系,大量的算法进来,数据科学家进来,他的目的就是要优化整个打车的这个软件,所以在那个时候他的决策已经在这个Application在里面,然后我在这里说,物联网公司往往是3、4然后到1、2然后再是5、6、7、8。知道问题其实已经是解决问题的一半,下一步已经开始说到底今天的数据是很集中的,还是很零散的,当你发现数据是很零散的时候,我们可能就到了最近很多人谈论的数据中台,大部分的情况是帮人解决数据都是多元异构,很多碎片化的数据,如何把它整合起来,可以让我更好的把数据使用,所以我今天最后想给大家说。

我们在DT整个技术进化里面找到几个特征,我们发现数据的迭代非常快,因为几个场景的需求只要改变,数据本身的迭代就很快,所以你不能假定今天的数据是稳定的,因为只要产品一变,整个数据不稳定,虽然数据不稳定,但是数据底层的这个相似性非常高,第三当我们懂得把数据和数据的技术沉淀起来会发现它的价值点非常高,这3点最近不管是政府还是很多的大企业,都在说他们要做数据中台的原因,因为如果数据的技术跟数据的积累,不在一个中台里面的话,其实它是没有办法做到刚才讲的长中台的概念。通过共创、复用、沉淀,促进效率、协同和创新,所以底下的几个字,就是总结了整个中台里面的理念重要性,我今天讲的就是这么多,谢谢大家!

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

亚虎娱乐中心-亚虎娱乐平台-亚虎娱乐游戏