×关闭背景

阿里数据经济研究中心潘永花:从大数据看互联网+未来

2015-08-27 14:45:55      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。阿里数据经济研究中心秘书长潘永花做了题为“从大数据看互联网+未来”的主题演讲。

【移动LABS82627日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。阿里数据经济研究中心秘书长潘永花做了题为“从大数据看互联网+未来”的主题演讲。

阿里数据经济研究中心秘书长 潘永花

以下为演讲速记:

大家下午好!非常感谢刚才刘总的介绍。阿里数据经济研究中心是隶属阿里研究院下面,是在今年6月份刚刚成立的,聚焦在数据产业和数据经济领域的一个研究中心。我非常荣幸今天能有机会和大家分享一下,从阿里巴巴、阿里研究院怎么来看大数据,怎么来看大数据和“互联网+”的关系,阿里巴巴自己又做了哪些典型的大数据应用。

一、先和大家分享一下从阿里巴巴角度怎么理解“互联网+”与大数据的关系。

提到这个互联网,在21年前,1994年时候有一条64K国际专线开始联通国际互联网,这应该算是我们中国连接互联网的起点。时至今日,右边数据是用的最新的CNNIC数据,今年网民数达到6.68亿,手机网民数5.94亿,出口宽带数是4718Gbps,和21年前不可同日而语了,这也说明了互联网发展速度有多么快。

21年后和阿里巴巴业务密切相关的是零售,像我们的网络零售额在2014年其实已经达到27898亿元,涉及零总额占比超过10%,标志互联网对零售的影响已经开始在我国经济尤其像在零售业,开始占据了一个非常重要的位置,也预示网络零售代表某种未来。

我可以简单和大家说一下从网络零售角度中国和美国有什么样的差异,在美国的话其实网络零售充其量只是它零售的补充,但是在中国网络零售越来越成为主流,这是中美的差异。我们网络零售交易额预计2016年可以超过沃尔玛全球交易额。

从我们研究院的角度来看中国电子商务,就是也网络零售为代表的B2BB2C整个市场的发展,到2020年时候我们预计电子商务交易额包括B2BB2C能够达到43.8万亿元,这个规模是非常值得瞩目的。

就像刚才提到的,其实是我们现在随着互联网的发展,移动互联网的占比在变得越来越高,在20146月份当时CNNIC数据是非常有标志性的一个数据,那个数据已经显示了手机上网的人数开始超越了PC上网的人数。这个从我们的发展也能看出来,在今年一季度财报时候我们移动端成交占比就已经突破了50%,这也就是标志着我们PC互联网已经到了移动互联网的时代,这是一个非常明显的趋势。

从我们对ITDT的理解来说,因为DT实际上是我们整个集团的战略,我们也认为IT时代代表着过去,DT时代代表着未来,DT指的是数据技术,就是今天以大数据为核心的技术。

从克强总理3月份在政府工作报告时提到“互联网+”这个概念,就立马非常的火热,他在其中也很明确提到了“互联网+”的核心,就是如何利用大数据的技术来实现“互联网+”。其中包括比如提到了移动互联网、云计算还有物联网,它们终归是要实现大数据的积淀,基于大数据来实现“互联网+”是一个最主要的目标。

我们任务其实“互联网+”的新基础设施有一个观念,就是云、网、端,这个其实也是在“互联网+”时代和过去的传统的工业经济时代最大的差异。从端的角度来说,除了智能终端,还有越来越多的APP,从网的角度来看,除了互联网,还有目前越来越火热的物联网,云和大数据是整体的核心,基于云、网、端基础之上才会有互联网+物流、互联网+零售、互联网+金融、互联网+各种行业的化学反应,“互联网+政府”会对整体“互联网+”产业起到整理和指导作用。

在“互联网+”的过程中产生了一个个奇迹,不管是像淘宝网,包括京东等等,新的行业奇迹总结起来其实都是数据驱动的,所以数据在整个“互联网+”过程中起到非常核心的作用。

我们看这个大数据的发展,其实也是伴随着计算能力的发展在发生着变化,而其实整个这个变化过程也使得我们人类社会逐渐走向越来越智能化的一个信息社会。其实从农业社会到工业社会变迁的过程,然后到互联网的发现,再到人类基因的排序,就有新的技术的周期在变得越来越短。在45年时就有一个预计,是整个计算机能力、智慧能够超越人类智慧的总额,那时候也是驱动信息智能的信息社会的到来。

刚才我也提到了,我们是认为过去的时代相当于IT时代,未来会走向DT时代,IT时代和DT时代有什么差异?IT时代的发展,从大型机到PC互联网时代,它是伴随着数据的变化,数据从最早的集中主机终端这样一个模式,然后到PC时代,每个PC端会有数据一定的分散,然后再到互联网时代,有部分的流动起来。我们认为在前面的IT时代有点类似于第一次工业革命,IT所起到的作用还是为企业或用户本身业务流程服务的,或者为我们生产效率服务的,整个改变比如说是自动化的流程代替了手工的流程,然后整个业务流程利用IT技术获得了提升,到了DT时代,云计算成为一个像电一样的公共基础设施,这也使得数据能够开放、能够流动起来,也就能够成为激发新的生产力的基因。

而且我们从DTIT的对比来看,IT更重要的是为我们自己服务,但像DT可能是以分享、以开放为理念的,更多其实是要想到为别人去服务。而且在IT这个时代,大部分企业级的用户大家都有感触,我们可能要自己去购买大量IT的设备、硬件、软件和服务,而在这一块其实是大企业往往可能是比较有这样的权力去享受这些IT的基础。到了DT时代,其实我们是认为小企业、小微企业会成为DT时代核心的生产力。

从数据的角度来说,在传统的IT时代大家更多的是结构化数据,传统的结构化数据库会成为核心技术。对于企业来说,它整个业务流程相对来说也是比较结构化的,它的组织架构也是很层级化的一个组织。到了现在DT时代,我们看到大家所面临的数据不仅仅是结构化的数据,非结构化数据越来越多,这时候可能就出现了像Hadoop等各种各样新的数据管理技术就出来了。同时,我们可以看到其实业务流程也不再像以往是非常垂直的结构化的业务流程,反倒是以消费者为核心的、动态的、能够随着企业业务随时变化的流程会成为未来的趋势。从组织架构角度来说,小微企业成为了整个社会或整个DT时代创新的核心之后,甚至包括个人的创客,使得大规模的协同分工这样一个组织架构反倒有更高的生产力,也就成为了DT时代的一个特征。

从数据本身属性的变化来说,从阿里本身走过的过程是这样,业务数据化在传统的IT时代数据主要是以交易类数据为主,很多数据是产生的附加物,我们主要用的数据是以查询、以报表这些简单的应用为核心。到了DT时代,其实数据成了很多新兴业务的驱动力,也就是说整个数据其实会成为你创新的核心,这也是一个ITDT的差异。

二、从产业角度来说数据是怎么推动变革的

这是从技术的储备,刚才我提到“互联网+”和大数据的关系,云、网、端这三块是驱动大数据的核心。云和网的发展就在于说随着像摩尔定律带来的计算成本下降,还有存储成本的下降、带宽成本的下降,以及伴随着实际是计算能力、存储能力和网络能力的提升。这就使得云计算成为了可能,云计算成为了可能也就使得数据的共享、开放和流动成为了可能,这是从技术的角度。

从端的角度来说,有大量互联网用户数的增加,然后智能手机的发展,以及像社交媒体的发展,还有互联网的发展,使得端带来了数据产生的源头。

从中国来看,目前中国的数据量它占比在2014年的时候大概13%左右,我们是预计在2020年这个数据量能够到18%,从2017年开始其实以中国为代表的这样的发展中国家的数据量占全球的比重就会超过发达国家。其实我们现在面临的问题,就是说我们现在已经是一个数据大国,那我们怎么能够成为数据强国,这个时候其实对技术和应用的需求就会越来越大。

这个是从Gartner角度,它有一个新兴的技术曲线,左边这个是2014年的,2014年的这个技术曲线可以看到大数据已经从炒作的高峰开始往下走,往下走就意味着它不是新兴的技术,已经进入5-10年的稳定发展期。但是到2015年时候,这是它新公布的新兴技术的发展曲线,其中已经没有了大数据技术,为什么没有了大数据技术?其实并不是说它消失了,而是说它变成更细分领域的技术。比如其中有提到像高级分析技术,像机器学习的技术,像城市数据分析的技术,就是它其实是更加细分了,也就是说它融入到了越来越多的一些领域之中。

从这个大数据所带来的社会经济价值的角度,也就是意味着我们未来大数据广义能带来的产业能有多大。这个我们当时看到了有一个2013年麦肯锡的报告,当时提到全球仅7个行业的开放数据就能带来超过3万亿美金的这样一个经济潜力。也正是因为有这么大的经济潜力,所以对于人才的需求也就出来了,在2015年全球对大数据相关工作职位光技术类就有440万,但它延伸出来的包括数据的采集、数据的加工,可能有很多非技术类的这样的职位,是技术类职位的3倍,这也是带来新的社会价值的表现。

从行业怎么来走向大数据,我们从阿里的角度来说是认为走了DT化的进程,目前来说中国的传统行业还是在传统的信息化的阶段,然后在线化其实有些充其量是作为展示的窗口,然后下一步其实就是云化,也就是说利用云计算这样的平台突破数据处理能力的界限,以及使得数据的共享成为可能,最后也就是实现DT化,这样一个进程我们认为分为四个阶段。

从不同行业来看,我们当时也做了个分析,总的来说,互联网和营销行业是走在最靠前的,对于我们互联网企业来说,目前我们数据化的能力,从业务数据化到数据业务化的过程之中也在逐渐把自己的一些经验、把自己一些技术的积累输出出去,比如像阿里巴巴通过我们的阿里云对外输出我们大数据的处理能力,像我们OTPS平台(音),像我们ADS平台(音)开始对外输出。第二块主要是像电信、金融和政府,这三个行业它的IT应用水平相对来说是比较高的,也就是说它们原有的数据积累相对来说是比较好,它们相对大数据的应用水平仅次于互联网和市场营销这一块。剩下的大部分其实还处在一个非常非常初级的阶段。

这是从产业的角度来和大家做一个分析。

三、和大家简单分享一下阿里巴巴自己的大数据之路

阿里巴巴的数据是怎么产生的呢?大家也知道,像我们最著名的是淘宝、天猫、聚划算,但是现在我们有很多平台,我们有B2B平台,有1688平台,有阿里巴巴,还有速卖通平台,同时还有生态系统中,比如像高德,像我们投资的新浪微博、优酷以及物流,基于我们这些生态系统的数据,都在通过我们这样的云平台实现一个比较好的整合。

这是我们自己内部数据化的一个过程,和传统企业没有什么差异的在于,互联网企业同样也经历了一个数据分散然后到集中,然后整体从公司层面数据资产的形成,然后再到我们现在进行云化,或者刚才提到的数据技术能力的输出,也在经历这样一个过程。我们最早从分散实现数据汇聚的过程中,也同样面临传统企业一样的挑战,就是说各个部门它们的数据其实都是有相应利益的关系,就是大家也都不太愿意说把数据进行集中或者共享,这种挑战我们也是遇到的,也是蛮大的一个挑战。同时还有关于数据安全的问题,还有数据资产管理的问题,这一块其实也都是一样面临这样的挑战,但是这个就需要集团有一个非常高层的领导要很重视这块,然后才能够推动整个集团的数据化的过程和发展。

现在从阿里巴巴大数据的角度来说,我们现在有越来越多的一些应用场景了,除了传统的零售,比如我们会为我们的客户或商家提供个性化服务之外,我们也在营销、交通、医疗、物流、政府等行业做一些探索。我在后面几页跟大家分享一下。

先说一下“双11”,6个小时数据处理量达到100PB,这个用传统的IOE技术可能确实比较难实现这样的目标,也就是说基于我们阿里巴巴自主研发的技术,才实现能够在6个小时内处理100PB的数据。同时每秒钟创造订单数达到8万笔,支付宝每秒钟成交数达到3.85万笔。我们当时每秒创造订单数在之前测试时都是超过10万笔的。这是典型的大并发量的交易类的大数据的应用场景,这也展示阿里巴巴数据技术方面的能力已经很强了,可以对外进行输出了。

第二个,讲一下大数据的营销,这是阿里巴巴推的一个DMP平台叫达摩盘,基于天猫和淘宝的数据加入一些外部数据,实现消费者和商家之间实时互动,然后使得商家能够获得从消费者开始进行查询到营销触达,以及到最后在实现营销效果的一个反馈,等等这样一个精准营销的闭环,在这一块其实也是一个大数据或者大数据分析的典型应用场景。因为从营销的角度来说,应该是目前来看比较成熟的基于大数据的一个应用场景,基本上都是围绕着消费者的画像提供更加精准的服务。

第二个例子我给大家讲一下,是我们的芝麻信用,我想问一下在座的同学们,有用过芝麻信用的举手,大概可能也就10%,说明我们的芝麻信用还是要加油,这也是我们今年支付保钱包推出的一个新的服务,是针对个人信用的评分体系,这个评分体系目前也主要基于我们自己内部的数据,包括电商交易数据以及蚂蚁金融服务的互联网金融的数据,但现在开始和一些合作伙伴合作。很有意思的针对大数据征信的应用场景,举个例子来说,我们芝麻信用的分是350-950分,如果你的信用分超过了700以上就可以直接用芝麻信用去申请新加坡的签证,超过750分就可以申请卢森堡的签证,这个就可以省去我们原来办去欧洲旅游签证还需要资产证明和户口本,这些东西都可以省去了,这是特别有意思的一个应用场景。还有,我们和高法已经进行了合作,帮助高法去做一些,相应的信用比较差的可以做一些法院传票的送达。包括像现在租车的服务,我们和神州租车等等有一些合作,也可以基于信用分免去押金的手续去进行租车。这个业务场景还是非常多的,也是非常典型的大数据应用的一个例子,这个是针对个人的。

还有一个应用场景也是我们蚂蚁金融服务那边针对小微企业的,我们叫阿里小贷,也许有人开淘宝店的话可能知道,这个阿里小贷是给一些缺少资金的商家提供相应的贷款的服务,我们坏帐率其实是远远低于传统银行的,我们大概坏帐率不到1%,但是传统银行针对中小企业的坏帐率有的高达百分之十几,这也是典型的大数据的应用场景。

最后一部分应用场景是我们的菜鸟物流,我们的菜鸟物流不太像京东他们自营的物流体系,同时其实是在招大量的快递人员。我们最主要的还是基于我们的技术平台,给商就和物流公司做一个相对来说从供需端的匹配,就是基于我们对商家销售数据的一些分析,然后再对接上物流公司快递数据的一些分析,基于这个给物流公司提供一个智能物流的解决方案。比如我右下角这个是很典型的一个小例子,利用了菜鸟物流的雷达预警方案,就是在去年“双11”时预测率达到90%,订单量是2.78亿,去年只用了10天就把“双11”的订单都发完了,但是在前年或者更早时候送达时间超过1个月,前年之前有的人“双12”还收不到“双11”的货,这是由于物流和商家供需信息不匹配造成的。这也是我们菜鸟物流数据平台提供的一个服务。

我们认为,人类正在从IT走向DT,只有让别人成功,你才会成功。谢谢大家!

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

爱笑的眼睛2015-08-27 14:52

关注他们已经很久了