×关闭背景

中移动苏州研发中心徐萌:中国移动“大云”助力企业成长

2015-08-26 15:27:18      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国移动苏州研发中心大数据项目总监徐萌做了题为“中国移动“大云”助力企业成长”的主题演讲。

【移动LABS82627日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国移动苏州研发中心大数据项目总监徐萌做了题为“中国移动“大云”助力企业成长”的主题演讲。

中国移动苏州研发中心大数据项目总监 徐萌

以下为演讲速记:

谢谢主持人,领导没有来,跟我们运营商换帅有关系,孙总委托我代表中国移动研发中心中国移动在大数据和云计算方面的思考和实践。

听了电信和联通专家讲了之后,我觉得确实跟秘书长讲的一样,三家运营商非常像,包括背景和拥有的资源,包括现在做的事情都非常一致。所以我刚才听完之后我稍微做了调整,中国移动可能主要聚焦在我们对大数据和云计算本身的技术发展趋势方面,对我们自己目前的实践跟前两家非常相似的地方我会快一点带过去,这样来让大家感觉有点新意。

大数据并不是一个偶然出现的现象,它从历史的小趋势逐步积累过来的,早期很早以前我们已经在做数据的分析和挖掘,但是随着数据源的增多,包括业务和用户的增多,数据才会逐渐变大。就是OD的现象。

2010年谷歌曾经说过在2010年两天的数据量可以赶超历史数据,所以说数据膨胀率非常高。因此出现了大数据这样一个形态,这是一个形态。随着就出现了必须技术跟德尚才能承载大数据,所以云计算是辅助大数据进一步的发展。有了云计算技术之后使软硬件分离,使计算机技术才能有大数据发展的载体。第二强调一下互联网,互联网就是数据、内容加上业务,有了互联网这样的状态,只有谁先与互联网融合才能发觉大数据的金矿,才能抢占先机。

下面看看这些步骤,两家运营商没有讲,有一点新意。我们认为电信运营商分了四个阶段,第一个阶段叫电信模式。也就是说传统的时候我们主要语音和短消息做人口红利,人越多价值越大。第二个阶段是流量红利,这个时候进入了平台模式了,可以看到在这个平台模式里主要是流量加上互联网的业务,所以它是流量×用户的模式在发展。现在到了标红的阶段了,红色的地方是云+大数据,是数据红利,数据红利就是通过数据产生和创造价值。在这种状态下包括智能的数据挖掘、分析和支撑和数据化的营销和服务,业界的运营商已经到这一步了。中国移动还是把自己放在第二阶段,就是流量红利。所以我们要努力做的是向第三步迈进。第四步是信息红利,绝大多数的先进的互联网公司都是第四阶段,我们相对来讲是比较落后。在第四阶段代码的平台化,包括家庭、企业、行业的O2O服务等等,实际已经站到信息的高度上,已经不在数据角度看问题了。其实这种情况下怎么看待怎么叫云+大数据?

所以我们就提了什么叫云计算大数据,大数据把数据存储和分析起来,能跑起来就是大数据了,那是粗放的状态,也不是一个经济的状态。云计算强调什么?云计算强调经济化,强调集约的精细化的要素。所以有了云计算使得大数据可以用集约式的平台的方式来运转,早期的不集约的大数据的形态转换到云计算大数据来。

我们认为主要解决四个问题:

第一个是统一化的数据管理,我把它放在一个资源池里,各种各样的数据,这些数据做源数据管理,从哪来到哪去,分享给谁用,怎么共享,它的权限是什么,这是数据管理解决的问题。

第二个是什么是云计算大数据?就是大数据要作为服务提供出去,包括SaasPass等等,是借用云计算来实现大数据的服务。

第三个是精细化的资源管理,云计算精细到CPU到核,到内存、存储量,它是集约型的,它的目标就是降低成本,提供更多应用和服务。大数据后续也会演变过来,它也会精细化运营,我会合理考虑如何资源调度,如何更多用户在这个平台实现它的服务等等。第三个是精细化资源管理。

第四是智能化。在多种的资源框架可以自动的适配,包括对上层接口支持,多媒体技术等于零一系列的智能化手段,使得大数据平台更好为大家服务。

前面讲的是大数据技术的发展趋势,它会随着云计算的技术让大数据体现出一个不一样的形态。

下面简单介绍一下苏州研发中心,我们是中国移动的一个一级子公司,是去年成立的,从早期的中国移动研究院,分裂出来了两部分,一部分是苏州研发中心,一部分是杭州研发中心。在苏州研发中心早期我们的大云为基础孵化出来的,这边可以看一下我们这三个单位的分工。中央院是中心,苏州和杭州研发中心实际上已经程度独立的子公司在独立运作和运营。苏州研发主要是大数据,杭研主要在人证和通信和互联网业务方面做一些聚焦。这是我们对苏州研发中心的一点介绍。

再看看大云,大云我们最早从研究院孵化出来,2007年我入职的时候,看着大云一步步起来。最早我们找一个很旧的机械堆起来,跑一下hadoop2009年年底我们建立了实验室,那时候还算是规模比较大的实验室。至今来讲我们大云版本的发布以及整个的进展的时间轴是这样的,到20145月份中国移动有一个很好的机会,通过公司化运营来孵化大云的产品。

下面讲讲我们有什么数据。我有不一样的视角,我们运营商修改三类数据:

第一类,运营数据。早期我们就有这些数据了,数据用来干吗?就是记帐、计费的,通话记录,都是给用户计费,最早的原始需求,有时候叫B类的数据。

第二类,网络数据,比如开继、关机,位置迁移,所有一系列在网络上核心网产生或者无线网产生的核心数据,这些数据早期最早用来看看哪信号不好,是不是基站方向或者建设有什么问题,现在随着互联网的发展DPI数据被挖掘了,记录了所有用户上网的信息。

第三类,内容数据。中国移动也有自己的互联网的公司和业务,比如我们成立的密布(音)收购了九大基地,里面有动漫、音乐基地等等,这是内容数据在里面。所以移动网内部数据包括这几块。再看外部数据,外部数据就是公共的。

比如互联网数据,还有车联网的数据等等,这是外部数据。怎么内外部数据整合?现在是三种方式:

一种方式是帮助客户建立行业大数据中心。

第二种方式通过合作方式提供融合大数据应用。

第三种方式就是提供大数据托管业务和在线大数据应用。

平台在我们这里可以把业务和系统和数据托管过来,现在是这三种方式在做,后面会说一下案例。

说了这么多,说你们怎么跑得怎么样?自己怎么用的?我来介绍一下,其实主要就是几个方面。

一个是提升客户体验,一个是精准营销,一个是网络优化,从上往下看,打开讲会很多,大概意思就是我们传统的是集中式架构及小机盘阵来做,随着云计算大数据发展之后用hadoop等一系列的技术替代它,我们没有完全替代,我们采用的是混搭架构,可以减少盘阵小型的压力,使得它承载更多业务,IT系统优化这一块最成熟,我们30个省都上了。上的是网络优化,比如针对大数据的一些算法来判断哪个掉化率最高的地方,它的告警产生在哪等等一系列的应用。营销和前两家差不多,我们通过数据分析做个性化的推荐,客户挽留等一些活动,这是内部应用。

对外电信大数据中心的解决方案,我们好多省里,我们自己内部客户好多省里是四五系统四五个池子,每个池子里一个hadoop,跑一些业务,后续我们会考虑云计算,打成池子,上层对各种应用提供运营的能力。

外部一个是金融行业,我们基本是一个专有云,我们机房单独做了一款金融相关的专有云,它的计算需求比较小,它的计算资源也在我们的公有云里,所以在苏州银行做了一套解决方案,现在也在我们的机房里面。刚才我提到中间部分是结合部分,我们针对它的数据帮他做一些征信领域方面的信息处理和挖掘。

在工业大数据,是挖掘机哪家强,非常类似。有很多的工业园产生很多数据,现在他们还处于传统的原始积累的状态,没有考虑数据怎么用起来,这一块三一重工有很多挖掘机,然后会采集各种各样的挖掘机的数据,数据采集过来可以帮他分析哪些设备的利用率,再就是哪些设备可能会有故障或者预警等等。再有不同的操作员每一个动作是不是违规都要进行分析,这是工业和大数据结合做的一个案例。

再看看服装时尚里,大家天天用淘宝,大家买什么东西,大家喜欢什么衣服,这是时尚领域在做的。我们在常熟塔塔跟我们合作,通过分析数据帮助给出这样的服装企业今年流行什么颜色,今年大家喜欢什么款式,什么衣服大家最喜欢,基本上是服装时尚来做的,里面有很多的算法和挖掘算法。

最后一个就是大数据的解决方案,刚才提到医疗数据,医疗数据目前一直在提,但是做起来非常难,我们也遇到一个很大的困难,就是操作方面非常困难。首先各个医院的数据标准不统一,第二怎么把医院的数据采集上来归统到一个平台上去,这个东西技术并不难,只是如何在组织、标准、管理化方面协调医疗的整个的生态环境,使得它可以把整个数据共享到一个这样的平台上来,共享有什么好处呢?显而易见,比如可以做全国范围或者世界范围的病例的分享,做数据分析的挖掘等等,不局限于某一个医院了,这是大数据中心医疗方面的介绍。

最后是一个公众帐号,是苏小研,就是我们苏州研发中心的公共帐号,大家有兴趣可以拍下来,扫一扫。我的演讲就到这里,谢谢大家。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

李永国2015-08-26 15:40

先顶再看,优良习惯

如果云知道2015-08-26 15:37

希望移动LABS改版后能继续保持内容质量

郝柯臣2015-08-26 15:35

这个文章很有意思,赞!