×关闭背景

中国联通孙泳:中国联通沃云助力“互联网+”云生态

2015-08-26 15:15:24      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国联通云数据有限公司孙泳做了题为“中国联通沃云助力“互联网+”云生态”的主题演讲。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国联通云数据有限公司孙泳做了题为“中国联通沃云助力“互联网+”云生态”的主题演讲。

中国联通云数据有限公司 孙泳

以下为演讲速记:

先说一下抱歉,李副总经理临时在集团那边有一个重要的会,没有时间来参加这个会议。我代表联通云数据公司对整个的大会做一个就大数据趋势和联通实践方面做一些分享。

我们知道在大数据这个领域,其实运营商是最不缺数据的,我们实际上有非常多的数据,在这个图里我们可以看到用户实际用得着或者看得见的,比如客户的信息和业务规则、帐单等等。这些都是我们能够看得到的,实际上是整个运营商里数据很少的一部分,是冰山一角。下面我们看到我们在帐单和日至方面我们打造了1TB的程度,在上网的行为和信息上,还有移动社交的网络,移动支付方面我们也有非常大量的T级的数据。在底层我们有很多的业务,比如说我们现在的物联网发展非常广泛,很多的用户都借助于联通的3、4G网络和宽带网络构建起基于互联网的应用,在应用里面我们有很多性别的数据、空间的数据和地理信息的数据,可以达到ZB级。所以我们可以看到我们的数据量是很大的,而且类型非常多。数据结构上我们可以看到在整个的特征上面也是非常复杂的,像我们日常看到的客户的一些信息,业务规则、详单等等,这些可以看成结构化的数据,基本都是结构化数据很好来管理的。再往下比如有些日志慢慢从结构化到半结构化的数据。在网络上面内容的信息上面,还有地理信息和物联网等等领域,我们看到更多的是半结构化和非结构化的数据。所以我们看到整个运营商在大数据领域我们有数据想很大的优势,我们有数据类型多的优势,我们可以看到数据的类型也非常复杂。

在整个的大数据里面,我们联通作为通信运营商,现在看来在传统领域管理方面要做更精细化的管理。比如在营销支持,网络运营,我们的决策的支持和风险管理,以及产品运营方面都是需要对我们的管理和基础的要求上面做很多精细化的方面。这些方面都是有赖于数据支持的,但其实说实话在国内的运营商,在数据方面其实还是有一些不足的,比如在数据的标识、属性上面,在部分数据上是有缺失的。在多个数据当中我们存在的重复的采集和存储,在整个的内部的IT系统方面我们有很多的垃圾系统,这些数据之间有的时候在关联性上和数据共享性上做得还不太够。也就是说体现出来散的一个特点。

还有我们虽然有很多数据,但是这些数据在面向我们内部和外部客户去提供这种数据的服务的时候,我们的时效性还不是那么高,同时我们很多的数据的使用上还存在使用起来不是很方便等烦琐的程度,而且是个别的数据,存在有的数据的不完整,质量比较差等等。所以我们看到这些数据存在的问题将会导致我们比如对自身状况可能摸得不出特别透,对经营环境看得不是特别清楚,对市场有些先机我们抓不住,对未来的竞争我们在与互联网的竞争上面有很大的劣势。所以我们在整个大数据这一块我们还是希望能够解决这些我们企业内部的数据存在的种种问题,之后能够把这些数据形成价值,对我们的内部的一些管理和外部的客户都带来很好的一些价值。

我们看到在整个运营商的数据上有以下几个特点:

第一,用户量大。宽带用户和手机用户目前在中国基本上能够达到每个家庭都有宽带接入,每个人都有一部甚至两部以上的手机。这些人基本上每天都要使用电话或者通讯,或者说做跟朋友之间微信的流量的沟通。这种我们看到每天我们所有的用户,几亿用户都会产生大量数据,所以我们能看到这些数据背后的用户量是非常大的。

而且在时效性上我们可以做到跟移动网络相结合之后,我们使得这些数据的产生是毫秒为单位,比如从一个扇区转到另外一个扇曲,一个地方转到另外一个地方之间的切换都是很快的。而且这些数据里我们看到有很多的关联性,比如他在一个什么地方,他使用什么样的网络接入,获取什么样的信息,这些实际上都是有比较强的关联性的。通过这些关联性的分析我们也容易对数据提取出一些有价值的东西。

第三个就是可靠性高,我们国家在实名制问题上已经采取了越来越严格的检验和控制的手段。所以我们每一个移动电话都能够准确看到用自己的身份证号登记的,所以这些带来的期待和风险还是很小的,所以我们可以看到这些数据的真实有效性比较弱,所以在电信领域我们的数据的量和质上,其实这些数据都有比较强的可靠性、关联性和时效性的,因为数据量庞大,我们处理能力是低的,所以在电信领域我们现有的数据实际具有非常巨大的挖掘的潜力,并且基于这些数据,因为它的时效性比较高,所以我们对数据进行处理的要求也会更高一些。我们看到这些数据实际上我们的数据类型、数据量和数据处理需求和处理价值方面都是很明显的,我们看到在我们不同的系统我们有内部的LLS等系统,我们的基础的网络,比如语音网、传输网,还有互联网上承载的网站,还有社交的媒体和电商,在外部的伙伴上讲,我们在这些领域都是在不断产生数据和不断向他们提供服务。这么多领域数据的类型也是多种多样的,传统领域可以是结构化的数据,可以是内部的管理数据,通信网络里别的数据多一些我们的互联网里一些静态的网页,还有数据交换。这些领域涵盖了方方面面,而且这些数据的类型多种多样,比如有文档、视频、日志和搜索等等,所以我们看到这些数据都有非常好的使用的价值。所以我们看到结构化、非结构化的海量数据能够在大数据领域体现得非常明显。那么要处理这些数据,把这些数据用好带来的技术挑战也是很大的。

现在我们的数据的存储情况可以看一下这个表,比如在交互数据我们有我们的业务规则、用户信息,这个主要是客户的信息还有帐号信息,这些就是结构化的信息多一些。目前在我们的各种各样的数据库里锁着,而且底层比如高端的存储。其他的领域比如基于其他的分析型的,我们可能采用一些其他的平台做存储。我们还有一些归档的数据,所以看到在整个的数据存储上面,存储的介质是多种多样的,存储形式也是多种多样的,在整个的处理上面对每种不同的介质和数据类型我们都要有相对应的处理手段,而且他们的数据量大以后,带来的传统架构不能满足他们的要求,也需要我们采用大数据很多技术来去处理这些数据。

在整个大数据应用上面我们看到,我们认为在整个的这些数据能够在我们的企业管理,在我们的业务的开发,我们数据的运营,在网络的优化,在客户的服务和市场扩展方面其实都有很多应用的方面。

在我们联通内部我们可以用刚才提到的大数据对于我们联通内部的运营,对电信运营商的运营来产生很好的促进作用。那么能提供的价值也是多个层面的,比如说这些数据在最下面,比如说销售、客服以及一线人员,它是直接面向客户的,碰到的是客户资源层的数据多一些,我们通过跨行业的数据的关联,不同应用系统之间的数据关联等等,能够给一线人员提供一些关于客户以及他需要的产品和比较好的营销手段的一个决策的支持。在这方面是可以给具体的一线人员提供好的支持。

在整个我们各个业务层和管理方面,我们可以看到比如在网络资源上面,我们利用大数据分析我们可以做一些网络优化的工作。在面向合作伙伴,比如SP、CP等供应商方面,我们通过大数据分析可以更好管理合作伙伴,可以向合作伙伴提供更好数据服务。在整个更高的层面可能就是整个公司或者集团管理层面,我们通过这些大数据的分析,能够改变我们传统的精分的系统和精分的数据,能够通过一些数据挖掘,一些人工智能的东西做一些更好的用户行为的判断(全城)和新型的分析,可以向企业的管理层提供更好的管理思路或者市场思路。所以我们在内部使用这些数据进行产生价值的时候我们的目标是提高我们客户的满意度,增加运营商的收入和利润。在这方面其实这些数据都是具备这么好的价值。

同时我们这些数据通过合理的编排,合理的分析、统计。然后把这些接口开放给我们的合作伙伴,或者我们自己的一些应有的系统。结合之后我们可以在多个应用场景里发挥我们的数据价值,比如刚才说的精准营销方面,比如说我们为了改变传统的方式,比如以前的命中率比较低,给客户推送的东西跟他一点关系都没有,他就认为是骚扰,就有骚扰投诉。而且在不是很精准的情况下往往要花费大量的信息,这样营销成本也比较高。通过大数据的处理我们对用户的比如说一些互联网行为,一些通信的行为去做一些分析和关联,而且能够标识出用户的兴趣的类别,兴趣爱好在什么方面,燃烧做智能匹配。比如通过短消息或者邮件做一些比较精准的推送,这样的话能够实现一个更加精准的营销。在实时的业务处理方面,比如说在高铁或者坐飞机的时候,他可能从一个地方转移到另外一个地方,他在开机的时候可以做信令的捕获,根据他所在的位置和这个用户原来的行为习惯我们可以给他推荐一些比如说本地的营销的信息的对接。还有比如说在人流的监控上,尤其是在像国庆阅兵这种大型的场合下,还有大型的活动以及商业门店的促销。我们可以通过我们的小区的信令的捕获去预算这个基站里面人流的情况。并且对于这些人流我们可以做出一些值的分析之后,我们可以预算出来这些人有哪些是活动,或者哪些场合有价值,这样的客户我们可以推送,或者给相关的管理或者商家做一些有针对性的报告。他们根据这些报告,比如根据人流的管理还有客户群的流量做一个更好的调整。在注册卡识别上也可以根据不同的用户的信令分析来捕捉他的活动轨迹,同时给他做一些更好的数据服务。

整个我们联通在大数据领域我们正在构建的是服务于各个行业的生态圈的大数据的合作的服务产品的平台。我们这个平台顶层一定是保证安全的数据信息,比如这些信息是统一管控的,而且可审计,可回溯的,合法合规的数据。然后基于这个平台做一些一致性的产品开发和什么提升,去做生产效率提升。而且我们也灌注了一些安全性的提升,比如我们的数据、安全、产品、模型都有多个层次,通过这个平台我们向各个行业,比如向互联网行业还有媒体、零售、政府、电商、金融、交通等等其提供多个产业的数据的生产系统,能够让他们利用我们的产品实现对自己的产品和业务都有很大的价值提升的这样的服务。

那么我们这个平在最底层肯定是基于我们现有的数据,我们首先对这些现有数据进行脱西和脱敏,我们的信息有很多是敏感性信息,比如用户的位置、手机号、姓名等等,做大数据分析的时候其实这些是不必要的,而且也牵涉到用户的一些隐私。所以我们会做脱敏的处理。同时我们在业务系统里我们还要做一些数据的清洗,比附对格式的统一,形成多个脱敏的数据库,比如我们有位置信息的、内容行为信息的等不同的数据库。然后我们通过对这些数据库的数据做一些不同的算法,比如欧征信的算法,有合作伙伴的产品的算法,都是我们的分析计算能力,把它部署在我们的系统平台里面,对我们的脱敏过的数据做了分析之后我们能够形成一个可以给外部用户和合作伙伴提供真正价值的数据。这些数据我们可以基于这种引擎来去做大数据的处理,对于服务的形成也可以是多种多样的,比如面向我们的合作伙伴和运营商内部管理人员,直接就想他们提供产品界面或者门户让他们实时使用这些信息。还有一个合作伙伴他本身有自己的一些优化和算法和自己业务的处理系统,这时候可以通过数据开放网管来借用接口,然后看到出来的各种价值数据。

整个在管理上面我们肯定是基于安全领域的,我们也采取了很多措施。比如我们有密钥的管理,前置接口服务器,我们也做隔离。形成数据开放和服务平台。

在产品规划上我们还是希望能够定义出来几类根据服务的商业模式来提出几个有市场潜力的数据的产品。比如我们在标准化的数据服务的产品上,我们可以现有很多的数据标准化,形成标准产品,供内部系统和合作伙伴去使用。这些数据我们可以面向公众、企业提供能开发的仅需要配置就可以开通的产品。有点像计算里的Saas或Paas服务。面对大客户我们也提供定制化的数据产品,比如根据业务上的业务需求进行数据分析和挖掘,根据现有的接走做一些开发。而且基于数据市场进行数据交换和变现,可以挖掘数据的价值,从外部数据和我们的数据做一个整合,提升数据的重量,这个都是产品化的规划。

在产品上精准营销用在哪些方面?比如基于移动用户我们可以根据他的使用习惯和上网行为分析,我们可以做出个性化的营销方案,对这些用户我们去做主动的合作。比如这是一个热门游戏的光,我们做了一个彩信的群发,群发前后最终用户点击率和当天的回复率都有成倍的提升。所以在这些领域是比较好实现的方面。

那么在数据开放领域我们可以看到一个比较有价值的,或者比较容易实现的,就是在外省的选择下,比如沃尔马、物美等卖场,卖场肯定有很多原则,其中便利性、周围人流啊,人流里是家庭主妇还是中高收入等等,对不同的区域和人流有自己的选址的方法和规则。我们就可以利用我们的移动互信的信令方面的数据统计出来,在一个领域里24小时的人流的曲线,选定人流偏好的分布,而且不同区域的人群我们可以做一个对比,然后可以做成一个数据开放的产品,能够让这些卖厂通过我们的系统把他的定义和筛选归得输进去以后,它能够自动选址,可以在整个一定区域里选择可选区域,用人工分点的采集方式,这个费用比较高,而且周期也相对比较长,这是可以把数据开放给相关企业,给他们提供一些接口,并且提供一些规则定义。这些都是我们在定制化数据服务方面做的产品的规划。

而且在整个数据运营方面,数据可以开发用户兴趣标签的产品,比如用户在哪些方面对什么区域有兴趣,这时候我们可以做精准的营销和广告。地理等可以做开店选址,以及户外效率的数据服务,可以广告主和业主提供更好的服务。比如在用户产品上我们一对一个区域做一些分析之后可以给他一些建议,提升建议的以及。而且还有一些我们现在运营的管理的体系,这些我们最终是致力于建设一个开放供赢的产业的生态圈。

网络方面我们有覆盖全国不同区域的大的数据运营中心,可以接入网络质量好的数据中心和网络,最大限度降低抖动,提高用户体验。我们的云数据中心是构建12大的基地,哈尔滨、廊坊、呼和浩特和郑州、西安,在南方有浙江德兴和无锡,南方有东莞、香港、重庆和惠安,基于大数据可以提供很好的平台,尽可能满足大数据的分析和手段。这些数据,12个我们已经交付了4个,廊坊、呼和浩特、郑州和西安,其他的数据中心我们明年会陆续投产。

整个共有云的平台,我们是有我们电筒的沃云自由知识产权的平台,这个自由知识产权平台我们使用的是(英文)架构,通过SDN手段实现弹性的调研,而且可以快速部署,节省我们的成本。同时基于我们的资源层和平台层,再加上能力开发层,我们希望向用户提供各种各样的应用,比如企业应用,互联网服务,内容服务等等领域,我们都希望推进大数据应用的整合,并且利用这个平台我们已经为电信的电子商务平台做服务了,联通的沃支付等,线上平台也逐渐在使用我们的大数据服务平台来提供服务。

最终我们希望能够通过我们灵活的合作模式和到位的专业支撑和多样化的手段来去整合上下游的企业,实现我们全产业链的协同和创新的发展,谢谢大家。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

周杨2015-08-26 15:21

这样的文章应该多转发。。。