×关闭背景

中国银联徐燕军:中国银联大数据探索与实践

2015-08-31 10:24:09      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国银联电子支付研究院院长徐燕军做了题为“中国银联大数据探索与实践”的主题演讲。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。中国银联电子支付研究院院长徐燕军做了题为“中国银联大数据探索与实践”的主题演讲。

中国银联电子支付研究院院长 徐燕军

以下为演讲速记:

各位嘉宾、各位专家,大家上午好!昨天大家可能听了一天关于大数据的一些比较宏观的,或者说比较前瞻性的一些方法论,或者一些基本的应用的主题演讲。今天根据大会的安排,我们这边可能聚焦在金融的大数据应用上。我是代表中国银联把银联在大数据方面做的一些探索和尝试,以及一些应用的基本情况给大家做一个简单的分享和汇报。

大家知道中国银联是咱们中国的一个转结清算组织,它最核心的东西就是它经营了一张在我们全国无处不在的转结清算的一个网络,当然这个网络目前已经延伸到国际上150多个国家,基本上我们中国人能去的地方都可以使用银联卡,这是我们银联最核心的价值。在这个核心的价值上从大数据的角度来说,我们银联有哪些数据呢?先来做一个分享。

银联是2002年成立,成立以后到现在经过了13年的发展,大家可以从前面的图上可以看到,这是我们交易量的情况,现在我们每年大概40几万亿的交易量。这里面的交易量其实我们的核心数据就是交易,所有的跨行的交易信息,这些交易信息你细细观察它实际上是几个方面的数据在这里面。

一个就是从发卡来说,每一个持卡人所有对应的银行的基本的情况,他在银行端的一些信息,银行端的客户的一些特点,以及银行的客户的一些特征特质,客户是什么样的客户等等这一块的信息。因为八大行是我们重要的一方,我们是转结清算,他们是重要的一方,所以这一块的信息我们有非常多。目前我们这个的信息有50亿张卡片的信息,还有相对应银行各种各样的一些业务信息,以及一些卡类的信息。这个信息里面实际上有些是死卡,有些卡可能确实很长时间不活跃了。目前活跃的卡一年是10亿张活跃的卡的信息,这是一个信息。

第二个信息就是受理端这边,形形色色商户的信息,商户的类型、经营范围、规模、地点等等,这些方面的信息,形形色色的商户信息现在全球有2600万的商户。还有ATM全球有180万台ATM受理信息,实际远不只这样,现在还有一些移动的信息,还有包括自助设备的一些信息。

第三个就是交易量的信息,最大的。就是在银行和商户之间的交易的信息,交易多少钱,大概是什么时候发生的,在什么地点发生的等等。像这样的一些信息。这个信息今年最新数据就是一季度我们在全球的交易量已经超过了visa万事达,我们成为交易量最大的卡组织了。

第四个就是跨境的一些信息,因为现在中国人出去得越来越多了,我们跨境150多个国家,这是我们基本的一些数据的情况。

我们再细看这些数据,这些数据里能给我们提供什么样的一些价值?一个是微观层面,一个是宏观层面。微观层面这个地方少了一步,在个人数据之前实际还有一些银行端的数据,刚才说到的银行的一些基本情况,银行的一些经营活动,银行有多少卡种,各种各样都有什么东西等等,这一块的信息。我们重点想说说个人的这些数据,从个人的数据实际上是没概念,就是一个人所有的交易行为,实际上在我们银联是都有的,这个交易行为能反映出来什么问题呢?这些交易行为实际上就能把你这个人的日常的一些生活习惯,你的一些信息的体现,年龄、性别。虽然没有每一个持卡人具体的登记的性别和基本的信息我们没有,这个都在发卡行,都在银行端,但是我们可以从你的交易,就是你几年或者一个时期的交易里头可以看出来你是男性还是女性,大概多大岁数,大概家住在什么地方,你是什么喜好、偏好。你喜欢旅游还是喜欢吃,还是喜欢什么样子的,这些都可以分析出来。

这个日常的行为实际上表现在吃穿住行,像你看病的情况、健身的情况,实际上都通过交易里面可以看出来。还有你的朋友圈,看似好象我们没有朋友圈,实际上我也不知道你这个人,你的资金往来的朋友圈都有哪些人跟你有关联。但是我们就有一个缺点,就是我们不知道这个人到底是张三还是李四,但是以卡号为代表的我知道你这个人大概活动范围是什么样的,你的朋友又是什么消费行为,消费频率。所以基本就可以把这个人刻划得比较详细。这是个人这一块。

从商户这一块我们也可以看出来,因为我们说了我们商户其实不仅仅是传统意义上卖东西的商家,卖对象的商家是我们重要的商户之一。我们还有很多形形色色的,凡是跟个人缴费或者是支付有关系的都加入了银联的网络。所以大家能想到的各行各业都在银联网络里有注册。其实我们覆盖也比较广,跟老百姓相关支付有关的行业实际都跟我们有联系。

第二个我们可以从商户里头看到你每个商户里面的基本的交易情况,你的规模、发展,你经营的一些特色,你的声誉怎么样,你的风险大不大,这些东西我们都可以通过这里面看到。

另外我们也可以分析这个商户重点是吸引什么客户群,提供什么样的服务等等。以及行业和行业之间商户和商户之间的关系,所以从这个微观的数据来看,实际上把人的数据、商户的数据,再把银行的数据,把这几个方面一叠加,实际上就是可以把一个人刻画得非常清晰,对一个商户我们也可以说得非常透彻,这是微观来看的。

宏观来看我们的数据在这地方就用得更多了,因为银联实际上还对国家承担了一些基础性的、政策性的,甚至是公益性的性质的工作,所以我们还提供一些宏观的数据,地区的一些指数,包括一些行业的情况,各行各业发展态势、发展趋势是什么样,目前面临什么问题等等。后面我还会举这样的一些例子,这是我们整体的数据的情况。

总结一下我们的特点,我们的量比较大,数据确实还是比较好的,为什么说数据比较好?因为这都是支付数据,大家对钱都非常在意,少一分多一分可能都非常在意,一笔成功、一笔不成功,一笔退款什么样,都非常在意这些情况。所以这些数据是真实的反映在不同商业行为的习惯的,所以我们认为这个质量比较好,再就是确实它价值比较大。不仅仅对我们银联价值比较大,其实对跟我们银联相接的所有的行业,还有对整个的社会价值确实比较大。

刚才我讲的第一个部分就是把我们中国银联数据的简单的特点给大家做一下分享。在这个基础之上我们做了哪些大数据的工作?其实是从2012年开始启动大数据工作,我觉得这个不是很准确,这个PPT是我们一个IT人员写的,他是从应用目前现在大家所共同认可的大数据技术来做大数据工作是从2012年开始,实际上在金融业大数据的应用实际是很早的了,对这些交易信息的挖掘,对交易信息的应用,以及对交易的风险控制、营销这些东西用得是最早的。因为大家知道金融信息化可能在我们国家各行各业里起步还算比较早的。

在2012年,为什么说2012年?2012年我们在国家发改委申请了在金融业里唯一的零计算国家示范工程的项目,从那个项目开始我们利用云技术、大数据技术进行了数据的挖掘,所以这个PPT是说我们在2012年正式启动的情况。我们把大数据基本分了四个层面,一个是平台层建设,再就是数据规划和数据治理的工作。第三是基于这些数据的各种各样的模型,为什么通过刷卡消费可以知道你是男是女,知道你是30岁还是40岁?实际就靠各种各样的模型算出来,所以这是非常重要的一个方面。第四个层面就是基于这些模型我可以怎么发展,怎么拓展市场,怎么给各行各业提供服务,怎么给国家提供服务,所以我们从这四个层面做了一些工作。

这个就是我们的系统平台,平台这一块不多说了,目前的这个平台和我们业界的其他单位用的平台基本上是一样的,都是采用现在的一些技术,这个平台我们内部从1.0变成2.0,我们这个平台已经做过了一次升级,为了更好地提供市场或者行业各种各样的服务,我们做的升级。在这里头我觉得这个平台里想给大家分享一点的就是数据的规划和数据规划以后各种各样的模型,以及这些模型怎么能够既是非实时的,或者实时地用到我们的传统的数据处理里面去,其实这是一个比较关键的东西。所以我们在模型包括一些存储、引擎等方面做了不少工作,也积累了很多的经验。

第二个就是简单的数据,数据就是数据规划和数据治理,数据规划和治理的目的就是让我们在用的时候,我们如何在这么大的信息的数据里头很快地把数据找出来?效率要高而且要找得准,像我们一笔交易处理基本上就是10个毫秒级,或者几十个毫秒级的水平,就在这个上面怎么把大数据嵌进去?怎么做到?这里有一些数据规划和治理的问题。所以我们分了三个层面第一是原始数据,把各种各样的原始数据积累起来,在这个上面进行一些简单的加工,把它分门别类进行存储。第三个就是做一些中间数据的评判,在这个中间进行简单的中间结果的生成和规划,便于上面的应用可以很快使用我们的数据。第四个就是我们要支持这个东西,我们要支持小数级的批量处理的应用,也有分钟级的交付,也有秒级或者毫秒级的实时的计算。

第三个就是模型,模型层面时间轴我们围绕过去和将来这两个。我们的维度基本就是持卡人和商户,实际上持卡人就是银行,因为我们的市场上的卡都是银行发的,银联是不发卡的,就围绕持卡人和商户。我们做了各种各样的模型,这里列出了简单的基本的我们用的比较多的东西。比如商户和过去这个象限就可以分析商户过去的一些行为习惯,什么客户到他那里去,他过去的一些风险在什么地方。用过去数据怎么指导这些商户更好做他的商业行为,商业规划,或者发展哪些商务群体,或者做哪些营销等等这些方面可以做各种各样的工作。

第四个就是应用,这就更复杂了,需要和具体的场景结合。就是我们利用数据平台我们做了各种各样的应用,我们可以支持。我们现在做最多的还可以支持中国银联内部的,分子公司的发展。对外最核心的是持卡人、商户,给他们提供形形色色各种各样的服务,后面就是各行各业,因为所有行业跟我们几乎都有关联,在我们这个平台上所有行业都加入到我们这个网络来。我们可以从银联所掌握数据的角度给他们提供一些服务。这里还少了一块我们给国家相关部委提供的一些行业信息,甚至是国家的一些指导的信息。

下面分享几个案例,我们从宏观上做一些宏观的分析科研,我们跟新华社推出了一个消费信心指数(CDI),从卡的交易情况可以反映出每一个持卡人共性的对消费的态度是什么态度,从这个曲线可以看出来,这也反映出来我们的经济还是受到一定限制,现在消费总体情况,这个信心从2014年到现在是往下的,那个红线是房地产的指数。其实从这个指数可以看出来,中间波动比较大的时候是春节的时候,实际上这个模型做得应该不是很好,应该把那个地方剔除掉,但总体来看去年到今年房地产越来越趋向活跃的。所以从整个行业我们都可以用一些模型和算法把趋势给规划出来。后面有简单的例子,像CPI、GDP的预测,行业的分析等等,这是整个宏观上可以做到的事情。

从风险防控上,这是我们在金融领域用得最多的,就是找出哪些持卡人可能是一些风险的持卡人,他的很多场合,或者他是在套现,或者到套现的商户做交易,有可能带来其他的风险等等,这些东西我们做的很多,主要就是用大数据来做的。从国家层面其实我们配合国家做了一些反洗钱,打击反恐,甚至像新疆、西藏的藏民,疆独的这些,可以通过资金支出、转向和流动可以做一些恐怖,甚至是破案,我们都可以做。

其实最主要的就是反映在人和人之间,或者组织和组织之间的联系,实际上就是组织和组织之间资金的划割,而且今天我们正好站在银行之间,就可以反映这个东西。包括到境外去追一些东西,我们都参与了这样的工作。

反欺诈,这是我们的核心了,什么样的商户的是风险的,什么样的交易行为风险的,什么地方发现的交易特征是风险比较大的等等,我们可以给商户,可以给银行,可以给行业提供这样的一些服务。

自己内部就是风险防控,现在银联有不同的定价体系,有高有低,自然就有些人想到钻这里面的空子,我们内部做一些风险防控的东西。2014年我们的信用卡的欺诈率国际上有一个统一的数据标准,国际上是2.82个BP,但是银联信用卡的欺诈损失率是0.12个BP,远远低于它的,我们在国际上水平是比较高的,当然这不完全是因为大数据的问题,可能我们用了密码,国外很少用密码,这也是一个重要因素。我们用了密码再加上大数据技术还是有效提高了我们的信用卡的欺诈率。

我个人认为我们大数据的发展可能经历了这么几个阶段,第一个阶段大家都比较清楚,用数据分析、数据挖掘,所谓数据分析阶段。第二个阶段就是数据业务。第三个阶段就是发展成数据产品,我把大数据变成一些产品,我可以提供一些产品供个人或者机构采用。第四个可能就是未来的行业和行业之间的大数据合作,现在可能还没有完全兴起。数据类的层面我就不说了,数据业务层面我们分了市场服务、商户服务两个方面。我们可以知道每一个人的生活轨迹及一年当中的活动范围,你习惯在什么地方消费,你喜欢什么属性。这里可以做一些精准的推荐,像银联在线的在线支付还有钱包我们都用的这个技术。

商户这一块也具了两个例子,那个网络图实际上用上海的一个点来说那两个红的有两个大型商场,他们的客户群还希望到周边什么样的场景消费,他们之间的一些消费商户跟商户之间的关系可以找出来,找出来以后可以有利于这些商户开展这些营销活动,有利于商户针对性地去做一些自己的市场策略。还可以分析出他自己的高端和低端的客户,可以做相应的工作。

下面是我们自己运营的,我们怎么提高我们的运营效率,这一块不说了。再就是数据产品这一块,我们这边的产品可能大家不一定知道很多,其实我们有很多数据产品,包括用我们的交易流水也可以做一些信贷的工作,但是这个信贷工作不是中国银联这一块,是中国银联下面的子公司有这样的资质可以去放贷。还可以做一些基金,中国银联智慧大数据指数,这个好象在二级市场可以买卖了他们的老总对我说6月份、7月份是绝对跑赢大盘的,而且这个指数好象就是在8月中下旬面试的,这个都是针对大数据找了100个公司的标志,不断调整这样的标的,把最好的拿下来,这个是跟清华大学合作的,看起来宣传还是不错的。

再就是商旅这一块,比如大家可以分析出来到新疆、西藏,去那里旅游的都是哪些人,都是哪个省或者城市的人去的多?哪个年龄阶段去的多,去了以后喜欢干什么事,这些东西都可以大数据挖掘,然后跟当地的旅游部门和经典合作,去做一些有效的引导,再做一些精准的产品推荐。喜欢玩人文的多推荐人文类型的,喜欢玩自然的可以推荐一些风光的风景,这也是刚刚上线的一个产品。

还有风险这边我们现在做得比较好的,除了内部我们自己用的,外面给银行做了一个水金融球的风控产品,可以监视市场和商户的一些风险。

这个可能大家比较知道的就是中央电视台可能有一个节目,就是节假日钱去哪了。这里面像五一、中秋、十一,他把假期期间反映出来的消费行为做了很详细的分析。更有意思的是像中秋买月饼,喜欢送给什么人?现在我们发现,八项规定后确实商业的行为,购买月饼行为明显降低,而且变成子女对老人的关爱,这个送月饼成分明显增多了。还有开学季,一到9月份开学的时候学生从哪到哪,家长要不要跟着、陪着等等挺有意思的,这样的一些在中央电视台进行播放。后面也有东方卫视等等的一些。

这就是我们银联前面的主要的大数据特点和一些应用情况。

最后这张PPT我们觉得目前的大数据应用从银联角度来感觉可能更多还是为本行业、本单位自己做各种各样的挖掘、增值或者是产品这样的一些服务,但实际上大数据更大的价值应该是在行业和行业之间,特别是跨行业、跨领域的大数据的挖掘。所以我们在这个地方也呼吁,我们利用这样一个大数据大会的平台,其实可以加强我们互相之间的交流与合作,可以挖掘更大的商业价值,谢谢大家。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

降龙十巴掌2015-08-31 10:38

文章内容不错!

阿宝2015-08-31 10:34

好文章,不得不顶!