×关闭背景

浩瀚深度信息刘彤:“互联网+互联网,被遗忘的角落

2015-08-27 11:02:55      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。北京浩瀚深度信息技术股份有限公司副总裁刘彤做了题为“互联网+互联网,被遗忘的角落”的主题演讲。

【移动LABS82627日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。北京浩瀚深度信息技术股份有限公司副总裁刘彤做了题为“互联网+互联网,被遗忘的角落”的主题演讲。

北京浩瀚深度信息技术股份有限公司副总裁刘彤

以下为演讲速记:

北京浩瀚深度这个公司原来叫北京宽广电信高技术发展有限公司,成立于1994年,公司最早做互联网流量的数据分析、采集等工作,慢慢转型到大数据应用、挖掘、流量经营、流量管理领域。

公司现在的市场规模是什么样子?在中国移动、中国电信、中国联通环境下覆盖超过5G带宽,把这个概念量化一下到日常生活,5G以上的带宽意味着什么?大家在家、在手机上、在不同的终端上,只要你访问的网络资源是在中国这个网络,80%-90%的流量都已经被我们监控到了。如果你在国内涉及到跨网访问,比如中国电信用户访问中国联通,这里面也有将近80%的流量被我们全部看到了。我们看到的流量是什么?包括大家每一次访问行为的记录,包括大家用微信发一条消息、点开一次朋友圈,包括你看一个视频,包括你去下载一个东西。

我们的定位是这样的,干了这么多年数据采集、分析、控制,但是我们定义自己是数据的搬运工,因为并不生产数据。同时,我们在分析过程中也不制造这个结论,因为不管我们是不是在做分析,这个结论已经在数据里面有了,我们只是在发现、挖掘。我们为客户提供的是实用、易用、好用的数据分析服务。过去有人认为浩瀚深度是一家专业的DPI公司,最近五年时间把我们当成大数据分析应用公司,但是我们贯穿始终的是一家数据可视化公司。

我们对互联网+互联网的理解,大家最熟悉的互联网+一般是把传统企业怎么互联网化,怎么利用互联网作为它新的渠道、手段、工具,也有一些互联网企业是用它的数据来去帮助传统企业提升它的现有能力。

我们公司94年成立,一直到2008年,填一些表格时我很纠结一件事,表格有职业公司领域这一项,每一次我都找不到哪一个是我们这个企业特别契合的领域,直到2008年我一个运营商客户聊天时跟我说了一句话,是“真羡慕你们这些互联网企业的机制”,我当时愣了一下,在这个公司做这么多年,才知道我们是互联网企业。那一年我们公司就进入高速发展期,现在是第七年,每年保持50%以上的增长,很神奇。

我们如果是互联网企业,那我们在做什么?我们做的是跟互联网数据打交道的工作,我们在做各种各样互联网数据的分析,这些分析是怎么样让传统企业有更好的升级换代和演进。到今天为止,我看到大量互联网+案例往往会漏掉一个关键性信息,就是互联网企业真的把互联网数据用到了吗?这是一个很重要的问题。大部分企业在互联网身份情况下,它能够进行的经营工作最核心是运用它自己的数据,它自己的用户产生的各种各样分析,再做大数据挖掘、分析、精准营销。但是BAT企业这么大应用基数,是不是能够把互联网里面用户信息有效掌握,这是一个明显的漏洞和缺陷,而这个缺陷从一个互联网企业个体来说是没法解决的。也就产生了我们互联网企业配合传统企业做升级换代时,它们所提供的信息看似产生非常多的应用,但是这些应用还有改进空间。

这部分改进空间是什么?我们举一个小的例子。现在互联网+的成熟应用领域是电商,电商数据非常庞大,而电商的数据是谁拥有?是互联网巨头、电商大平台。9万万次的点击,它肯定背后有很多用户行为、用户喜好、用户关注、用户各种各样的习惯。这个过程中如果以电商企业自己数据垂直性分析,可以得到什么结论?这个普通会员一个月之内购物3次、在什么时间购买、购买的产品类别、平均每月到这个网站活跃天数多少、消费金额多少,这些数据综合做了个用户画像。

比如这是一号店,电商要想办法把僵尸用户激活成高价值的用户,可能电商做了非常多分析,但是用户为什么还无动于衷?如果我们对比另外一组横向数据,大家可以对号入座,发现如果用横向数据来看,这是一个用户一个月所有电商里面的数据,发现在一号店普通会员一个月购物有50次,平均1天都有将近2次,这意味着什么?意味着他有些购物行为发生在其他平台,看到了在京东疯狂的购物行为,在一号店有3次,在天猫也只有3次,他是京东的金牌会员。如果互联网+数据来源于单一的电商平台,那么它的局限性很明显。

同样,横向数据做关键分析时有应用点,比如现在金融很热,股市起起落落,你们做股市交易过程中和关注某些金融产品时,你的在互联网里发生的行为也被记录下来,会判断有多少用户只关注某一支股票或某一个公司,有多少用户同时关注不同的金融公司或股票。

既然说传统的互联网+单一的垂直数据不太好用,那么我们怎么获得更可靠的横向数据?我们得讲一下横向数据是怎么产生的。我们原来一直不认为自己是互联网公司,因为一直我们为运营商服务,帮它们做数据采集、做数据现在、做流控。比如你们在家上网用讯雷下一个资源,下的没有10年前快了,虽然带宽涨了那么多倍,不好意思,是我们干的,我们做了流控。为什么要做这个流控?因为如果不做的话运营商要付出高昂代价,我们仅仅在流控这一项每年为运营商节省上亿资金,一般是几十亿,因为国际通道非常昂贵。

我们看看这个数据是怎么采集的,左边拉出的方框有DPIDFI,它用数据报文(音)认出这个通讯报文(音)是讯雷下载还是微信。这个是用专业设备完成的,可以部署到网络各种各样的位置,省网、城域网、移动互联网、IDC数据中心都可以部署这个设备。这个设备会形成记录,这些数据产生于运营商网络,但是运营商网络对于这些数据的利用停留在相对传统的优化网络、提升质量。

现在我们仔细看一下运营商网络到底有什么不一样,如果这些数据假设在省网,可以看到这个省所有互联网用户的所有数据访问行为,不管你用BAT还是千千万万互联网企业提供的互联网业务,都会在这个口完整的被看到,它是客观、真实、全面的数据。大家可以从网上拿到很多分析报告和咨询报告,那些报告主要的数据来源是数据采样、问卷调查。而在我们这个环境里面是全量数据行为,是所有用户访问所有业务的记录,通过它可以解析行业价值分析。

浩瀚深度把行业的行为进行统计,举一个刚才大家举过的例子,譬如我们可以会看到滴滴打车、快滴他们正常的运行状态。但是反过来讲,我们可以提供打车这个行业各种各样横向对比数据,比如可以知道滴滴的用户在哪、什么时间最活跃、从哪去哪,和快滴、Uber等都可以做横向对比,给你提供客观全面的行业数据。对不同身份的用户有不同的用处,假设我们在座是投资者,不能只看这个企业的财报,要尽可能拿到这个行业的状态、它竞争对手经营状态、用户发展趋势。

做这个事时我们考虑互联网+应用时应该是多维度数据的综合,不应该是简单一个名词,不是一个互联网企业就可以完整支撑互联网+行为,它需要更多横向数据来进行支持。这里面有公开数据,也有用户特征行为数据,也有我们自己积累的数据,综合完成刚才设定的目标,得出横向的分析结果。

拿到这些海量数据,对数据进行清洗、管理、挖掘,在数据处理完之后它可以出什么东西?我们有很多事可做,但我只讲一个小的点,比如用户标签,一般讲这个话题很多人就担心侵犯到隐私,我的行为被记录下来了,你了解我各种各样的信息,太可怕了。但问题是什么?你们很嗨在网上购物的时候信息被记录了不知道多少遍,实际上互联网里面已经没有隐私了,不管你愿意不愿意,只要你还需要与人交往、与人通信,只要你不是一个信息孤岛,就意味你一定有大量个人隐私信息被泄露。

我们不应该聚焦在这个层面,而是怎么样让我们的信息合理合法应用。比如大家最严重的隐私级别是什么?住在哪、叫什么、手机号码是什么。这个数据在快递行业知道吗?清清楚楚,但你能不提供这些信息吗?怎么更合理的、更合法的应用才是我们关注的点,所以希望中国尽快推进相关立法和交易规范性。

如果我们的目的是做更精确的营销和高价值的提取、转化,你们不愿意每天看到铺天盖地几百个广告,你们也会有需求说当找东西时找不到,那么这个转化过程是一个非常好的应用方向,另外,在一个行业里面怎么做全行业的产品对比分析和报告,这个报告要基于全面、客观的数据,这个数据对很多人都有用。

当我们设定这个目标之后,快速看一下里面的主要内容,比如我们怎么打标签,怎么根据你的移动性看你有哪些信息被记录下来。比如我们都想换手机的情况下,你想不想知道你心怡那款手机的真实市场表现是什么?也许这款手机在整体用户群体里面使用率在严重下降,他们都聚焦在某一类问题上,你想不想知道这类信息?这样的信息就是有价值的。

在用户画像时,网上有各种各样不同表现选好分析类别以及结果,它可以把你各种各样行为记录,对你进行精确画像。也许你的照片也可以通过很正常的途径获取到,因为你自己会晒朋友圈或发微博,那么你的个人信息会完整的被提取出来,这些信息有助于精确描述。

再后来,如果一个用户信息能拿到,用户群信息也会组合,形成多维的画像数据,这些数据进行组合运算,可以筛选出不同的针对用户群体。比如我们很多嘉宾是专业行业,通过多维用户渠道叠加都可以完成。

刚才为什么说聚焦到一个小方向?多维数据提取、用户标签、画像、批量数据精准营销,可以应用在两个方向,一个是企业精准营销,一个是了解行业级信息帮你做决策。这两种信息或多或少都存在,大家可以体验一下你日常生活是不是跟这两种有关系。

最后收个尾,这是爱因斯坦的一句话,这个PPT里面还有一个彩蛋。“逻辑会把你从A带到B,但是想象力可以把你带去任何地方。”现在大数据和互联网+发展带来的变革,最重要的不是在于技术层面,而是你想到还可以用它做什么,这是我们今天分享的主旨,谢谢大家。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

田鸥2015-08-27 11:20

静观其变吧

元好又问2015-08-27 11:18

好文章,不得不顶!