×关闭背景

GrowingIO联合创始人张溪梦:大数据驱动的企业商业变现

2015-08-27 15:59:39      来源:移动LABS       作者:移动LABS

大数据

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。GrowingIO联合创始人、CEO张溪梦分享大数据驱动下的互联网企业商业变现的话题。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。GrowingIO联合创始人、CEO张溪梦分享大数据驱动下的互联网企业商业变现的话题。

GrowingIO联合创始人、CEO张溪梦

如下为速记全文:

我叫张溪梦,刚从美国回来。我们公司名字叫GROWINGIO,因为我们相信企业帮助企业成长。我们小企业帮助很多企业的成长同时,也能同时成长。还有IO现在很多美国创新企业,都在用IO做一个域名。为什么做IO,其实刚才陈总已经提到就是数据的吞吐,数据本身来说最原始就是1和0的关系。所以说很多公司,特别是硅谷新创的公司,特别关于数据和分析的公司,都要用IO这个域名来做域名给大家介绍一下。

简单介绍一下我,我在过去12年一直在美国工作,最近就是前一家公司美国的(英文)它是世界第二大企业集云端的软件提供商。第一家是(英文)大约500亿美元的市值。核心的来说它在数据上应用上有很多的不到之处,我觉得我个人来说很幸运,在过去五年之内从数据科学家从我一个人变成了将近八十多个人的团队,一直负责营业和运营还有销售风控各个部门。在这之前我在(英文)做了大约三年多也是负责网站和移动端的分析。在美国的意识从来没有过大数据,基本上市场营销、运营、产品、销售、风控、客服等各个领域,他们讲叫数据化运营、或者运营决策这个领域里做各个工作。

我今天分享我过去十来年基本的分析和趋势。还有一个我在美国看到的潜在问题。今天回到中国来说,我们如何能用先进的技术和管理方法。把美国一些公司的弊病通过技术迭代掉,而不要趟样的坑。其实数据很简单,在七年以前发明了这个(英文),到底是什么数据?其实数据是很简单,又复杂,既庞大又微小,既微妙又透彻很简单它只是连接四个事物的一个点。就是时间、地点、人物和事件。每一条数据最基本的四个属性就这四个。任何一个数据分析的方法论都可以抽象成这四个点的集合。就是某一个人在某一个地点和某一段内容进行了某种交互,这段还有一个特殊的时间性。

在过去的或者下面五年会产生什么事情?这个报告是美国的(英文)发布的报告他们基本预测的在下面的五年会有世界上40亿人或者间接互联网和数据体系里面来。会有4亿级别的一个企业级的数据消费市场。然后我们会有2500万的AP会被开发出来或者被应用。将近250亿台设备接入以互联网网络。最后一点的话有500万亿GB五的(英文)产生。大家想一想10TB的数据,如果500万GB的数据是什么体量,可能大家想跟我没有关系,全世界那么多又如何呢?实际上不是,我们今天的企业和我们的客户和用户,包括我们内部的企业员工,每天都在接受几何倍数增长的数据。

我给大家看一张图,这张图是今年1月份,美国的IEC联合分布针对和企业数据有关系的提供商一个名单。因为反光的关系,大家看一看这张图会聚了什么样的企业?广告、CRM、(英文)就是基础设施、云、还有各种的移动互联网的工具,电子邮件营销,我可以在一直一直不停的往下数,美国已经进入一个非常非常细分的市场,特别是在过去的一年之内,这张图从去年大约一千家的企业在今年和去年的2014年发布的版本和今年的版本。企业的增长一倍从一千家增长到了1894家,大家可以看到整个美国的或者是全球的数据运营市场已经达到了一个非常井喷的状态。而且各种运营服务商都从传统的方式向在云端移动。

举几个例子,想一想这就是今天的企业处理数据的经典流程。每一个环节我们可以认为它会有一个服务商来提供各种解决方案。比如说数据仓库、数据建模、BIR、数据等等。如果我跟大家说大家拍一张照片不是真正的企业流程图而是一个污水处理长净化的流程图,大家会怎么看?这实际上美国河流进行污水处理的一张图。首先我们会有各个的水源汇聚进来进行清洗沉淀过滤再清洗再过滤再沉淀,才能声称基本上人类可以引用的一杯水。大家再看一看今天基本的HADOOP,或者说今天基本的主流互联网企业,网站端、移动端、设备端,通过ETL方法,或者处理方法把数据传到云端去,然后再通过精炼在HADOOP再抽取再聚合非常不结构化的半结构化的数据。但是这过程中又有结构化向非结构化各种转化,最后存储完进入数据仓库等各种模型。大家看一看整个的流程,实际上是数据分析里面非常小的一个环节,它还会整个数据分析的核心,它只是一个非常小的环节。大家看一看整个的流是不是比那张污水处理厂更混乱更复杂更缓慢和更低效。

咱们再一讲人的流动,咱们刚才看了污水处理厂的结构。我们看看人企事业是非常简单,产品经理、市场推广人员、销售人员营运人员各种业务端的人员。这种就是前端采集数据的工程师,比如说在整个的企业网站里面过了3000万行代码,3000万行代码他唯一的工作是什么?就是收集人与内容之间交互的各种数据。3000万行代码就是规范到最后变成多少呢?变成了大约200万个不同的标签。这种标签的结果就是造成了很多的一条工程师有了新的工作,还需要把这些数据抄写到我们内部的数据仓库或者HADOOP系统里面去。

我们商业报表和分析开发人员,在对这些数据进行分析和整合。还有数据科学家对数据的进一步进行洞察和建模。他才会得到一种结论给我们的业务端提出来。在过去的一年里面,我们都看到一篇报告,美国做一个研究,就从数据和定义开始,这过程当中需要多少时间呢?中类数是5个星期,就是从需求刚刚提出来,工程师开始在产品的布点这个时间点开始,到最后的分析需求基本完成的中位数是5个星期一个需求。只有1%的企业能够在两天之内把这工作完成。只有5%的企业能在一星期之内把这一个需求完成。大部分企业都在4到6个星期之间可以完成基本的需求。还有若干甚至超过50%的企业,需要在几个月甚至半年的时间内完成。

大家想一想这个世界是一个信息爆炸的时代,如果我们做的效率是那么低的话,很难做到数据决策、数据驱动决策,所以数据驱动是很贵,只有公司的管理层和CEO。我们现在把这种能力和能量分布给很多人的话我们就需要一个核心的改变。

这张图是我在工作做了一个,这张图是我反复讲,就是传统的企业或者传统的互联网企业做分析,基本上抛不开这八哥步骤,首先要从用户和产品开始。第二点的话,我们必须关注数据收集和数据采集。第三点的话,就是我们必须要了解数据的转换存储的整个(英文)或者是基础设施。第四个好的分析师不需要做大量的分析。但是这里专题分析,要有大量反复的回答客户端提出来的问题。再上一点(英文)实际上这个领域在美国发展了将近二十年,甚至理论上传统的报表,今天不过有越来越多的工具迅速的洞察能力,(英文)各种的技术在延伸和转换。

在上面三个流派,经济学、统计学模型,还有麦肯锡主导的战略分析。所有的分析没有洞察不能有决策不能有执行,这些分析本身来说就没有任何的价值。所以说核心的我们真正关注的任何企业里能产生价值的部分,往往在这金字塔最上层这几个层里面。比如说决策、行动、洞察还有高级的模型和分析方法。

非常不幸的是在过去的十年之中又是一个基本对美国最先进的公司,或者相对来说最先的公司做过一个调研,这个调研是数据科学家还有(英文),他今天系美国奥巴马白宫手机科学家,他去年做过一个研究。他的结论是全世界要顶尖数据公司里面,大部分的数据科学家在做的工作都汇集在金字塔的地层,85%、90%的人时间清洗、整理、传输、存储,而没有把精力和时间放在(英文)或者可执行性这个层面,不是人不愿意去做,而是数据分析前端的过程很缓慢很复杂很昂贵的过程。

怎么改变呢?今天来说的话,首先一个我们有了更先进的技术。我们必须要利用各种的先进技术,把金字塔底部做的非常狭窄,或者尽全力相对的抹掉。就是任何一个企业想把底下抹掉这大数据的战略一定错误。任何一个企业只想吃第七个烧饼一定会失败,我们不想在前面花太多的时间,如何做到呢?就是要用最新的技术来把以往很缓慢的流程,把它缩短甚至让它透明化。

大家讲一讲来回顾一下刚才金字塔,我们把它再细分一下。实际上真正在美国,今天有将近两千家提供商,实际上这两千家提供商里面的话,很有意思,他们在各个领域进行了细分,我们可以举几个简单的例子,比如数据采集里面有专门的公司,比如说(英文)他们专门为网站做数据标签,他们的工作就是做数据标签,比如说还有谷歌做(英文)来支持市场运营、销售各方面为网站打标签。下一步还有标签管理,很多企业不太重视标签,实际上这个是企业管理战略,一个核心的起点。

美国十家不同的(英文)在对这个领域进行各种深入发觉和产生各种新的解决方案。再上面来说的话,可能对大家来说比较熟悉的框架,比如说今天HADOOP在国外已经超过了十年,在企业推广超过了五年。但是它今天这种技术不能单纯理解为分布式计算技术。传统的APP仓库的技术还是主流的技术和接口。因为传统的报表还都是和关系型数据库有非常紧密的关系。

所以说一个企业如何聪明的分布式技术还有(英文)还有一个多线长仓库的技术,能混合组织这个数据池是一个非常重要的战略一环。再往上走的话就开始进入分析的领域。很多公司就在讲,我们叫响应性的分析,在英文里面的话,它一般来说叫(英文),是什么意思呢?就是说我有一个问题,我想知道这个公司多少人?我想知道这个广告商投放的是多少。我想知道沃尔玛今天投的广告转换效率是多少。我想知道这些人的效率是多少,各种各样的繁杂问题,我们分析师会做各种各样的分析,但是他只是对历史简单的回顾,没有任何的可预测性和诊断性。我们简称为响应性的分析。传统的报表基本上是在这个范畴里面。为什么?传统的ID没有任何的预测和(英文)功能。下一片是诊断性分析,大家可以理解一下就是用各种历史性的(英文)来对比如说企业或者业务线进行诊断,来判断它是哪一种情况。

就像医生通过各种检验结果来判断一个病人的疾病情况一样。再往上走的话就是战略性分析,过去三十年一直美国的管理资源公司,但是这五年我个人感觉,就是(英文)这个产业在慢慢的下滑,它已经不是金字塔的最顶级的价值产生者,或者价值占有者。为什么?就是因为今天的数据量的爆炸。或者被(英文)的过程,远远超过了制定战略而没有执行方案的这管理资源公司所能把控的范畴。

所以今天来说呢预测性的分析,或者是局部的大幅度的优化,这些已经被各个企业里面战略层面提升到一个很高的程度上。举一个简单的例子,今天的很多相对前沿的美国企业,他们在没有产生数据的前端就对体系进行各种回归的分析。我举个例子,有多少人提过尼桑出来一辆(英文)的汽车,它是电子汽车,五年之前开始研发,当时没有的电的汽车在市场上面,他们用的模型没有任何数据支撑,但是它用(英文)模型建了一套体系成功的预测了美国市场对它的基本的需求,它在哪一个点里面,什么人需要这样的汽车,在美国推出,所以说很多的情况下。

还有一个美国做很多的模拟,比如说举一个例子(英文)这种东西的话,就是说它在没有打仗之前,它在没有产生之前,它在没有进行广告的投放之前,就对各种的环境进行模拟,找到最优的方式,把这个部署下去,会产生很大很的价值。

在这之上我想讲一下全自动分析,我们发现过去若干年里面,真正人的效率增加,实际上是把人从各种流程抽出来的过程。传统企业5到8个组负责各种的,比如说数据仓库、BI、数据收集、工程各方面的都有不同的团队来负责。导致整个流程缓慢,今天来说前两天有两个有HBS他发了一篇文章就是全自动分析为各个企业带来的价值。

比如说美国有一个物流公司,他们专门管理卡尺什么时间发出,他们自动来计算每一个加油站的价格。计算卡车里面有多少油,计算司机的驾驶习惯什么样。计算这司机应该采取的过程。整个司机的作息,长途司机需要晚上睡觉,这样算下来的话,全自动管理决策系统,这样来说增加了各种效率。

今天来说讲一些大数据如何创造价值,因为时间的关系我很快的跟大家过过一下。数据本身能产生大量的价值,首先一点的话这种大量的价值一定是基于大量的部署之下。一个公司所有在一个人身上我感觉这不是大数据公司,这还是传统决策性的驱动性公司。

首先一个假如互联网网站的例子,互联网各种不付费的信息,我们用市场营销,比如说广告的对人画像的分析来做各种经济化的运营。第二点产品设计分析,我们需要知道用户如何用我们的网站,如何把产品体验做到最好做到极致。第三点销售分析,很简单用户用的好,我们如何通过这用户的行为,来迫使用户购买的可能性。第四点用户行为用的好他变成长远在这平台上消费的各种能力。再跳一下这也是我对互联网基本的数据分析一个理解。

实际上互联网网站分析的核心就是一个转化漏斗的分析,任何一个企业都在想尽办法把转换办法漏斗做到有效率。第一是客户认识,第二点客户使用,第三点客户评估和第四点客户购买。都是用这个漏斗比较抽象的方法来演绎的。任何一个非电子商务的(英文),本质上也能用这个漏斗。

举一个例子互联网金融、在线教育、猎头找工作网站,所有的互联网以互联网为基准的业务模型都是以转化漏斗的模型,及时呈现。

我今天给大家举一个李子,比如说零散的企业,如何来客户留存。它是世界上的外商的网站,它最核心的业务就是B2、B端那么管理客户不让他流失是这个企业增加盈收的一个最佳方法。以前网站上的客户每年流失率超过50%,今天客户流失率降低为20%,营业额增长多少呢?在过去增长30倍,从7000万美元到今天30亿美元的,三四十倍的增长怎么做到呢?很简单就是用用户和它产品之间的用户,来预测一个用户长久的流失率。第二点预测用户的流失,往往在他很早期的行为里面,我们就可以检测油壶的潜在流失。还有一点的话,那么多客户,我们每一个公司都是有销售经理和销售代表在管理。平均起来的话,每一个销售代表,他要管理一百到三百家的公司。没有一个人一天给三百家公司打电话,我们如何把最重要的公司抽取出来,又很简单,通过基本的行为数据,通过过去过往的行为来检测用户是不是用多了,是不是追加销售,用户平均使用,那他基数是不是增加,是否我们应该给他打一个电话,来促进购买更多的登陆帐号,这些所有的一步一步慢慢到抽象成为公司内部所有的销售员工,都会针对他的客户来采取行动的一种数据解决方案,这就是以前我们在做的大约五年以前,一个季度才有数据的发布。全公司里面一个销售拿到一个名单做预估。今天来说每一天每一个小时正确的时候收到他们做的事情简单的报告,在手机上。这样大幅度提高效率。以前是三个月做一个决策,今天是每一天都可以针对您的客户做各种决策,这样决策权分布下去了,让每一个人产生1%、5%、10%的价值。

但是每天产生的价值这就是一个非常(英文)的一个迭代和价值产生的过程。

然后我觉得刚才我已经涵盖了一部分,我就不重复说了。如果增加购买额度,也是非常简单,就是通过在各种微妙的信号它是如何和我们的产品进行互动的。然后预测它对我们产品的使用和期待度。最早的时候每年签一次约,一般来说倒数销售才会给他客户打一个电话,发现流失率是很高的。也没有用户再追加销售,或者最后一年追加销售,后来我们发现很多用户用的很多,第一个月用的很多。立刻销售人员和推广人员可以跟客户进行接洽,这是基于时时或者近时时的分析结果。如果我们想对所有的数据进行分析的话,每年积累将近3GP的结果,这对于我来说业务相结合出来,最后的核心价值观是速度为基准还有广度为基准。速度就是快,广度每一个人数据决策的能力。

最后再讲一点,在过去这几年我们基础的理解。第一点用户基本的信息,一般来说对商业的价值产生,大概会占12%15%之间。比如说这个人住在哪里他收入基本多少他什么职业,他转哪个区开什么车有什么保险。然后用户的行为预测力大约占到33%,这种用户用了什么、买了什么,频次是多少,去了多少次、买了哪种产品,就这种交易行为。我们发现最终的真正有预测力的能给商业产生价值的就是这种用户的倾向。这种倾向性往往是从前面两个主要的种类里面,迭代抽取出来的。这种倾向性的预测力大约占到50%以上,这也在过去的五年里面能对各种用户的行为进行各种的,比如说操纵,对它进行影响,这种倾向性预测的未来巨大的购买力,能帮助企业提高业绩和提升效率。

我想接着云的故事,刚才大家看到两千家企业,在领英(音)我工作这几年,数据库的技术超过25种技术。大家可以想像25种数据技术,超过200个以上的数据源。超过近50种以上的产生的各种数据,把这些数据聚合在是一个几何倍数的工作,所以我们那边(英文)团队是最累,但是今天来说云新的技术让我们从那里解放出来,能做到超过传统的IT框架的一种超越式的解决方法。比如说首先它有弹性的架构,另外一点的话它越过人,因为我们这方面的专业才华的传单的人太少了,不是因为我们中国人的聪明人,有能力人说,是因为我们发展的时间太短,没有积累出足够的经验。这种经验就导致相对人才的缺乏。还有CEO和专家们,我们如何能用云的技术来越过知识短期缺失和壁垒。

最后一点的话我还讲一讲就是开元技术和云的还有社交技术之间对产业的影响。首先一个在过去的五年之内,我们深刻感受到开元技术为社区为社会带来各种好处。大家看一看以前微软有一个网络的叫ASP开发的工具都是付费的。还有PHP它是相对开元免费。大家看看这两种方案PHP还是非常崛起还是存在,SP已经淡出了。

再一个例子,HADOOP是相对免费的大家应用的场景非常多。比如说传统的(英文)比如说(英文)还都在,但是慢慢的开始向开元里面迁移,我这样讲一下对开元社区的贡献是今天的一个主流,任何的一个软件企业都要想一想,如何在战略上支持开元的社区,让很多人参与进来吧这数据技术应用到很多人上去产生更多的价值。

我们公司主要负责网络和IP端的数据分析,我们通过开发了一种新的技术,在不买点的情况下对网站和IP进行动态的分析,我们的核心企业使命是帮助一个企业提高它内部的市场、营销还有产品各种运营效率,主要就是我们想把污水处理厂搬到云端,用云的技术让太阳自动把水抽到云端,变化雨水浇灌大地,让每一个都得到成长,谢谢大家。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王砾瑟)
共 1 页
分享到: 0

评论

全部评论我的评论

韩艺珺2015-08-27 16:07

有些观点还是值得商榷的