×关闭背景

德国中小企业联合会吴婷:基于大数据的精细化决策案例

2015-08-27 16:11:49      来源:移动LABS       作者:移动LABS

大数据

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。德国中小企业联合会德国-中国常驻代表吴婷分享基于大数据的国内精细化决策支持案例的话题。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。德国中小企业联合会德国-中国常驻代表吴婷分享基于大数据的国内精细化决策支持案例的话题。

德国中小企业联合会德国-中国常驻代表吴婷

如下为速记全文:

我今天非常荣幸受到邀请来参加会议。先简单介绍一下,因为我这身份稍微有点特殊。我是原来在来福士数据中心做过挖掘,后来西门子数据优化,后来参加了一些像(英文)简单的外围的研发工作。但是我必须承认我不是科学家,我不是像之前的专家有那么心得,我之前做的比较外围比较局部的问题解决。所以在02年、03年开始,因为实验室研发了之后,需要进行市场化,所以当时进行了一系列的中国跟欧洲跟德国的项目对接。所以这两个事情也就是说做软件方面的、做数据方面,还有就是做中国跟德国跟欧洲方面的项目对接,都做了十几年,所以我这一块可能跟其他的专家是不太一样的。我这属于这种非专家型的。

今天我希望跟大家分享一下,就是我们在09年在国内开始做数据分析一些在国内做的方面的,主要是能耗方面的还有一些其他方面的数据解决的一些具体的案例还有碰到的一些问题。

另外就是我们看一下在德国包括我任职中小企业协会,他们这边在大数据方面跟工业4.0的结合。也就是说我们的出发点是以市场为导向,主要是希望能够让数据,可能我们现在也不能说真正的已经大数据进入企业层面,还属于在路上,就是我们现在先要解决一些企业面临的问题,然后按照它的问题来提出解决方案。而不是把这大数据的概念直接加给我们的企业。因为它可能很多方面还没有准备好。

所以我们在面对一个国内的企业时候,比如说像我们合作的伙伴都是比较大的公司,比如说三桶油做两桶油,在便利他们的时候一般会碰到这些问题,很可能总部需要决策支持,定量的决策支持,但是它不了解底下一系列的情况,因为太多了,底下有的时候会有很多部门,比如说一千多个城市,然后会采集很多数据,然后这之间隔着很多组织架构,所以他们之间会有一个冲突,会有一些痛点,还有一些需要在做数据分析之前,先要看一下,我们到底是要解决企业内部的一些比如说决策方面的,还有就是他们架构方面,数据壁垒方面的这些非技术因素。

另外就是它在组织架构不同层面会需要不同的决策支持,也就是说比如说我们在数学层面有图论,这个是分析,比如说这种网络状的,物理网络数学特性,可以应用在不同的领域。我们待会会讲到交通领域的数据分析,也可以应用在能耗的燃气、电力,包括供水方面,都可以辅助。所以这一块就会在不同的应用领域,碰到他们所特定的一些特性。

这一块就不用说了,也就是说我们碰到哪些挑战呢?就是企业的出发点,它在09年到这个阶段,我们做的这几年过程当中,它的出发点都是以市场为导向,他希望获得市场的优势,而不是说我要做一个特别好特别炫的大数据技术。这个一般是第二位。然后他希望实现,起码是总部实现透明标准精细化的标准。也就是说从原来的人大区决策权非常分散,然后在很多方面需要优化过程当中,可以把它做成统一,另外决策风险。比如说在一些产销供的方面,它原来的决策风险是领导人来做。现在我们通过概率分析,可以给它保证我们在签署误差是3.5,它的决策风险就会大大降低。

也就是说我们有一个,比如说按它需求给它做一套模型叠加,各个部门都有自己的模型,到最后变成了最理想的状态,就是变成它的一个(英文)这种(英文)就是它每个月都会愿意支出的这么一个方面。还有就是我们会碰到在国内的有不同的组织架构,也会对我们的做这数据分析产生影响。当然还有一系列的,所以这块就不一一去说。也就是我们面对国内企业的需求层面,它不是纯技术的解决方案,而是说它有很多非技术因素,然后我们需要在这前提下来建立模型。所以我们最后的结论就是说我们在国内的这些企业,我们做的企业虽然它有非常好的硬件,他们有(英文)有很好的数据采集源,但是它有很多方面的是不能够做全面的数据分析。所以我们只能够把它最关心的关键数据,然后最关键的模型不同部门的这种模型进行叠加。同时邀请关键的部门进行参与和同步。

也就是说我们在做的时候,建议如果要是大家想去做企业层面定量分析决策的话,可以去让他们各个部门,起码把它做成体系化的合作来进行。也就是说考虑到他们考核奖励,这个公式是一个德国来筹码30家公司的考核内部机制,也就是做成各个部门都愿意参与的。

这一块就不再细说了。另外一个就是我们发现碰到的一个痛点就是管理方面,因为我们做数据分析的时候,或者把高新的技术,然后一些局部的解决方案引进到国内的时候。意识到这种知识管理非常重要,即使在一个集团里面不同的部门或者是一些新的技术在国内是没有定义。所以这种界定是这逻辑的基础,也就是说我们一开始的时候,忽略了这种知识管理这是非常重要。所以我们建议大家也能够关注一下。

另外就是这种考核指标和奖励指标的确认,比如说这是一个正常的项目流程,我们一开始的时候,没有注意到就是大家要一块来做这个事情,因为我们觉得我们做的这些企业都是高大上,他已经有非常成熟的一系列的部门,我们就想去拿过来数据我们做模型把这分析给你就好了。后来发现这过程要经过七个部门审核,所以我们在做这事情的时候,一开始对这非技术因素还是要有重视的程度。所以他们能够得出结论,这结论也是兰筹码(音)公司在内部考核的标准。

这是我们对接,也是我们公司分析的数据,主要是区域的比如说能耗,区域的一些经济指标的分析,然后我们会把它考核出来,比如说各个部门的数据贡献等等。然后我们分析的数据已经标蓝色分析国这些省市的数据,其中大概10个省的数据09年以来每一天采集过来我们建模型进行分析。这一块从省的层面到了城市。也就是5个省,大概17个城市的数据。然后我们会把它每个区域建模型。这是我的一个简单的介绍。刚才已经提到过了。这是我的合伙人,然后刘总也是原来在SAP大中华区执行总监,尤其在中国市场不是一个纯技术问题,它很多时候是需要引导。这是我们做的一个开发的一些平台,是基于欧洲进行联合开发。也就是说我们主要是进行大概是一些影响因素,比如说我们有一个目标值,然后给它有一些时间序列进行积累,一般来说是96个点或者是一天,国内游的时候是24个点时间序列的积累,目标值的对应几十个甚至2500个影响因素。这个系统会进行学习,后台会形成一个显性的模型,对未来的影响因素进行各个的模型分析预测,在未来得影响因素分析预测的基础上对目标进行分析预测,所以基本上是这个原理。

这是我们做的一个简单的界面,这当时就发现CPI非常重要,比如说区域的市场资源的配置,比如说能耗是有影响,所以我们找了一些影响因素来进行分析,中国人民银行做CPI的专家进行了比较。他们那边是基于专家经验,我们是数据层面,最后比对的结果我们更精确一些。

这是我们当时预测的一些结果,也就是说我们会做一套模型,每一套模型它都会预测出来一个不同的目标值,然后我们再取一个均值或者不同的加权。所以看到一般来说,这过年的时候,还有就是有的时候我们预测稍微误差大一点,但是正常情况还是很理想的。这一块因为我们当时是这种合作性质也不是商用的,所以我们MR也进行了一些预测基本上可以满足我们自己分析预测的需要。我们还分析预测了(英文)因为我们做能耗嘛,所以对能源的价格也是非常关心的。这一块是大概我们做的是20套模型,大概的分析它的上涨或者下跌的概率。基本上可以达到这种70%,就是涨跌的不包括大事件,因为有的时候会有一些不可控因素,战争或者是什么政策出台。所以这一块就来看一下,就是国内的企业它为什么要进行数据分析呢?并且我们做的是能源行业它不是一个,比如说像通讯或者像金融这种对数据非常,就是观念非常前端的这种行业。而是一个比较稳妥的、比较传统的行业。所以他们需要数据分析来进行他的市场资源配置。比如说他在上游有很多个上游的供应源,比如说有的时候是有自有的油田,还有一些上游一百多个供应商有不同的协议。它的下游可能是各个城市需求方,中间是精细化管理。他们中间是需要市场导向的预测,尤其是带有预测性的,我们基本上可以给它对未来的预测,可以减少很多的决策风险。尤其是它的采购期货方面的。

这是我们的一些功能,这是一些优化管理一些流程。比如说上游有野鸽运输环节有下游,每个环节都会有自己的一套规则,这一他规则我们会把它做成叠加模型来进行计算。所以这一块我们就会不同的需求,比如说发改委它会有需求,我们要对各个省市在两会期间每一天都要做分析预测,到底是这能耗是多少,因为有的时候比如说ING的运输是属于危险品,它在两会期间是不能运。同时我们的储户是不开放,就是每一个企业自己来运储户,所以对市场的需求非常关心。所以我们就分析预测了一下。当然这前提是不对称,我们只采集到信息,总体来说非常准确,总量只有0.55,每一天除了3月15好,因为3月15号是停止供暖的期限所以误差大一些。

这个是我们在国外德方的技术团队客户,他们把数据分析应用到每一个环节,我们在国内还没有做到,我们只能做到决策支持的这种,还没有跟业务环节相挂钩。也就是说国内企业在进行期获交易的时候,它是不看我们分析预测的结果,非常可惜。他们就是大家商量好就是做事情,做完事情以后都亏损,然后再去退掉能源的期货,这个损失非常大。所以我们希望他们尽快的转变思路,来愿意去做决策之前看一下我们数据分析的结果。

这是我们做的一个案例,它是大概是我们进行了全市布点,然后不断的采集数据,就刚才专家说的一系列的形成时间序列,再跟我们其他的影响因素建成模型。也就是说深圳那边我们可以把它每个月的用量分析预测的分析非常准。所以这是一个报告,这就是每个月的用量这么差,这对总部来说非常重要,因为它是一个上市企业,这是我们定制的模型我们就不去讲,这是我们做的预测模型,教科书上也有。

这是做的一些案例这是我们做的车的数据分析,然后是跟某个省市的一个路口,这是最大化一个匹配方案,也就是说刚才我们提到我们分析一些宏观指标,然后同时把它变成一个区域的这种能耗的市场规律的预测。然后我们要在这基础上进行匹配,假如说这集团面对四百多个不同的形式,然后他要进行所有的业务的调度,他每天可能产生的方案是海量,我们在足够短的时间内做出来,利润最大化、集团最大化,在这基础上专家进行修正。比如说高速公路封路就不能走这一条路,所以在这飞跃上节约很多费用和时间。所以就是我们通过数学默模型来对市场的供需来进行分析和预测。同时对于精细化管理匹配方案,或者保障供应方案这些是完全可行的。

这是我们的一个界面,所以这一块就是在这基础上,我们就看看德方他们怎么样来进行进一步的处理,比如说他们会进行工业4.0,进一步的生产、流程的优化。它基本上的就是说一个大企业,比如说它的流水线它是不值得自己去开发的,它做这研发成本尤其是跨学科是非常高,所以他愿意是外包。

然后它这我们原来实验室的一个同事,他在德国这一块做工业4.0,他做了很多采集、传感器然后高清晰的摄像头,把这目标物体做成一个3D,然后进行跟踪,然后把它的废铁率在生产线发生苗头的时候就进行模式识别,然后在它后面生产过程当中,是整个生产线的碎片率没了,所以这一块是非常好的工业4.0跟大数据结合的解决方案。现在他们到了一个程度,就是要把这大数据层面是属于嵌入式的,速度非常快,每分钟可以识别60个零部件,所以这一块后台计算是非常高,如果大家做多媒体数据库,这一块他们希望接下来再跟IP系统跟RC跟他们的质量管理等等进行互动,这样的话就是真正成为一个智慧工厂。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王砾瑟)
共 1 页
分享到: 0

评论

全部评论我的评论

爱笑的眼睛2015-08-27 16:20

mark,以后慢慢读。

能痴大师2015-08-27 16:19

赞~这个非常受益~

张莉2015-08-27 16:17

好棒好棒