×关闭背景

联想集团、联想研究院黄莹:企业大数据应用的实现

2015-08-26 11:04:21      来源:移动Labs       

2015中国国际大数据大会

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。联想集团副总裁、联想研究院云计算与智能研究室主任黄莹做了题为“企业大数据应用的实现”的主题演讲。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。联想集团副总裁、联想研究院云计算与智能研究室主任黄莹做了题为“企业大数据应用的实现”的主题演讲。

联想集团副总裁、联想研究院云计算与智能研究室主任 黄莹

以下为演讲速记:

各位领导、各位院士早上好,很高兴有这样的机会跟大家谈一谈大数据在企业里的应用,特别像联想应该也算是一个中国出来的国际大企业。

大数据怎么来的,我想大家都比较清楚,因为应该说刚才前面讲到可穿戴和数据的产生,最后我们通过采集到数据进行分析,产生价值,这个不一一说了。

另外一个就是我们在过去的一年里面在移动互联网里有很多创新和方方面面的动作,李克强总理在提互联网+,也是给大家提每个企业都面临这样的问题,随着这个潮流在这个潮流里成功,或者被潮流颠覆。互联网+出现以后很多行业被颠覆了,在出租车或者金融行业等等,这一切都是对我们在互联网+这个时代,我们怎么样能够尽量和利用好大数据和云计算作为关键因素和平台,能够为企业带来价值。

如何应用企业数据我就不一一讲了,但是最重要的还是要基于大数据怎么价值,怎么支持企业的决策,包括各方面决策,从而产生价值,而不是变成一个平台。企业大数据有几个来源,企业都有所谓的ERP或者运营数据,这个数据本身提供这个数据的软件提供商,像SAP等在这方面做了一些工作,像SAP出现了(英文)的分析。更加实时化,更加大规模的数据进行运算。

第二个数据就从机器里产生,什么叫机器里?数据有可能会在你的终端或者应用里面被采集到,采集到之后这些数据也是对企业很大的数据来源。

第三个是社交媒体,不管是微信也好,还是网络上各种各样的动作也好,其实都是你跟别人在交往,或者跟整个社会在交往的一部分。所以这也是一个比较大的数据来源。

企业利用大数据方面有几个案例可以分享一下。

第一个在医疗方面,大家知道现在我们的医疗都是到医院去看病,但是现在医疗档案已经被电子化了同时有很多可穿戴设备也在产生大量的数据,能够让个人的信息到护士,或者将来对慢性病的管理都产生很大的价值,同时产生很大的社会成本,不需要去医院排队挂号就可以把一些病解决。

第二个是生产厂家可能会利用各种方法把设备的数据采集,提供更好服务。如果一个汽车厂家可以把运行中所有的数据采集到,可以来管理你整个车的运行状态,保险公司也可以利用这个数据来降低你的保费,如果你是有好的开车习惯就会把你的保费降低,反过来也一样,如果你经常进入危险区域或者开车习惯不好经常超速,可能就会涨你的保费,这是在设备上采集的数据,对企业来讲也是有巨大价值。

第三个是在商店。大家可能比较关注的是网上的商店,这个当然会有很多数据产生。但其实在实体店也会有数据产生,这是非结构化数据,比如视频等等。这样可以来分析作为一个商店有多少人进去了,他对什么展台感兴趣等等,这也是一个大数据产生的大的来源。

最后我刚刚提到在网上的行为企业对客户数据分析,看他喜欢什么产品,是什么类型的客户。这样对企业未来推送自己的产品或者更好的服务客户都会有很大的价值。

所以如果我们来看企业首先第一个就是怎么获取数据,数据可能从各个地方过来,可能你就要从设备或者网上采集各种各样的设备。但是光有数据采集还不行,还要进行清洗和归类,最后这个数据才会真正产生价值。

第二个要利用现在已经有的,或者刚刚起步的,hadoop等这样的工具,能够对数据管理,放在一个有效的场景里面,让数据产生价值。在网上就是让数据真正的分析,分析可以用开源,也可以用模型,像Saas这样的。还有像(英文)这种可以产生更高价值,但是最终对客户讲起来,他们看到的比如说是一个网络分析产品评论,或者说用户画像,还有库存优化等等,这才是真正作为一个企业的决策者可以享受到大数据给他们带来的真正的价值。

下面我会说一下联想在互联网+所做的一些尝试和我们做的一些工作。

第一,联想是一个传统的IT企业,我们的PC原来一直占我们大部分的销售量,在2014年的时候PC还占有80%的销售量。今年因为我们在手机和企业级业务的拓展之后,我们现在PC降到60%左右。但是尽管是这样,我们还是一个社会+服务的企业,我们卖PC、手机、模板等,我们同时也有一个企业部,整个完整的硬件+服务,在转型的过程中我们其实做了很多在互联网,在大数据方面的一些工作。第一我们要把和传统企业的一些企业系统进行连接,比如像SAP,因为这些数据对我们更好服务客户很重要。第二是要对非结构化的数据,包括比如说视频或者其他的数据的比对,还有智能硬件,像可穿戴设备,或者说移动互联网里面的一些数据,我们都要进行采集,都要进行自然、语言和视频方面的处理。

第二个联想另外要做的就是尽量聆听客户的声音,这个声音可能从微博来的,可能是从各种网站对联想电脑的反馈。比如联想发布的ZOK里面的Z1手机,短短半个月,预定达到了200万。前面进行众筹的一些客户已经拿到了第一批的手机,这些手机就会有很多对手机的反馈,我们就会对这些反馈进行实时的分析,哪些大家喜欢,哪些不喜欢。我们对所有联想在市场上的产品,在京东上的,在亚马逊上的,国内外的,都会对它进行整体的分享。而这些我们下面会做更多,这样我们会看到用户的主观的和客观的一些数据。我们对于产品的改进,对于更好服务客户都会有更大的价值。同时也对企业内部的质量控制有所帮助,比如有的时候如果客户对联想某一个产品的某一个方面产生疑问或者抱怨,我们会尽早发现这样的问题对他进行改变。包括供应商和供应链方面进行改变。

第三个就是跟踪业界最新的发展。所有我们提到的联想的平台级或者数据分析级都是利用了一些开源的社区,所以我们对hadoop等数据进行很好的跟踪,其实我们实验室和联想其他的业务部门对互联网,对云计算方面也有很多开源社区方面的加入和开源技术的应用。

第四个就是对大数据方面的应用,在联想硬件部门我们也进行了一体机或者整体方案的提供。因为我们最近购买了IBM的X86服务器,同时也带来了它的网络和存储方面的一些优势。所以对这方面的软硬件结合,或者(英文)加速,其实都做了跟多工作。同时我们对新型的处理器也会针对大数据方面进行更好的优化方面的工作。

最后联想还有服务部门,这个服务是一个企业级的服务,所以它会对一些企业对大数据方面的服务也会相应提供服务。

下面我会举一些例子,就是我们的联想研究院和联想业务部门所做的工作。第一个就是数据采集,因为每天在互联网方面发布的信息可以说是与日俱增,而且是以爆炸式的形式产生。第一步要做的就是怎么把数据采到企业里来,这需要自动化的方式采来,要利用各种方式进行处理。整个这一切是需要爬虫(音),爬虫可以说不是一个高科技的动作,但是要做好,做到完全的自动化,对它进行清洗等等就需要高科技的技术的改进。所以我们要对论坛,对微博,对搜索引擎,把这些数据都采集过来。刚开始我们要花大概几天的时间才能把一天采集的数据量处理好,后来通过各种各样的改进先已经是小时或者分钟级就可以把数据清洗好。如果你们发布一个对联想的什么评论,我们可能几分钟或者十几分钟之后我们联想相关的产品经理或者相关人员就可以看好。

另外对企业内部存在大批量的文本也会采集和分类,可以转换成某种意义的支持,而不仅仅是文本。

第二个就是自然元素,自然元素的应用场景就是对联想现在所存在的硬件设备在网上各种各样的评论,这个评论可能是存在在我刚才提到的微博和论坛上面,或者说在各个销售的网站上面的。这一切我们都会用积极学习的办法对它进行归类,在联想有几千个产品经理每天都在用这样的工具对他们现在的产品知道发生的问题。还有联想IT在全球有几十个网络数据中心,这里存在各种各样的IT网络等,我们也采集数据,然后分析产生价值。还有物联网、智能设备、智能硬件也有大数据平台支持。

应该讲大数据这个平台和方向应该是所有在做互联网+的企业都会碰到的问题,联想只是作为一个传统的IT厂商先走了一步,在这方面我们也做了尝试。在下面你们也看到联想的展台,这方面我们会有更多案例方面的介绍,所以大家如果有时间可以到下面跟相关技术人员进行沟通,我们也欢迎大家的指教,谢谢各位。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王源野)
共 1 页
分享到: 0

评论

全部评论我的评论

降龙十巴掌2015-08-26 11:52

这个文章内容丰富,影响深远