×关闭背景

航天专家张京男:大数据军民两用途径分析

2015-08-27 16:20:43      来源:移动LABS       作者:移动LABS

大数据

【摘要】【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。航天专家张京男分享大数据军民两用途径分析的话题。

【移动LABS】8月26—27日,2015中国国际大数据大会在北京召开,移动LABS作为大会战略合作媒体受邀现场直播。航天专家张京男分享大数据军民两用途径分析的话题。

航天专家 张京男

如下为速记全文:

大家好我首先介绍一下我是航第一集团研究院,就是中国运载技术研究院。我们研发中心是起一个孵化作用。今天做这PPT是有非常深的用意。不织布大家看到没有,就是这PPT的背景色彩,不知道谁看出来其中的用意。全面飘绿一点飘红,是不是跟今天的股市开盘形势有一点像。今天我同事买了一点,有没有套回来,不但没回来而且是深度套牢。

融合就是说民用技术来服务于国防事业。咱们民用技术包括信息技术肯定是其中的一部分,所以我也是希望通过研究工作吧,能够呼吁大家也为国防事业提供一些技术支持和方案的设计。我的内容主要三个方面,首先说美国大数据军民两用的情况。为什么说美国,因为美国确实发展的比较快,他们思维理念也比较先进也比较开放。从联邦政府国防部、航天航天局美国空军。第二部分对大数据的认识和反思。第三部分就是对开展大数据军民两用的项目吧去求一些突破口。

首先说美国的联邦政府2012年提出大数据的倡议计划是由白宫科技办公室提出来,它首先针对六个部门,国家科学基金、能源部、国防部、国防预先计划局还有地质勘察局。白宫是希望通过这些部门对大数据的研究,能够发挥社会积极效应,但是每一个部门的目标或者是宗旨不一样。首先是科学基金是提高工程核心算法,而国防部是提高从数据到决策的一个,当然决策是军事行动或者是作战方面的决策。能够让一些行业内的研究人员和科研机构进行研究,能源部就是进行先进计算科学发现,当然就是新能源的发现或者是新能源的勘察做出一些作用。勘察局地理信息系统的大数据的计算。

再者就是白宫,今年2月份发布了一个大数据白皮书,也是奥巴马主导这工作。对2014年整个政府、企业公民以及社会团体对大数据的看法以及应用作用总体形式做了一项研究。这个工作是90天完成的。这个图上是总统参赞还有商务部的部长、能源部的部长,还有经济委员会的主席,共同签发了白皮书。

还有一个大的举措就是白宫任命首席数据官,今年上半年任命第一数据官是CDO。他的作用是帮助美国进行大数据投资的决策,发挥更大的科技还有经济效益。这个人他的背景主要是之前在被网络还有EBAY的总裁执行官,就照片上这个人。

重点要提的国防部这一块,国防部那就是军用或者国防方面的。NSA国家安全局一个非常神秘的部门,但是如果说提到菱镜计划,小布什开发的底层架构根据全球领导人或者视频通话的监视,这个大家知道的。不幸的凌镜计划被美国中心局爱德华森斯洛登给实名举报,他的下场就是流放在国外。

我们看一下核心技术发展的过程,它的功能是处理海量非结构化数据,也就是说全球的数据监控。是07年开发之后由国家安全局捐赠给了阿帕奇公益机构,进行开元化,这代码开元化之后就收到美国IT企业商业应用,这方面开始应用。而军队现在开始重视,但还没有真正的应用起来。怎么说呢?这个底层代码是国家安全局来开发,只会实现开元、民用的应用。所以就说这个是典型的军民两用的过程。当然美国它的体制、机制是跟咱们不一样,所以咱们做这件事也是很容易。未来我们国家就是军民两用这一块,方向上肯定也是,大致的路子也是这样一个模式。

再提一下这个预先研究计划局,搞军事研究工作的人非常熟悉,一些先进技术还有一些武器装备前沿武器装备感觉非常科幻,在大数据处理方面,这9个项目的。

首先第一个是异常数据的一个判断,就是对网络上哪些数据提出来哪些是有异常能够分析出恐怖的活动。第二个是对军事内网的间谍活动,比如说泄露一些情报跟踪。还有一些对语音解读的开发。还有云平台的开发,倒数第二个是VIRAT大数据可视化。值得一提是XDATA这个项目是做对大量的半结构化数据进行计算还有,也是要实现可视化,并且要实现跟用户去交互的一个,主要是军方进行交互的这样一个功能。就是说这个大数据它分析出来的结果,能够时时的跟用户之间用来操作,用户跟自己的意图在进一步部署自己的居住力量和决策。这个项目有一个特点就是军用跟民用开发商都是可以开发的。

下面列自这个图就是它的项目招标书,这个招标书大家都能看得到,全球都能看得到这是一个公开的项目,那它服务的是一个国防的应用,大数据的一个应用。

美国第三方面的航空航天局,搞航天的人很了解。航空航天局是这样一个情况,一种就是升空航天器的传输比如说火星、木星、土星传授器。它是一个兆字节的数据量,也就是一个任务传输能力几兆这样的速度就可以完成任务了。另外一个就是近地轨道,大概几百公里或者是几千,甚至上万公里的这种航天器。它的一个任务的传输量需求是GB级的。但是这些传输基本上都是基于无线电,或者电磁波的这种传输方式来进行的。未来它要有激光的,激光传输数据的话,那它要求对数据传输量就是TB级的。也就是比GB级提升了上千倍。达到TB级传输之后,航天局的描述说已经很难去处理这么大容量的数据。所以他未来也要对大数据的能源进行开发和提升。首先是他现在在做或者是未来开发的方向主要就这四个,一个管理和处理数据。就是说外星的探测器或者活性探测器怎么传过来,通知这网络传到航空航天局对这数据的一个管理。这个存储和归档就说部了,因为它主要是一个数据衷心的。分析数据比如说它通过望远镜,观测宇宙星空的各个行星。最终是找出了一个,说是地球的孪生兄弟,跟地球差不多。也是最宜居的星球,它也是装了大数据的分析能力。

它主要用的工具还是有一个加(英文)超级计算机,底层的工具还有一个计算能力超强核心的代码也好,或者底层架构也好在支持它,但是这个还没有查到还不是很清楚,大概就是这个情况。它可能代码都是自己开发。另外就是可视化,可视化它主要也是一个利用超级计算机来实现的功能。它现在开设的全球的植被的情况。这个拍摄的图片信息量大概是3400亿像素,3000多亿相书,把全球的植被进行拍摄进行处理,处理的速度当然很快,还做什么用呢?在发送给全球的科研机构去通过这海的数据去研究。每个地区气侯的未来变化或者对气候的影响。

另外商业化云服务这一块也比较突出,他不光给政府做事还有民用飞机上面的飞行或者是到达。它存储了大量的数据。每个设备包括每一个探测的一些数据,收集之后分析飞机的安全是否有隐患、是否需要做哪些维修或者是更换零件,也是保证的飞机飞行的本身安全,以及飞行任务的全程的一个安全。这就是航空航天局在大数据方面做的一个事情。

最后提一下美国空军的情况,它的通过什么网来传输。这个研究军事的人非常清楚,它的所有的数据、探测数据搜集数据的终端都在这网络上来进行传输。这个图上大概看那个就是DGS—12345,有5个点,美国爱德保就是两个主架级左下角DGS—5夏威夷的主站,左上角就是韩国。最右边这个是在德国的一个主站。五个主站全球分布着各个分站,所有的空军信息在这个网络上传输,这些数据都是非结构化,因为卫星包括电磁是通信的嘛,还有红外信号。另外还有无人机的话包括IQ系列的。也就是最右边这个这三个飞机,他们拍摄或者是通讯也是有信息传输。都会到达这个主站,中间两个方的图就是针对阿富汗伊拉克地区的侦察。美国空军现在它的流程总得就是左边这个了。首先是计划和指挥,这个是军事的一个指挥关系,收集信息和情报。然后处理和挖掘,处理挖掘是大致的一个筛选。后面的分析语产品化,分析就是一个形成产品的过程,最后形成一个有价值的情报以后再进行细化,美国空军作战是这样一个流程。美国空军其实现在还没有国家情报局那个。但是也是对那个大数据的工具表示非常感兴趣。因为以后的空军作战的数据量非常大,现在主要是靠全球分布的很多情报人员的人工去搜集也好、去分析也好,还是急需要对大数据进行处理,有这样一个底层的架构去支持。这是空军的情况。

第二方面的话,就是对大数据的认识和理解。我举一个例子,我的意思这情况不属于大数据,什么情况呢?就是披萨店里打电话你好我给你做什么服务,客户说我做披萨,客服说你告诉我卡号,客服就开始说你住哪哪,首先住的地方信息不能泄露。根据您的医疗机构您的血压和胆固醇偏高不适合,这是客户的一俩信息被泄露。然后顾客说你没有推荐?客服说可以查一下低的披萨,因为你上个星期在图文馆翻译了。到最后这客户终于崩溃,所以我说大数据概念出来之后,就以这个大数据点也是不对,它的信息只是,这不是大数据这是大泄露。就是说别人知道你的信息某个信息点,然后告诉你怎么样做?这本身不是大数据的意思。所以我这就是提出一个观点,我怎么样杰士达数据,大数据本质不是大也不是数据,我不是说什么?我就说不是什么?然后是什么大家就可以想象。这大的多少容量,这KB、MB、GB、TB。多大是多大?大数据大的意思是什么B代表很大?有人说NB,比较牛。所以大数据这个大不是绝对数量大,但是只要这个数据满足于做一项分析工作,只要得出信息这个容量就已经够大,而不是说这个数据让机器承受不了,或者海量数据量不知道哪些是真哪些是假,或者怎么样。就是一个大的理解,不是数据的意思呢我开始就想大数据跟之前说的数据库有什么区别。因为数据库也是什么都有,看到这数据库之后我得出很多结论,包括游线电视液态说,统计人口说中国现在是多还是少,人口数据量偏少,所以我们就要放开计划生育放开二胎。这个本身并不是大数据的,它只是一个表面的现象。根据表面现象做出的一些动作或者判断还是比较浅,还是要挖掘它背后蕴藏的价值和意思。这是一个基本观点的阐述。

最后判断的话,军民用大数据主要有几个问题还没有解决。军用和民用都会面临的。现在大数据我们用它有两种目标吧,总的来说是两种目标一种作为研判的依据,就是说我通过大数据的判断,得出一个结论,而且根据这个结论去采取一种措施。

另外一种通过别的方式去得出结论,我通过大数据去辩论这种方式是完全不同。因为如果只是用验证手段的话,它本身科学性或者是本身的价值是值得商榷的一个状态。比如说以下三个方面,收集数据困难之前今天白天都说了很多。可能是很难收集到或者是数据准确性也不够这都是收集方面带来的困难。

另外数据说话,数据在那它本身代表什么,我们通过什么样的分布式的计算或者是什么样的一个系统去把它的数据价值给挖掘出来,这方面多分析我觉得也是很难取消的一个过程。我觉得分析还是最重要的一个环节。另外仅次于泄密的问题,非常需要权衡的。包括刚才说国家安全局的计划。那个计划当时也是被美国的民众强烈的反对,所以这个安全的问题、泄密问题未来还必须要面对。

最后说一下方向,最近的研究工作还是觉得在这智库机构或者是信息部门业务是一种突破口,信息部门当然也包括情报部门了。目前还是概念比较多,实际落实或者是实现还是有困难的,但是我们可以通过一些能够做的方向去试探吧,或者是尝试。先是国际决策的一个检测,包括政治、军事方面。比如说当前有一个美军伊拉克的军事形势的判断,就发现通过几千次的动乱的事件,就发现伊拉克、巴格达只要发生一些爆炸之后,在阿拉可都有极端分子的军事或者暴动,这个规律很明显之后,得出一个什么结论,极端分子在这地方做出暴动的时候,他会在巴格达制造一些动乱,把伊拉克政府军吸引过去,最后暴动就没有政府军的牵扯得出这样一个结论。所以以后在只要发生爆炸的时候,美国就会特别关注其他地方的情况。

另外一个情况还是美军,发现叙利亚,叙利亚这一块只要其他国家对叙利亚进行一些轰炸,或者是一些进攻的时候。叙利亚很多地方很多人都会被当地的政府逮捕。这两者之间本身有什么关系呢?看起来本身没有什么关系。但是通过全面分析之后,叙利亚人他政府方面不信任自己的民众,他以为国外对自己非常到位的打击是因为很多人泄露了他们的行踪或者是一些泄密的情况或是叛变的情况。

这种军事的动态或者是动向,以及政治的行为,我可以通过大量的数据去发现它未来的趋势。下面这个任务能力,包括它的军事演习或者是军事作战,当前军事作战方面还是以美国为主。通过他们的军事任务各方面的数据我们去分析美军的作战能力,以及它军队的部署能力,快速部署或者是这种作战的模式,工业判断能力就是通过它的一个生产部门的一些相关数据,以及国际军报的出口或者是进口全球的一个形成。来分析它那生产制造能力。以及它的国防工业的基础能力,这些是作为一些突破口。但是大数据本身还是面临着很多的困难。

声明:所有会议记录均为现场速记整理,未经演讲者审阅,本站刊登此文出于传递更多信息之目的,并不表示赞同其观点或证实其描述。

更多会议精彩内容请参见专题:http://labs.chinamobile.com/bigdata_2015

(责任编辑:王砾瑟)
共 1 页
分享到: 0

评论

全部评论我的评论

超人不会飞2015-08-27 16:25

这样的文章应该多转发。。。