Literature
Home医学教育科教新闻

罗泽:于CNGI推进中国e-Science

来源:搜狐IT
摘要:12月18日-19日,第二届CNGI工程技术论坛暨移动互联网国际峰会在北京召开,会上,工信部副部长奚国华、中国移动副总裁沙跃家、中国工程院副院长邬贺铨、以及各大设备厂商、终端制造商、内容服务提供商等出席了会议并做了主题演讲。会上,中国科学院计算机网络信息中心罗泽做了主题演讲,其演讲的主题是“基于CNGI推进中国......

点击显示 收起

        12月18日-19日,第二届CNGI工程技术论坛暨移动互联网国际峰会在北京召开,会上,工信部副部长奚国华、中国移动副总裁沙跃家、中国工程院副院长邬贺铨、以及各大设备厂商、终端制造商、内容服务提供商等出席了会议并做了主题演讲。  



  会上,中国科学院计算机网络信息中心罗泽做了主题演讲,其演讲的主题是“基于CNGI推进中国e-Science”,以下为其演讲实录:



  罗泽:我从先面几个方面来介绍相关的内容,首先是科研的信息化,在一个是CNGI科研信息化的管理,我会着重介绍我们开展具体的案例,我们在国家自然保护区开展候鸟跟踪跟检测系统,最后我们谈一谈包括CNGI的一些工作。



  我们回顾信息科技发展的技术上十几40年代人类发明了第一代计算,60年代产生第一个计算机网络,80年代互联网全球化的发展一个趋势。90年代3W技术出现繁荣,到现在我们可以说这个事情已经被称作进入信息化的一个新的时代,从信息技术还有计算机技术发展,信息化是社会生产力发展的必然。社会经历农业,社会,工业社会又一次伟大的生产力的变革,我们常常说科学技术是第一生产力,科学技术这样一个发展。他可能会伴随甚至牵引社会生产力的进步。从人类技术革命历史看,每一次科学技术革命都会引起一个生产力突飞猛进,对人类社会发展向前迈出了很大一步。第一次工业革命当时以蒸汽机发明和应用引发和手工业向工业化社产一个革命,解放了人类体能的束缚。到19时机下半叶20世纪初,电的发明还有电机,电气化应用,引导人类社会进入一个电气化时代,产生一个生产力的飞跃。第三次技术革命从上事迹中期开始,显著特点就是科学革命和技术革命融为一体,这里面一个特点就是信息通信技术飞跃发展,是这个时期一个典型一个特征,并且取得了一些非常显著的成效。科学技术对生产力有一些牵引和引导的作用,反过来社会生产力变革,也会影响当时这样一个时代,科学技术研究的一些方法和手段。这种生产力的变革反过来也会影响科学技术的手段和方法,也会引起这样一个变革。我们从传统来,科学研究主要是三种手段,第一就是观察自然现象。包括现在像我们有很多的野外台,天文台观测站,自然观察发现一些新的现象和知识。第二比较传统方式就是理论科学,我们知道像爱因斯坦相对论提出很大程度就是理论一些推导工作,产生出一个新的科学成果。再一个方面就是科研的一种手段,就是比如说一些实验科学、化学物理,很大成果产出是靠实验科学来实现的。



  随着信息技术发展,从上个世纪中叶开始计算机还有通信技术发展以来,现在的一种说法就是说我们这个计算科学也相当于是提供了一种新的科研方法和模式。你比如说现在很多的一些学科,它靠这种观察发现和理论科学和实验科学很难去开展,比如说像核爆炸一些模拟,地震仿真,这样一些新的科学都是基于一个高性能计算科学来开展。所以现在传统的三个科学研究的方法基础上,信息、通信技术的发展也为我们这种科学研究提供了一些新的手段和方法。而且它的作用会越来越明显,这个作用可能是对科学研究一种发展的一种革命。它的意义跟人们发明了显微镜打开了微观世界大门,发明望远镜打开宏观世界的大门一样,这种革命对科学研究的意义是比较深远。



  那么我们讲一下什么叫e-Science,这个词最初是由英国的科学技术研究理事会主任约翰·泰勒1999年提出来的。当时他提概念是e-Science重要科学领域全球科研合作,以及使合作成为可能下一代基础设施,我们从比如说稍微比较抽象一点,从比较这种大众化从维基百科e-Science翻译过来比较具体表述是指被用来描述在过渡分布式网络环境面,开展一方面计算密集型的科学,或者是说这种使用大量海量数据进行数据密集型网格计算科学,包括支持科学协作的一些方法技术cyberinfrastructure。在美国的话,美国一般不提e-Science,在美国和它等等是美国科学基金会,高级委员会在03年的时候最初提出来。从维基百科里面找出来翻译一下,描述是互联网支持先进的数据获取,存储,数据管理,集成数据完全可视化以及其他的计算和信息处理的服务的新型的技术。



  我们在国内提e-Science翻译成科研信息化,也就是科学研究的信息化,那么把它理解为前面提到一种科学研究方法和手段一种创新,把它可以看作是现在一个科研生境的重构。重要特点是数据密集型,还有数据驱动的特点,还有理论,观察实验仿真模式。还有一个虚拟组织,就是说现在网格领域做比较多,是和我们实体组织比喻像科学院我们研究所是一些实体。但是现在这样一个学科的发展的话,现在的趋势是向跨学科、跨地域甚至是跨国界学术的一些交流和合作。那么就是说可能产生的一个科学问题,是涉及到很多学科领域。比如说我们讲青海湖开展工作,涉及很多研究所,是这些研究对科学问题感兴趣的人共同组成一个团体,他们共同完成他们感兴趣的话题,这样一个组织叫做一个虚拟组织。这样的虚拟组织来他们研究目标,这样一个结果虚拟组织要求它的是一个开放和共享集成的平台,就是打破这种传统一些比如说管理上还有机制上一些障碍。



  这块介绍一下现在科学研究一些特点,跟我们后面网络是息息相关,随着这种信息技术还有通信技术的发展。科学研究本身随着生产力发展的驱使下,很多的科学研究他们产生的或者说使用数据是爆炸性增长。比如说举一个例子,第一个科学仪器,现在我们知道像国家现在我们包括科学院,都有一些大科学工程。你比如说像天文望远镜,天文望远镜和传统望远镜不一样的地方,不是说我科学家观察天文就是看一个星,现在是利用一个它的所谓行天,相当于是把他能观测到天空不同视角扫描一段把不同数据马上存储起来,形成一个虚拟天空。把这些数据传到世界的天文学家,还有比较有名的我们在高能物理领域是这种数据爆炸,比较有特色,现在国际比较有名的大型强子对撞机,产生数据量也是海量,包括像我们在生物信息学领域里面用到更是产生一些数据洪流,数据雪崩的情况,科学仪本生产生的数据就是海量的。还有从数据采集这样一个角度讲,比如说像章一些传感器这样一些产生这样一些海量数据。



  另外一个方面就是说我们科学研究很大程度上,很多情况变成一种数据密集型一些科研活动。现在从科学研究过程,我们有时候可以抽象为一个从数据从它产生到存储管理一个生命周期。比如说我科学家开展科学研究,我最初产生一个科学问题,我有一个想法要做某方面研究,最早就是根据它的想法,他要发觉数据,去找数据,之前有没有人做相关工作。找到相关工作基础上再进行相应一些数据处理和分析,可能还有一些数据可视化,产生这样一些结果是他一些新的发现和新的知识,反过来又是根据形式存储到存储系统里面来,这样就形成了一个数据生命周期。



  这块介绍我们科学院e-Science总体考虑和框架,我们把叫做是科学院e-Science一个汉堡包。它主要有三个层次,从低下往上信息化基础设施,一些信息化的基础设施就是包括主要是指一些公共这样一些基础设施,像计算、数据库、图书馆,我们看到网络在我们的整个架构里面属于核心中的核心,是我们整个框架的一个核心。在它的上面是一些比如说结合特定科研应用,需要不同的一些科研设备和资源。在顶层就是一些应用示范,像中间有一些软件系统和中间件系统,对这样一些资源进行集成。根据我们科学研究需要,能够从集成根据科研  需要,集成低层从公共基础设施到一些特定基础设施完成e-Science的工作。



  这块我是以高能物理我们在e-Science环境下的研究做一个例子,比如说我们在高能物理方面我们科学院的高能物理所在,这个图上画是它的BS3我们国家自己建对撞机,我们还包括在西藏,羊八井在全世界来讲是比较得天独厚观测站。不管什么数据每天产生大量数据资源,比如说羊八井,现在每年产生200TB数据,在西藏那边产生。我们需要把这些数据通过网络把它传会北京高能所和网络中心,通过网络要进行一些数据同步,进行一些计算处理和仿真,还要可能因为这个羊八井科研合作涉及到意大利和日本,应用于国家沟通协同



  第二方面例子我们野外考察方面的工作,我们知道野外考察科考活动是科学研究获取原始数据一个非常重要一个方法和手段。现在随着信息技术还有计算机本身的发展,这些科学考察的野外考察,像后面我可能在青海湖项目里面会讲到。很多这样一些采集样本终端也已经数字化,也希望做到一个网络化,比如说移动科研环境。首先就是要能够数字化和网络化,它提出一个需求是什么?比如说我们有野外考察我们能不能很快速,因为科学家他可能不一定是计算机IT领域这样一些科学家,我们能不能以一种很方便快捷的方式。一方面我们几个人在野外几个人很快搭建这样一个小型网络,包括手持设备很容易接入这样一个网络里面。再一个方面包括像我们今天主题,这些方面野外考察,这些设备一方面是自己组织一个小的网络。再一方面这个网络怎么接入远程、高速、稳定的方式接入到远程网络里面这些走势是一些新需求。另外一个方面是比较独特一个需求,科学院有很多野外台站,我们科学院地理所在做全国的这样一个碳量分析,他们在全国布二氧化碳传感器数据和采集,但是他们提出一个要求想时时通过传感器获得这个传感器获得的采集到这样一些数据,现在怎么讲,实现起来还是有一些难度。比如说根据各个地方基础设施不一样,比如说有在西藏的有一个,那个地方网络基本没有,然后只能靠人,他把数据暂时存到传感器这个地方,这个人一个月过去取一下。还有一些定是在山上,给网络一个是铺设,网络的建设也带来一定难度。但是从无线使用上,现在觉得带宽像CDMA这样一些方式在带宽还不能满足需求。再一个现在这种科研活动特别是野外科研活动有一个强烈需求就是要在现场,我们希望在这种野外考察的时候可以通过网络访问一些,有些访问这种网络上可以访问资源。比如说像现在有很多这样一些数据图书馆,标本馆,可以去采集一些东西。



  前面大概介绍一下,下面是CNGI和科研信息化,首先是我们提到,比如说像网络面临一些新的挑战,比如说像延伸到科研现场,这块刚才大概也解释过了。



  第二方面就是这种带宽一些需求,对后面我还会谈到就是我们对网络的一些需求,里面包括像带宽,还有突发性。那么CNGI现在已经成为我们科学科研信息化一个重要基础设施,已经连接到科学院像超级计算中心还有数据中心,成为科学院重要基础部分。科学院参加建设CNGI7个核心节点,今年完成像主力网建设,有65个是我们科学院研究所和重点实验室,院外包括35所院外研究所,想说是基于CNGI这样一个平台,它对中国科研信息化e-Science的推进。它同时有是有助于CNGI产业化和产品化,这是科学院和网通联合建设CNGI主要节点,分布全国东西南北都有7个节点。



  这是我们基于网络构建一个重要应用,是我们今年在十月份,和国外几个网络比如说像荷兰还有其他几个国外网络一起联合开展VLBI,其实它主要意义是各地是天文台天文领域的应用。它的目标是希望通过网络把这些全世界分布各地天文台,比如说望远镜连接起来,可以从观测角度讲可以获得从把这些所有的望远镜相当于合成一台,这个是单独一体望远镜没有办法达到的。今天我们和这些国家进行了一个测试取得了一个比较好的结果。



  我们作青海湖开展一个候鸟跟踪检测系统,简单罗列科学院开e-Science应用包括地震预测。回到青海湖项目,我刚才讲到是我们科学院很多研究所,包括搞生态,搞遥感,搞微生物的,搞病毒很多研究所对一个科学问题感到比较感兴趣。那么就开始形成这样一个虚拟组织,一起开展这样一个科学研究,当时最初吸引大家走到一块这样一个科学问题就是说大家知道在05年的时候,在青海湖,发生了一起大规模野生候鸟的流感事件,当时在青海湖死6000多只野鸟,是全世界首次这种野鸟这种禽流感大规模爆发。当时提出一个科学问题,野生候鸟是迁徙,和普通家禽的禽流感传播有没有什么关系?所以当时想做这样一个研究工做。这块想让大家看一下青海湖,青海湖是我们中国最大一个内陆盐水湖,是国际重要湿地,有丰富的生态资源,特别是鸟类资源,它处在全球候鸟迁徙路线是处于重要中转站上,是我们国家八大鸟类保护区之一。在这个青海湖项目里面,我们青海湖主要研究是像生态还有定位,还有一些比如说e-Science环境构建这样一些工作。



  这里面跟网络接触比较多是直接相关主要是包括红色展示相关的三个方面。首先是网络检测系推,这是青海湖一个小岛,人和东西很难达到,可以说是鸟类的天堂。我们选这个地方假设这样一个监控系统,主要是这样一个考虑,一方面对一些鸟这样一些科学家一些行为的检测,再一个方面就是如果是说因为人很难去,如果鸟发生禽流感我们可以很快采取措施。这个地方条件很艰苦,没有淡水和电,什么都没有,然后地理环境很恶劣。我们在三块部署了几个点,在青海湖在鸟类核心区,部署了几个点。这个里面可以看到我们部署一些系统,这个是青海湖一个地图,因为没有电,所以要用一个太阳能系统,网络在居于网络,我们通过无线局域网构建从三块石,中转点。我们是用这样一个微波做传递,这个是一个网络视频图,这块是我们系统的情况。这有一些图,我们建整个一个系统之后,青海湖管理局可以在他们办公室实时检测我们布点的情况,我们监控系统软件环境进行了一些改造和提升工作。基于这样一个网络的这样一个监控的话,开展了相关一些研究活动,比如说像右边是我们有两个探头是红外可以观测鸟在夜间的行为。



  第二是我们用GPS做候鸟迁徙路线的研究,这边看到一个很小设备,可以把它绑到大的鸟上,然后这个GPS设备它会接收到鸟位置信息,一方面它会把位置信息传递给我们,每两个小时传递一次,这样我们可以掌握这个鸟在青海湖附近迁徙一个行为和路线。这个设备是国外,国内也有人考虑做这样一个系统,包括利用移动网络,现在还是在考虑和设计阶段,可操作性可能还是有一些问题。然后就是说比如说这就是刚才说到数据,它接受卫星数据以后,小设备会把这个数据传送给卫星,通过卫星中转到地面接收站,最终传递给科学家。这块也有相应的数据,这些数据最初来的时候是这样是很看出来,我们进行的一些处理,然后科学家可以很方便进行处理,而且利用了一些地理信息系统,可以很方便看到这样一个鸟的一些迁徙的行为,由此引入很多新的一些科学问题。



  第三就是野外数据一个采集系统,这个系统方便科学家在野外进行数据采集工作。这里面因为现在我们只能采取办法把这些采集数据先存到PDA或者存储卡,回到实验室在导到实验室里面,未来我们无所不在网络能够支持对我们工作效率提升是很明显的。



  最后一部分就是我们有一些思考和建议,首先就是科研活动的网络化是很明显,已经成为网络科研一种必须的设施,它已经从最初帮助一些科研人员交流,像电子邮件,文献,发展成为本身科研活动本身一部分,比如说很多的数据传输。然后对带宽左边把用户分成三种类型,A类型就是家庭用户,这个图是就横轴表示带宽,纵轴表示用户数,用户量很大,但是带宽需求不高。企业用户他们用户数比家庭用户少,但是带宽比家庭用户带宽综合要高。C类我们科研应用就是典型科研应用,用户数很少,但是对带宽需求是很高的,在外国带宽增长非常快。再一个方面我们需要把这种网络带宽服务尽可能扩展到偏远的地方。再一个方面可能就是一些可靠性,要求低延迟,最后提供端对端,因为有一些科研应用有这样特殊的需求。还有野外的网络,这就是美国ESNET到2009到1010达到40到50G的带宽。



  最后就是也感谢CNGI这样一个建设推动中国e-Science的发展,并且我们觉得它对中国e-Science进一步发展提供支持和推动力,反过来对产业化的应用也是有帮助的。谢谢我的报告就结束了。



  谢谢大家。
作者:
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具