摘 要 该文主要介绍国内外一些有代表性的网格研究计划的开发进展和网格计算的起源及发展,探讨了网格技术的未来发展方向。
关键词 网格 网格计算 服务网格;
1 引 言
网络技术是一次计算革命,有可能将全球计算机联合起来协同工作,被人们视为21世纪的新型网络基础架构。网格的概念来源于电力网格,如电力网把强大的电力输送到每家每户的每个插座,用户不必过问电是水电、火电,还是核电,也不必过问电站位于何方。网格技术可把分布在各地的计算机联网,将充足的计算资源分配给每个用户,如同个人使用一台虚拟的超级计算机一样。但网格不是万能技术,不是所有问题都能解决,只有那些能并行运算的应用才可能被拆成若干细小任务分配到每个网格计算节点,通过并行处理来提高计算速度。
网格研究源于美国联邦政府过去10年来资助的高性能计算项目。这类研究使用的名词就是“网格”或“计算网格”。这类研究的目标是将跨地域的多台高性能计算机、大型数据库、贵重科研设备、通信设备、可视化设备和各种传感器整合成一个巨大的超级计算机系统,支持科学计算和科学研究。
2 国外网格技术研究动向
2.1 美国的网格技术研究
美国是网格研究起步最早的国家,美国多家研究机构开展了与网格相关的研究工作,制定了很多网格研究计划,如美国国家科学基金会资助的TeraGrid、美国国防部的“全球信息网格”(GIG)、美国政府资助的“大型物理实验网格”(GriPhyN)及美国能源部的ASCIGrid、国家技术网格(NTG)等计划。
(1)TeraGrid
美国国家科学基金会TeraGrid计划是一个需要多年分段实施的,为开放式科学研究而建立和使用的世界上最大、最全面的分布式基础设施。目前,TeraGrid已能提供40TFLOPS的聚合计算及近4千万亿字节的网络数据存储能力,并建成了能融合许多系统结构的网络环境,可通过Globus Toolkit支持基于网格的计算,提供诸如基于证书的单个注册和分布应用管理、TeraGrid资源恢复、对用户软件结构的持续监控和TeraGrid的协同能力等。
(2)全球信息网格(GIG)
GIG是美国国防部(DOD)于20世纪90年代末提出并开始建设的一种集成的信息基础设施,由一套全球互联的端对端信息系统、相关程序和人员组成,它可将美军在全球范围内的计算机网、传感器网和武器平台网联为一体,预计在2020年完成。从系统组成上看,GIG将系统分为基础、通信、计算、全球应用和使用人员五个层次。从技术体制上看,GIG包括了多种专用或租借的通信计算机系统和设备、各种软件和数据、安全服务设备,以及有助于谋求信息优势的其他相关技术。
(3)大型物理实验网格(GriPhyN)
GriPhyN是由实验物理学家和IT研究人员共同发起的,其目标是为21世纪的数据密集型科学构建第一台千万亿次计算系统 。GriPhyN计划将通过一个名为“千万亿级的虚拟数据网格(PVDG)”的计算环境来满足全球各地成千上万的科学家们的数据密集型计算需求。GriPhyN合作组织计划实行必要的计算机科学研究,最终形成一系列产品型的数据网格。
2.2 欧洲的网格技术研究
欧洲近来启动了一系列网格开发计划,其中包括DataGrid、SIMDAT、NextGRID、AkoGriMo和CoreGRID等计划”。这些项目的情况如下:
(1)DataGrid计划
欧洲数据网格计划(DataGrid)涉及到欧盟的二十几个国家,其目的是开发一种能支持全球性分布科学探索的全新环境。该计划旨在设计并开发中间件解决方案和可扩展的测试床,以便于处理千万亿字节的分布式数据、成千上万的资源(如处理器、磁盘等)以及大量同步用户的请求。该计划的重点是高能物理学、地球科学和生物信息科学等科学应用领域。
(2)SIMDAT计划
SIMDAT是欧洲的一个大型网格研究计划。该计划的目标是利用数据中心的网格技术来开发解决工业复杂问题的方案。主要用于国际经济的四个重要领域:汽车制造、制药、太空研究和气象研究。该项目的7个网格技术开发领域包括(除了一般的网格结构):分布式数据访问、VO管理、工作流、实体论、分析服务和知识服务。
(3)NextGRID计划
NextGRID是面向工商业领域建立的下一代网格服务结构。该计划针对的是广泛的应用领域:法律部门的数据挖掘;广播和娱乐;金融模型;数字媒体和供应链管理。研究和开发领域包括:网格结构、核心服务以及动态联合体和网格商业模型。
(4)AkoGriMo计划
AkoGriMo注重为动态虚拟组织提供传输移动通信的网格结构和服务。
包括两个测试床:E—Learning和Hospital。该计划在下一代网格使用的分层方法有:域和应用专门服务、复杂的网格服务、核心网格服务、网络中间件和移动互连网。该技术在下一代Ipv6网络基础上建立下一代网格,并支持操作系统的安全性、账目管理己账和用户。
(5)CoreGRID计划
核心网格是一个研究网络,主要用于大规模分布式网格和对等技术的基础建设、软件基础设施和应用。主要研究包括从知识,数据管理到问题解决环境的各种情况,有42个组织参加。在欧洲开展网格技术研究最积极的是英国、荷兰、意大利与德国。研制“英国国家网格”。
2.3 日本的网格技术研究
日本认为网格计算技术将极大地改变日本的产业结构,成为激活经济的原动力。目前,日本主要在进行国家研究网格计划(NAREGI)和生物网格计划(BioGrid)的研究。
(1)NAREGI计划
日本文部科学省推出的“激活经济研究开发计划”。目标是使最高运算速度达到100TFLOPS 。并预定从2008年开始在产业界加以应用。包括了一个从2003年开始的五年规划:2005年为中间评估阶段,2006年度开始实施面向实际应用的强化研究,2007年为实证试验时期,2008年进入实用化阶段。五年计划的研究内容可分为三个部分:进行网格应用开发的“系统实证研究开发”、进行网格中间件开发的“网格研究开发”,以及进行运用技术开发的“基础研究”。其中,系统实证研究主要进行有关纳米级分子、电子模拟的应用开发,并计划将NAREGI开发的应用程序和中间件用于分子电子学和生物分子元件领域;网格研究则主要是想充分利用现有的成品软件,开发出新的工具和中间件;而基础研究则主要侧重于网络通信基础技术和应用技术的研究。
(2)生物网格计划(BioGrid)
生物网格计划是在2002年启动的一项为期五年的网格研究计划,主要由日本文部科学省资助。计划利用网格计算技术与超高速网络,将各大学生物工程研究机构所拥有的超级计算机、数据库、高性能观测设备等研究资源联合起来。生物网格计划主要由五个部分组成:
· 网格基础技术组:主要进行安全、高性能的网格技术开发;
· 数据联机分析组:使Spring一8及超高压电子显微镜等高性能分析设备的连接成为可能,并实现分析数据的共享;
·计算网格技术组:研究开发蛋白质结构预测及各种生物模拟技术;
·数据网格组:主要任务是各种生物数据库相关技术的研发;
·商业开发组:以各项开发技术为桥梁,开发超大型网格计算机,它比现在世界上运算速度最快的计算机还快数倍,将达每秒300万亿次。
3 中国网格技术研究动向
我国同世界其他各国政府一样,为大幅度提高我国的综合国力和国际竞争能力,对于网格的建设也十分关注,同时在网格计算方面做了大量基础性和前瞻性研究工作。并在863专项中提出了具体的目标。专项确立了“战略与系统综合研究”、“高性能计算机”、“网格结点”、“网格软件”和“应用网格”五个方面的课题。主要任务是研制面向网格的每秒万亿次级高性能计算机和具有每秒数万亿次聚合计算能力的高性能计算环境;开发具有自主知识产权的网格软件;建设科学研究、经济建设、社会发展和国防建设急需的重要应用
网格;形成若干网格技术的国家标准,参与制定国际标准。
目前,我国已开展了“中国国家网格”、“教育科研网格”、“织女星网格”和“先进计算基础设施北京、上海试点工程”等五大网格项目的研究。参与研究的主要有中科院计算所、清华大学、联想集团、江南计算所等几家在高性能计算方面有较强实力的研究单位。
(1)中国国家网格(China National Grid)
“中国国家网格”是国家级高性能计算和信息服务的战略性基础设施,它将在全国范围内为各行业和社会大众提供各种一体化的高性能计算环境和信息服务。专项于2002年4月启动,投资高达3亿人民币,目标是提供高性能计算、资源共享、协同工作的能力,同时在科学研究、环境资源、制造业、服务业中建设若干大型行业应用网格;并研制面向网格计算,具有良好的应用开发环境的高性能计算机,装备网格结点,促进我国高性能计算机的研究和产业化。
(2)“教育科研网格”(China Grid)
教育部依托教育与科研网CERNET和高校的大量计算资源和信息资源,推出了ChinaGrid计划。ChinaGrid包括开发相应的网格软件,配合网络计算机(NC)的使用,将分布在教育与科研网格上自治的分布异构的海量信息资源集成起来,建立聚合能力超过每秒15万亿次量级的教育科研网格,总存储容量超过260TB,结点覆盖21 1建设的100所部属高等院校,实现CERNET环境下资源的有效共享,消除信息孤岛, ChinaGrid第一期规划:在2002年~2005年期间,一是建立12个计算网格的主结点,提供具有高性能计算、资源共享、协同工作的服务平台。每个主结点将建立一个聚合计算能力超过每秒5000亿次、存储能力分别达到5TB的超级计算结点,并通过相应的计算网格软件将分布在12个主结点的高性能计算机连接起来,使整个ChinaGrid的聚合峰值计算能力超过每秒6万亿次,存储能力超过60TB。
(3)“织女星网格”(Vega Grid)“织女星网格”是由中科院计算所联合国内十几家科研单位,共同承担的“863”重点项目。该项目的目标 是:把我国的8个高性能计算中心通过Internet连接起来,进行统一的资源管理、信息管理和用户管理,并在此基础上开发出多个需要高性能计算能力的网格应用系统。它是我国的第一个网格雏形。目前,该项目已取得了一系列研究成果。包括研制出了运算速度达每秒4万亿次以上,主要用作“中国国家网格”的主机、网格应用路由器和“织女星”网格操作系统等 。“织女星网格”主要研究内容如下:
在网格硬件层面,主要工作是研究下一代曙光高性能计算机,它们将是面向网格的超级服务器;
在网格系统软件层面,主要工作是研究开发一个名为GCP的网格计算协议栈(GridComputing Protocol Stack)以及有效支持GCP的“织女星”网格操作系统(Vega GOS);
在网格应用层面,主要研究的是信息网格和知识网格,以及科学计算类应用网格。 “织女星网格”在尽量使用国际上已有的先进技术的同时,它最大特点就是提出了“服务网格”的概念。
4 结束语
网格计算技术是一个正在迅猛发展的新兴学科。从生物领域的后基因组计划,到高能物理领域更深层次物质结构的研究,再到哈勃望远镜所获取的大量宇宙数据的处理,再到气象、地震预报预测这些重大科学领域的计算问题,促使科学家必须利用分布在世界各地的计算机资源,通过高速网络连接起来,共同完成计算问题,这正是网格计算快速发展的源动力。可以说网格是未来信息技术和产业发展的大趋势,它将极大地改变我们的生活和工作。未来的网格计算主要有三大发展趋势:即标准化、大型化和技术融合化。也就是说,网格计算将在行业应用的引导下,以标准化向更广域、多学科渗透,网格的一切对外功能都将以网格服务来体现,技术将进一步融合,且将逐渐从高性能计算走向商业应用,从前沿技术走向实用化、大众化。可以预见,今后网格计算技术仍将快速发展,从而开创计算科学的一个新纪元。
参 考 文 献
【1】许文韬.网格技术综述[J].微型电脑应用,2002.(18):62— 64
【2】都志辉,陈渝,刘鹏.网格计算[M].北京:清华大学出版社.2002
【3】 孙培德.网格计算的研究新进展[J].计算机工程与应用,2003,(16)