㈠ 什么是云存储云存储的基本概念,工作原理是什么
云存储的概念与云计算类似,它是指通过集群应用、网格技术链团山或或衡分棚中布式文件系统等功能,网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,保证数据的安全性,并节约存储空间。简单来说,云存储就是将储存资源放到云上供人存取的一种新兴方案。使用者可以在任何时间、任何地方,透过任何可连网的装置连接到云上方便地存取数据。
㈡ 计算机网络系统与分布式计算机系统的主要区别
计算机网络系统与分布式计算机系统的主要区别:
计算机网络系统就是利用通信设备和线路将地理位置不同、功能独立的多个计算机系统互联起来,以功能完善的网络软件实现网络中资源共享和信息传递的系统。通过计算机的互联,实现计算机之间的通信,亩源从而实现计算机系统之间的信息、软件和设备资源的共享以及协同工作等功能,其本质特征在于提供计算机之间的各类资源的高度共享,实现便捷地交流信息和交换思想。
分布式此耐谈计算机系统是一种计算机硬件的配置方式和相应的功能配置方式。它是一种多处理器的计算机系统,各处理器通过互连网络构成统一的系统。系统采用分布式计算结构,即把原来系统内中央处理器处理的任务分散给相应的处理器,实现不同功能的各个处理器相互协调,共享系统的外设与软件。这样就加快了系统的处理速度,简化了主机的逻辑结构,特别适合于工业生产线自动控制和企事业单位的管森碰理,成本低,易于维护,成为计算机在应用领域发展的一个重要方向。
㈢ 什么是云存储云存储的基本概念,工作原理是什么
云储存的基本概念
云存储是云计算概念的延伸和发展,是一种新的网络存储技术,指的是通过应用集群、网络技术和分布式文件系统,网络中的各种不同类型的存储设备通过应用软件设置协同工作,提供了一种通用的外部访问数据存储和业务功能的系统。
云存储的工作原理:
云存储是云计算概念延伸和发展的一个新概念。云计算是分布式处理、并行处理和网格计算的发展,通过网络将庞大的计算处理程序自动分拆成无数的小程序,使一个庞大的系统由多个服务器的计算和分析的返回给用户的结果。通过云计算技术,网络服务商可以在几秒钟内,处理数以百万甚至数十亿的信息,实现和“超级电脑”一样强大的网络服务。云存储的概念和云计算是类似的,是指通过应用集群、网格技术和分布式文件系统的功能,各种不同类型的网络存储设备通过应用软件设置协同工作,提供了一种常见的外部访问数据存储和业务功能的系统,保证了数据的安全性,并节省存储空间。简单来说,一个新的云存储方案是将资源存储入云的人访问。用户可以随时、任何地点、任何设备都可以通过网络连接到云端,方便获取数据。如果这个解释还很难理解,那么可以利用广域网和互联网的结构来解释云存储。
㈣ 云存储架构分哪些层次,各自实现了什么功能
(1)存储层
云存储系统对外提供多种不同的存储服务,各种服务的数据统一存放在云存储系统中,形成一个海量数据池。从大多数网络服务后台数据组织方式来看,传统基于单服务器的数据组织难以满足广域网多用户条件下的吞吐性能和存储容量需求;基于P2P架构的数据组织需要庞大的节点数量和复杂编码算法保证数据可靠性。相比而言,基于多存储服务器的数据组织方法能够更好满足在线存储服务的应用需求,在用户规模较大时,构建分布式数据中心能够为不同地理区域的用户提供更好的服务质量。
云存储的存储层将不同类型的存储设备互连起来,实现海量数据的统一管理,同时实现对存储设备的集中管理、状态监控以及容量的动态扩展,实质是一种面向服务的分布式链此存储系统。
(2)基础管理层
云存储系统架构中的基础管理层为上层提供不同服务间公共管理的统一视图。通过设计统一的用户管理、安全管理、副本管理及策略管理等公共数据管理功能,将底层存储与上层应用无缝衔接起来,实现多存储设备之间的协同工作,以更好的性能对外提供多种服务。
(3)应用接口层
应用接口层是云存储平台中可以灵活扩展的、直接面向用户的部分。根据用户需求,可以开发出不同的应用接口,提供相应的服务。比如数据存储服务、空间租赁服务、公共资源服务、多用户数据共享服务、数据备份服务等。
(4)访问层
通过访问层,任何一个授权用户都可以在任何地方,使用一台联网的终端设备,按照标准的公用应用接口来登录云存储平台,享受云存储服务。
2云存储技术的优势
作为新兴的存储技术,银唤裂与传统的购买存储设备和部署存储软件相比,云存储方式存在以下优点:
(1)成本低、见效快
传统的购买存储设备或软件定制方式下,企业根据信息化管理的需求,一次性投入大量资金购置硬件设备、搭建平台。软件开发则经过漫长的可行性分析、需求调研、软件设计、编码、测试这一过程。往往在软件开发完成以后,业务需求发生变化,不得不对软件进行返工,不仅影响质量,提高成本,更是延误了企业信息化进程,同时造成了企业之间的低水平重复投资以及企业内部周期性、高成本的技术升级。在云存储方式下,企业除了配置必要的终端设备接收存储服务外,不需要投入额外的资金来搭建平台。企业只需按用户数分期租用服务,规避了一次性投资的风险,降低了使用成本,而且对于选定的服务,可以立即投入使用,既方便又快捷。
(2)易于管理
传统方式下,企业需要配备专业的IT人员进行系统的维护,由此带来技术和资金成本。云存储模式下,维护工作以及系统的更新升级都由云存储服务提供商完成,企业能够以最低的成本享受到最新最专业的服务。
(3)方式灵活
传统的购买和定制模式下,一旦完成资金的一次性投入,系统无法在后续使用中动态调整。随着设备的更新换代,落后的硬件平台难以处置;随着业务需求的不断变化,软件需要不断地更新升级甚至重构来与之相适应,导致维护成本高昂,很容易发展到不可控的程度。而云存储方式一般按照客户数、使用时间、服务项目进行收费。企业可以根据业务需求变化、人员增减、资金承受能力,随时调整其租用服务方式,真正做到“按需使用”。
3云存储技术趋势
随着宽带网络的发展,集群技术、网格技术锋闭和分布式文件系统的拓展,CDN内容分发、P2P、数据压缩技术的广泛运用,以及存储虚拟化技术的完善,云存储在技术上已经趋于成熟,以“用户创造内容”和“分享”为精神的Web2.0推动了全网域用户对在线服务的认知。
㈤ 分布式计算与网格计算一样吗
是一样的,下面是个人理解。。
网格这个名字更注重说明参与计算(让指执行任务)的是一个集群(一大批主机)弯咐,
而分布式就很直观的说明参与计算的计算主机是分散的,也可以说明一个项目是分成小块同时分散执行。
如果有志于分布式志愿服务,建议到equn.com了解一下,那里是国内坦闹配最大的志愿者论坛
㈥ 网格计算和云计算的概念和区别
网格计算和云计算都是利用网络资源进行计算的方式。
它们的主要区别如下:
1、概念不同
网格计算是分布式计算的一种,是一门计算机科学。它指的是把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终结果;
云高枝计算是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成陪念简无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。
2、侧重点不同
云计算侧重于IT资源的整合,整合后按需提供IT资源;
网格计算侧重于不同组织间计算能力的连接。
3、商业化性质不同
云计算依靠IT资源供给的灵活性,革新了IT产业的商芦裤业模式,是基础IT资源外包商业模式的典型运用;
网格计算是拥有计算能力的节点自发形成联盟,共同解决涉及大规模计算的问题,是基础IT资源联合共享模式的运用。
㈦ 磁盘阵列 和 分布式文件系统有什么区别
1、磁盘阵列(Rendant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的磁盘阵列”之意。原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。同时利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。
2、分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。例如,用户可以“发表”一个允许其他客户机访问的目录,一旦被访问,这个目录对客户机来说就象使用本地驱动器一样,下面是三个基本的分布式文件系统。使用分布式文件系统可以轻松定位和管理网络中的共享资源、使用统一的命名路径完成对所需资源院的访问、提供可靠的负载平衡、与FRS(文件复制服务)联合在多台服务器之间提供冗余、与windows权限集成以保证安全。
3、综上所述,磁盘阵列主要是以冗余备份来保障文件安全和快速访问,一般以本机不同磁盘或局域网内磁盘组成,而分布式文件系统将广泛分布在本机、局域网和广域网上各个不同物理存储空间的数据以一定逻辑形式组成的文件系统,提供的服务更多的是起到索引(指向)的作用,而又不必耗费很大的部署资岩咐源,顺应了云计算的发展方向。
简称RAID(Rendant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的
”之意。其原理是利用数组方式来作磁盘组,配
据分散排列的设计,提升数据的安全性。
主要针对硬盘,在容量及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上
是一个意思,通常称廉价磁盘冗余陈列RAID(RendanAr ray of Inexpensive Disk)
NFS server可以看作是一个FILE SERVER,它可以让你的PC通过网络将远端得NFS SERVER共享出来的档案MOUNT到自己的系统中,在CLIENT看来使用NFS的远端文件就象是在使用本地文件一样。 NFS协议从诞生到现在为止,已经有多个版本,如NFS V2(rfc1094),NFS V3(rfc1813)(最新的版本是V4(rfc3010)。 二、各NFS协议版本的主要区别 V3相对V2的主要区别: 1、文件尺寸 V2最大只支持32BIT的文件大小(4G),而NFS V3新增加了支持64BIT文件大小的技术。 2、文件传输尺寸 V3没有限定传输尺寸,V2最多只能设定为8k,可以使用-rsize and -wsize 来进行设定。 3、完整的信息返回 V3增加和完善了许多错误和成功信息的返回,对于服务器的设置和管理能带来很大好处。 4、增加了对TCP传输协议的支持 V2只提供了对UDP协议的支持,在一些高要求的网络环境中有很大限制,V3增加了对TCP协议的支持 *5、异步写入特性 6、改进了SERVER的mount性能 7、有更好的I/O WRITES 性能。 9、更强网络运行效能,使得网络运作更为有效。 10、更强的灾难恢复功能
磁盘阵列盒主要用于外部存储和备份用,如果你的主板不支持RAID可以通过阵列盒来实现,主要用于扩展。
如果主板支持RAID,弄两道3块硬盘自己做就可以了!
因为在主板上集成RAID芯片要比另外从外部设备上弄RAID芯片、框架、转换器等成本要低。
你好,我是做存储行业的,就我个人的理解说一下这两个概念吧,仅供参考。
首先要明确磁盘阵列的概念,磁盘阵列是一种存储介质,说白了它就是一个堆硬盘形成的一块大硬盘,通过做RAID实现并行读写并通过数据校验保证数据的正确性和安全性。
而存储系统是一个大概念,一个典型的存储系统会分为业务层、备份层、数据保护层和最终的归档层:
根据业务层的业务种类,决定了你所用到的存储类型,是使用基于文件系统的NAS存储,还是使用基于数据库块操作的磁盘阵列;接下来在备份层结合备份软件,将业务数据备份到磁盘阵列或磁带中;在数据保护层中,将用到一些数据保护技术,如数据压缩、数据加密、重复数据删除等等;最后数据归档层中,将数据归档到磁带中。
raid1追求安全不追求性能 只是个别的读取方面可能比单个盘性能要高 因为两个盘工作
raid0就是俩一起工作 读写性能容量都加倍 但是没安全措施
raid5就是raid0+raid1 又保证安全又保证性能
磁带机
磁带机(Tape Drive)一般指单驱动器产品,通常由磁带驱动器和磁带构成,是一种经济、可靠、容量大、速度快的备份设备。这种产品采用高纠错能力编码技术和写后即读通道技术,可以大大提高数据备份的可靠性。根据装带方式的不同,一般分为手动装带磁带机和自动装带磁带机,即自动加载磁带机。
自动加载磁带机实际上是将磁带和磁带机有机结合组成的。自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中拾取磁带并放入驱动器中,或执行相反的过程。它可以备份100GB-200GB或者更多的数据。自动加载磁带机能够支持例行备份过程,自动为每日的备份工作装载新的磁带。一个拥有工作组服务器的小公司可以使用自动加载磁带机来自动完成备份工作。
磁带库
磁带库是像自动加载磁带机一样的基于磁带的备份系统,它能够提供同样的基本自动备份和数据恢复功能,但同时具有更先进的技术特点。它的存储容量可达到数百PB(1pb=100万GB),可以实现连续备份、自动搜索磁带,也可以在驱动管理软件控制下实现智能恢复、实时监控和统计,整个数据存储备份过程完全摆脱了人工干涉。
磁盘阵列,简称盘阵,计算机行业使用的一种企业级存储系统。盘阵把多个磁盘组合成一个阵列,通过RAID和虚拟化等技术手段,作为一个单一的存储设备来使用。通过把数据分散在不同的物理磁盘中,盘阵可以减低数据的访问时间、提高访问速度;通过RAID等容错机制,它可以提高数据的安全性;另外,它还可以有效的利用磁盘空间。
要全面理解“磁盘阵列”,就还必须了解以下几个重要概念:
最大存储容量 是指磁盘阵列设备所能存储数据容量的极限,通俗的讲,就是磁盘阵列设备能够支持的最大硬盘数量乘以单个硬盘容量就是最大存储容量,其实这是个理论值。实际上这个数值还取决于所使用RAID(独立冗余磁盘整理)的级别,采用不同的RAID级别,有效的存储容量也就有所差别。通常,一般小型的磁盘阵列设备会支持几百GB的存储容量,适合中小型公司作为存储设备共享数据使用,而中高档的磁盘阵列设备应该支持T级别的容量(1TB = 1000GB)。
平均传输率 是指数据从磁盘阵列的硬盘里读出送到外部主机或其他地方的稳定速度,而不是突发速率,单位通常是Mb/s(兆位/秒)。这个数值取决于磁盘阵列所使用的外部主机通道和所用磁盘类型,通常使用SCSI硬盘作为阵列和FC(Fiber Channel)光纤主机通道的速率为最高,一般可达1000Mb/s以上。而采用IDE硬盘作为阵列的产品的速率就相对于较低,适合规模不大的用户群使用。
硬盘转速 是指硬盘内电机主轴的转动速度,单位是RPM(每分钟旋转次数)。其转速越高内部传输速率就越大。目前常见的IDE接口硬盘转速为5400RPM和7200RPM,而SCSI接口的硬盘的转速可达到10000RPM以上。如果是小型公司没有大量数据存储的话,用5400RPM或7200RPM的硬盘即可,而对于有大量数据要求的部门则最好选用高速SCSI硬盘,且具有热插拔的优点。
每台磁盘阵列设备都配备了一定数量的内存作为高速缓存使用,而且大多用户以后可以扩充。在磁盘阵列设备中,常见的内存类型由SDRAM(同步内存)、FLASH(闪存)等。不同的磁盘阵列产品出厂时配备的内存容量不同,一般为几十兆到数GB(1GB=1000MB)容量不等,这取决于磁盘阵列产品的应用范围,一般来讲,应用在小规模的局域网当中的磁盘阵列,如果只是应付几台设备的访问,64M以下内存容量即可。如果是上百个节点以上的访问,就得需要上G容量的内存。当然,这不是绝对的因素,磁盘阵列产品的综合性能发挥还取决于它的处理器能力、硬盘速度及其网络实际环境等因素的制约。总之,选购磁盘阵列产品时,应该综合考虑各个方面的性能参数。
MTBF,即平均无故障时间,英文全称是“Mean Time Beeen Failure”。是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于50000小时。
磁盘阵列作为数据的存储设备,供网络用户使用,那么就需要磁盘阵列提供接口,和服务器主机或其他网络设备相连接,这个接口我们把它叫做主机通道或外接主机通道。现在大多数外接主机通道为Ultra2 SCSI和Ultra3 SCSI,部分产品由于和SAN(存储区域网络)连接具有FC(Fiber Channel光纤通道)接口。
通常,磁盘阵列有单主机通道磁盘阵列和多主机通道磁盘阵列之别: 单主机通道磁盘阵列只能接一台主机,多主机通道磁盘阵列可接多个主机系统,并同时使用,有很大的灵活扩充能力,可以群集(Cluster)的方式共用磁盘阵列。且大多数的阵列都支持73GB、36GB和18GB的硬盘,也有部分的阵列可以支持180GB的硬盘,并支持热插拔,其可支持的RAID级别有0、1(0+1)、3和5等。
GIT最有名了
。。磁盘阵列原理是将硬盘数据按规则,同时写到两块或多块硬盘上保存(有RAID 0、1、5等模式),即相当硬盘并联同时协作工作,数据的读写速度相当叠加翻倍。这种模式下,每块硬盘中的数据都不是完整数据。双硬盘时,各自为独立工作状态,数据只保存在用户指定磁盘中,每次操作都是单一磁盘速度。
㈧ 比较集群技术,网格技术和分布式文件系统的异同
简单说,孝锋
分布式是以缩短单个任务的执行时间来提升效率的,
而集群则是通过提高单位时间内执行的任务数来提升效率。
例如:
如果一个任务由10个子任务组成,每个子任务链和单独执行需1小时,则在一台服务器上执行改任务需10小时。
采棚慎盯用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依赖关系,执行完这个任务只需一个小时。(这种工作模式的一个典型代表就是Hadoop的Map/Rece分布式计算模型)
而采用集群方案,同样提供10台服务器,每台服务器都能独立处理这个任务。假设有10个任务同时到达,10个服务器将同时工作,10小后,10个任务同时完成,这样,整身来看,还是1小时内完成一个任务!
㈨ 什么是网格,和网络有什么区别啊
分类: 电脑/网络 >> 互联网
解析:
网格
一.网格的产生
网格(Grid)这个词来自于电力网格(PowerGrid)。“网格”与“电力网格”形神相似。一方面,计算机网纵横交错,很像电力网;另一方面,电力网格用高压线路把分散在各地的发电站连接在一起,向用户提供源源不断的电力。用户只需插上插头、打开开关就能用电,一点都不需要关心电能是从哪个电站送来的,也不需要知道是水力电、火力电还是核能电。建设网格的目的也是一样,其最终目的是希望它能够把分布在因特网上数以亿计的计算机、存储器、贵重设备、数据库等结合起来,形成一个虚拟的、空前强大的超级计算机,满足不断增长的计算、存储需求,并使信息世界成为一个有机的整体。
电网和网格对照表
电网:当你用洗衣机洗衣服时,你则裂只关心衣服什么时候洗好。而不在乎洗衣机用的电是来源于水力发电,伏盯没火电厂还是核电。你只需要把插头插入插座就行了。
网格:当你在电脑前工作时,你唯一关心的是要做的事(比如一项计算,设计等等)无论电脑连上什么网路,你都可以得到所需的计算能力出储存容量。
电网:我们现在用电的基础建设是“电网“。就是利用输电站,电力站,变电所和电线等等,把许多不同种类的发电厂和你家联系起来。
网格:对于上述的基础建设就叫“网格“。就是把电脑,工作站,服务器等计算资源连起来,而且提供必要的使用机制。
电网:电网是显而易见的:你不必担心你所用的电力是从哪里或者如何产生的。
网格:网格也将成为显而易见:你不必担心你所使用的电脑程序和资料在那里,网格中间服务器都会把最适合的计算资源分配给你的工作。
电网:电网很普遍:电力到处都有。只要插上插座就能获得电力资源。
网格:网格也将很普遍:电脑,笔记本,或者是掌上电脑,手机,甚至是一般的家用电器都可以通过网格插口连 上网格。
电网:电网是公共设施:你只要付钱就可以用电。
网格:网格也试图想为广大民众服务:只要付钱,都可以享用网格无穷无尽的计算资源和储存能力
注:另一种说法是网格就像一个巨大的网,里面有很多格子.每个格子就是一个局域网格,每个节点就是一台计算机.这种说法可能起源于中国。
二.究竟什么是网格
网格是一种新兴的技术,正处在不断发展和变化当中。目前学术界和商业界围绕网格开展的研究有很多,其研究的内容和名称也不尽相同因而网格尚未有精确的定义和内容定位。比如国外媒体常用“下一代互联网”、“Inter2”、“下一代Web”等来称呼网格相关技术。但“下一代互联网(NGI)”和“Inter2”又是美国的两个具体科研项目的名字,它们与网格研究目标相交叉,研究内容和重点有很大不同。企业界用的名称也很多,有内容分发(Contents Delivery)、服务分发(Service Delivery)、电子服务(e-service)、实时企业计算(Real-Time Enterprise Computing,简称RTEC)、分布式计算Peer-to-Peer Computing(简称P2P)、Web服务(Web Services)等。中国科学院计算所所长李国杰院士认为,网格实际上是继传统互联网、Web之后的第三次浪潮,可以称之为第三代互联网应用。
网格是利用互联网把地理上广泛分布的各种资源(包括计算资源、存储资源、带宽资源、软件资源、数据资源、信息资源、知识资源等)连成一个逻辑整体,就像一台超级计算机一样,为用户提供一体化信息和应用服务(计算、存储、访问等),虚拟组织最终实现在这个虚拟环境下进行资源共享和协同工作,彻底消除资源“孤岛”,最充分的实现信息共享。
三.网格技术的特征及其体系结构
1.网格技术的特征
在介绍网格的特征之前,我们首先要解决一个重要的问题:网格是不是分布式系统?这个问题之所以必须回答,因为人们常常会问另一个相关的问题:"为什么我们需要网格?现在已经有很多系统(比如海关报关系统、飞机订票系统)实现了资源共享与协同工作。这些系统与网格有什么区别?"
对这个问题的缺纳简要回答是:网格是一种分布式系统,但网格不同于传统的分布式系统。IBM Global Service与EDS是在这个分布式领域最着名的公司。构建分布式系统有三种方法:即传统方法(我们称之为EDS方法)、分布自律系统(Autonomous Decentralized Systems, ADS)方法,网格(grid)方法。ADS通常用于工业控制系统中。网格方法与传统方法的区别见下表:
特征 传统分布式系统 网格
开放性 需求和技术有一定确定性、封闭性 开放技术、开放系统
通用性 专门领域、专有技术 通用技术
集中性 很可能是统一规划、集中控制 一般而言是自然进化、非集中控制
使用模式 常常是终端模式或C/S模式 服务模式为主
标准化 领域标准或行业标准 通用标准(+行业标准)
平台性 应用解决方案 平台或基础设施
通过以上对比,
1.资源共享,消除资源孤岛:网格能够提供资源共享,它能消除信息孤岛、实现应用程序的互连互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的连通。
2.协同工作:网格第二个特点是协同工作,很多网格结点可以共同处理一个项目
3.通用开放标准,非集中控制,非平凡服务质量:这是Ian Foster最近提出的网格检验标准。网格是基于国际的开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样。
4.动态功能,高度可扩展性:网格可以提供动态的服务,能够适应变化。同时网格并非限制性的,它实现了高度的可扩展性。
2.网格的体系特征
网格之所以能有以上所说的种种优势特征,是由网格的体系结构赋予它的。网格体系结构的主要功能是划分系统基本组件,指定组件的目的与功能,刻画组件之间的相互作用,整合各部分组件。科研工作者已经提出并实现了若干种合理的网格体系结构。下面介绍目前影响比较广泛的两个网格体系结构:网格计算协议体系结构(Grid Protocol Architecture,GPA)和计算经济网格体系结构(GRACE)模型。
OGSA(Open Grid Services Architecture)被称为是下一代的网格体系结构,它是在原来“五层沙漏结构”的基础上,结合最新的Web Service 技术提出来的。OGSA包括两大关键技术即网格技术和Web Service 技术。
随着网格计算研究的深入,人们越来越发现网格体系结构的重要。网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义和描述,网格各部分相互关系与集成方法的规定,网格有效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网格最核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能够使网格有效地发挥作用。
OGSA最突出的思想就是以“服务”为中心。在OGSA框架中,将一切都抽象为服务,包括计算机、程序、数据、仪器设备等。这种观念,有利于通过统一的标准接口来管理和使用网格。Web Service提供了一种基于服务的框架结构,但是,Web Service 面对的一般都是永久服务,而在网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行等。考虑到网格环境的具体特点,OGSA 在原来Web Service 服务概念的基础上,提出了“网格服务(Grid Service)”的概念,用于解决服务发现、动态服务创建、服务生命周期管理等与临时服务有关的问题。
基于网格服务的概念,OGSA 将整个网格看作是“网格服务”的 *** ,但是这个 *** 不是一成不变的,是可以扩展的,这反映了网格的动态特性。网格服务通过定义接口来完成不同的功能,服务数据是关于网格服务实例的信息,因此网格服务可以简单地表示为“网格服务=接口/行为+服务数据”。
在目前,网格服务提供的接口还比较有限,OGSA 还在不断的完善过程之中,下一步将考虑扩充管理、安全等等方面的内容。
3.网格协议体系结构
Ian Foster于2001年提出了网格计算协议体系结构,认为网格建设的核心是标准化的协议与服务,并与Inter网络协议进行类比(如图1)。该结构主要包括以下五个层次:
构造层(Fabric):控制局部的资源。由物理或逻辑实体组成,目的是为上层提供共享的资源。常用的物理资源包括计算资源、存储系统、目录、网络资源等;逻辑资源包括分布式文件系统、分布计算池、计算机群等。构造层组件的功能受高层需求影响,基本功能包括资源查询和资源管理的QoS保证。
连接层(Connectivity):支持便利安全的通信。该层定义了网格中安全通信与认证授权控制的核心协议。资源间的数据交换和授权认证、安全控制都在这一层控制实现。该层组件提供单点登录、代理委托、同本地安全策略的整合和基于用户的信任策略等功能。
资源层(Resource):共享单一资源。该层建立在连接层的通信和认证协议之上,满足安全会话、资源初始化、资源运行状况监测、资源使用状况统计等需求,通过调用构造层函数来访问和控制局部资源。
汇集层(Collective):协调各种资源。该层将资源层提交的受控资源汇集在一起,供虚拟组织的应用程序共享和调用。该层组件可以实现各种共享行为,包括目录服务、资源协同、资源监测诊断、数据复制、负荷控制、账户管理等功能。
应用层(Application):为网格上用户的应用程序层。应用层是在虚拟组织环境中存在的。应用程序通过各层的应用程序编程接口(API)调用相应的服务,再通过服务调动网格上的资源来完成任务。为便于网格应用程序的开发,需要构建支持网格计算的大型函数库。
四. 当今网格的运用
现在国内国外运用得最多的可能是在一些大型院校的计算网格(实现计算资源的共享。 什么是计算资源: 简单来说就是计算能力,CPU。 计算资源共享就是CPU计算的共享)。人们把一个集群(cluster, 也就是常说的机房,通常有几十台操作系统为Linux的计算机)的计算机连成一个局域型网格。这样就好像把这几十台电脑连成了一台超级计算机,计算能力当然大大提高了。这种局域计算网格主要运用于一些科研的研究。比如说生物科学。当生物科学的研究员需要高性能的计算资源来帮助他们分析试验的结果时,他们就把这些分析试验的程序提交(submit)给网格,网格通过计算再把结果返回给这些研究员。计算结果可能是一些图像(rendering)也可能是一些数据。这些计算如果在单一PC(Personal puter, 个人计算机)上运行的话,往往会花费几个月的时间,然而在网格中运行一,两天也就完成了。这就是网格技术最直观的优点之一。当然现在有一些大型主机(super-mainframe)也有很强的计算能力(比如常说的IBM deepblue,打败人类围棋大师Kasparov那位),但是这种主机太昂贵,而且配置(deploy)往往不方便,是名副其实的重量级(heavyweight)计算。SETI@Home (SETI@Home's,一个分布式计算的项目,通过互联网络上的计算机搜索地球外智慧讯息,网格在分布式计算的成功运用。 参见:equn/info/fd01)的网站指出,世界上最强大的计算机IBM 的 ASCI White,可以实现12万亿次的浮点运算,但是花费了1亿千万美元;然而SETI@HOME 只用了50万美元却实现了15万亿次浮点运算。
网格另外一个显着的运用可能就是虚拟组织(Virtual Organisations)。这种虚拟组织往往是针对与某一个特定的项目,或者是某一类特定研究人员。在这里面可以实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。比如说中国2008年奥运会开幕式研究组就可以运用网格组成一个虚拟组织。在这个虚拟组织里,任何成员不管在哪个地方都可以有权访问组织的共享资源(如 开幕式场地图纸,开幕式资金,开幕式节目单);而且可以和另一地方的虚拟组织成员进行交流。这个虚拟组织就像把所有奥运会开幕式的资源,信息,以及人员集中到了一个虚拟的空间,让人们集中精力研讨开幕式项目的问题,而不必考虑其他的问题。据个实例,由英国利兹大学,牛津大学,约克大学和谢菲尔德大学合作的DAME项目就是致力于研究和运用虚拟组织。DAME架构在这四个大学合建的白玫瑰网格White Rose Computational Grid (WRCG)上,运用于对飞机故障的快速检测和维修。