㈠ 什麼是雲存儲雲存儲的基本概念,工作原理是什麼
雲存儲的概念與雲計算類似,它是指通過集群應用、網格技術鏈團山或或衡分棚中布式文件系統等功能,網路中大量各種不同類型的存儲設備通過應用軟體集合起來協同工作,共同對外提供數據存儲和業務訪問功能的一個系統,保證數據的安全性,並節約存儲空間。簡單來說,雲存儲就是將儲存資源放到雲上供人存取的一種新興方案。使用者可以在任何時間、任何地方,透過任何可連網的裝置連接到雲上方便地存取數據。
㈡ 計算機網路系統與分布式計算機系統的主要區別
計算機網路系統與分布式計算機系統的主要區別:
計算機網路系統就是利用通信設備和線路將地理位置不同、功能獨立的多個計算機系統互聯起來,以功能完善的網路軟體實現網路中資源共享和信息傳遞的系統。通過計算機的互聯,實現計算機之間的通信,畝源從而實現計算機系統之間的信息、軟體和設備資源的共享以及協同工作等功能,其本質特徵在於提供計算機之間的各類資源的高度共享,實現便捷地交流信息和交換思想。
分布式此耐談計算機系統是一種計算機硬體的配置方式和相應的功能配置方式。它是一種多處理器的計算機系統,各處理器通過互連網路構成統一的系統。系統採用分布式計算結構,即把原來系統內中央處理器處理的任務分散給相應的處理器,實現不同功能的各個處理器相互協調,共享系統的外設與軟體。這樣就加快了系統的處理速度,簡化了主機的邏輯結構,特別適合於工業生產線自動控制和企事業單位的管森碰理,成本低,易於維護,成為計算機在應用領域發展的一個重要方向。
㈢ 什麼是雲存儲雲存儲的基本概念,工作原理是什麼
雲儲存的基本概念
雲存儲是雲計算概念的延伸和發展,是一種新的網路存儲技術,指的是通過應用集群、網路技術和分布式文件系統,網路中的各種不同類型的存儲設備通過應用軟體設置協同工作,提供了一種通用的外部訪問數據存儲和業務功能的系統。
雲存儲的工作原理:
雲存儲是雲計算概念延伸和發展的一個新概念。雲計算是分布式處理、並行處理和網格計算的發展,通過網路將龐大的計算處理程序自動分拆成無數的小程序,使一個龐大的系統由多個伺服器的計算和分析的返回給用戶的結果。通過雲計算技術,網路服務商可以在幾秒鍾內,處理數以百萬甚至數十億的信息,實現和「超級電腦」一樣強大的網路服務。雲存儲的概念和雲計算是類似的,是指通過應用集群、網格技術和分布式文件系統的功能,各種不同類型的網路存儲設備通過應用軟體設置協同工作,提供了一種常見的外部訪問數據存儲和業務功能的系統,保證了數據的安全性,並節省存儲空間。簡單來說,一個新的雲存儲方案是將資源存儲入雲的人訪問。用戶可以隨時、任何地點、任何設備都可以通過網路連接到雲端,方便獲取數據。如果這個解釋還很難理解,那麼可以利用廣域網和互聯網的結構來解釋雲存儲。
㈣ 雲存儲架構分哪些層次,各自實現了什麼功能
(1)存儲層
雲存儲系統對外提供多種不同的存儲服務,各種服務的數據統一存放在雲存儲系統中,形成一個海量數據池。從大多數網路服務後台數據組織方式來看,傳統基於單伺服器的數據組織難以滿足廣域網多用戶條件下的吞吐性能和存儲容量需求;基於P2P架構的數據組織需要龐大的節點數量和復雜編碼演算法保證數據可靠性。相比而言,基於多存儲伺服器的數據組織方法能夠更好滿足在線存儲服務的應用需求,在用戶規模較大時,構建分布式數據中心能夠為不同地理區域的用戶提供更好的服務質量。
雲存儲的存儲層將不同類型的存儲設備互連起來,實現海量數據的統一管理,同時實現對存儲設備的集中管理、狀態監控以及容量的動態擴展,實質是一種面向服務的分布式鏈此存儲系統。
(2)基礎管理層
雲存儲系統架構中的基礎管理層為上層提供不同服務間公共管理的統一視圖。通過設計統一的用戶管理、安全管理、副本管理及策略管理等公共數據管理功能,將底層存儲與上層應用無縫銜接起來,實現多存儲設備之間的協同工作,以更好的性能對外提供多種服務。
(3)應用介面層
應用介面層是雲存儲平台中可以靈活擴展的、直接面向用戶的部分。根據用戶需求,可以開發出不同的應用介面,提供相應的服務。比如數據存儲服務、空間租賃服務、公共資源服務、多用戶數據共享服務、數據備份服務等。
(4)訪問層
通過訪問層,任何一個授權用戶都可以在任何地方,使用一台聯網的終端設備,按照標準的公用應用介面來登錄雲存儲平台,享受雲存儲服務。
2雲存儲技術的優勢
作為新興的存儲技術,銀喚裂與傳統的購買存儲設備和部署存儲軟體相比,雲存儲方式存在以下優點:
(1)成本低、見效快
傳統的購買存儲設備或軟體定製方式下,企業根據信息化管理的需求,一次性投入大量資金購置硬體設備、搭建平台。軟體開發則經過漫長的可行性分析、需求調研、軟體設計、編碼、測試這一過程。往往在軟體開發完成以後,業務需求發生變化,不得不對軟體進行返工,不僅影響質量,提高成本,更是延誤了企業信息化進程,同時造成了企業之間的低水平重復投資以及企業內部周期性、高成本的技術升級。在雲存儲方式下,企業除了配置必要的終端設備接收存儲服務外,不需要投入額外的資金來搭建平台。企業只需按用戶數分期租用服務,規避了一次性投資的風險,降低了使用成本,而且對於選定的服務,可以立即投入使用,既方便又快捷。
(2)易於管理
傳統方式下,企業需要配備專業的IT人員進行系統的維護,由此帶來技術和資金成本。雲存儲模式下,維護工作以及系統的更新升級都由雲存儲服務提供商完成,企業能夠以最低的成本享受到最新最專業的服務。
(3)方式靈活
傳統的購買和定製模式下,一旦完成資金的一次性投入,系統無法在後續使用中動態調整。隨著設備的更新換代,落後的硬體平台難以處置;隨著業務需求的不斷變化,軟體需要不斷地更新升級甚至重構來與之相適應,導致維護成本高昂,很容易發展到不可控的程度。而雲存儲方式一般按照客戶數、使用時間、服務項目進行收費。企業可以根據業務需求變化、人員增減、資金承受能力,隨時調整其租用服務方式,真正做到「按需使用」。
3雲存儲技術趨勢
隨著寬頻網路的發展,集群技術、網格技術鋒閉和分布式文件系統的拓展,CDN內容分發、P2P、數據壓縮技術的廣泛運用,以及存儲虛擬化技術的完善,雲存儲在技術上已經趨於成熟,以「用戶創造內容」和「分享」為精神的Web2.0推動了全網域用戶對在線服務的認知。
㈤ 分布式計算與網格計算一樣嗎
是一樣的,下面是個人理解。。
網格這個名字更注重說明參與計算(讓指執行任務)的是一個集群(一大批主機)彎咐,
而分布式就很直觀的說明參與計算的計算主機是分散的,也可以說明一個項目是分成小塊同時分散執行。
如果有志於分布式志願服務,建議到equn.com了解一下,那裡是國內坦鬧配最大的志願者論壇
㈥ 網格計算和雲計算的概念和區別
網格計算和雲計算都是利用網路資源進行計算的方式。
它們的主要區別如下:
1、概念不同
網格計算是分布式計算的一種,是一門計算機科學。它指的是把一個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然後把這些部分分配給許多計算機進行處理,最後把這些計算結果綜合起來得到最終結果;
雲高枝計算是分布式計算的一種,指的是通過網路「雲」將巨大的數據計算處理程序分解成陪念簡無數個小程序,然後,通過多部伺服器組成的系統進行處理和分析這些小程序得到結果並返回給用戶。
2、側重點不同
雲計算側重於IT資源的整合,整合後按需提供IT資源;
網格計算側重於不同組織間計算能力的連接。
3、商業化性質不同
雲計算依靠IT資源供給的靈活性,革新了IT產業的商蘆褲業模式,是基礎IT資源外包商業模式的典型運用;
網格計算是擁有計算能力的節點自發形成聯盟,共同解決涉及大規模計算的問題,是基礎IT資源聯合共享模式的運用。
㈦ 磁碟陣列 和 分布式文件系統有什麼區別
1、磁碟陣列(Rendant Arrays of Inexpensive Disks,RAID),有「價格便宜且多餘的磁碟陣列」之意。原理是利用數組方式來作磁碟組,配合數據分散排列的設計,提升數據的安全性。磁碟陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁碟,組合成一個大型的磁碟組,利用個別磁碟提供數據所產生加成效果提升整個磁碟系統效能。同時利用這項技術,將數據切割成許多區段,分別存放在各個硬碟上。磁碟陣列還能利用同位檢查(Parity Check)的觀念,在數組中任一顆硬碟故障時,仍可讀出數據,在數據重構時,將數據經計算後重新置入新硬碟中。
2、分布式文件系統(Distributed File System)是指文件系統管理的物理存儲資源不一定直接連接在本地節點上,而是通過計算機網路與節點相連。分布式文件系統的設計基於客戶機/伺服器模式。一個典型的網路可能包括多個供多用戶訪問的伺服器。另外,對等特性允許一些系統扮演客戶機和伺服器的雙重角色。例如,用戶可以「發表」一個允許其他客戶機訪問的目錄,一旦被訪問,這個目錄對客戶機來說就象使用本地驅動器一樣,下面是三個基本的分布式文件系統。使用分布式文件系統可以輕松定位和管理網路中的共享資源、使用統一的命名路徑完成對所需資源院的訪問、提供可靠的負載平衡、與FRS(文件復制服務)聯合在多台伺服器之間提供冗餘、與windows許可權集成以保證安全。
3、綜上所述,磁碟陣列主要是以冗餘備份來保障文件安全和快速訪問,一般以本機不同磁碟或區域網內磁碟組成,而分布式文件系統將廣泛分布在本機、區域網和廣域網上各個不同物理存儲空間的數據以一定邏輯形式組成的文件系統,提供的服務更多的是起到索引(指向)的作用,而又不必耗費很大的部署資岩咐源,順應了雲計算的發展方向。
簡稱RAID(Rendant Arrays of Inexpensive Disks,RAID),有「價格便宜且多餘的
」之意。其原理是利用數組方式來作磁碟組,配
據分散排列的設計,提升數據的安全性。
主要針對硬碟,在容量及速度上,無法跟上CPU及內存的發展,提出改善方法。磁碟陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁碟,組合成一個大型的磁碟組,利用個別磁碟提供數據所產生的加成效果來提升整個磁碟系統的效能。同時,在儲存數據時,利用這項技術,將數據切割成許多區段,分別存放在各個硬碟上
是一個意思,通常稱廉價磁碟冗餘陳列RAID(RendanAr ray of Inexpensive Disk)
NFS server可以看作是一個FILE SERVER,它可以讓你的PC通過網路將遠端得NFS SERVER共享出來的檔案MOUNT到自己的系統中,在CLIENT看來使用NFS的遠端文件就象是在使用本地文件一樣。 NFS協議從誕生到現在為止,已經有多個版本,如NFS V2(rfc1094),NFS V3(rfc1813)(最新的版本是V4(rfc3010)。 二、各NFS協議版本的主要區別 V3相對V2的主要區別: 1、文件尺寸 V2最大隻支持32BIT的文件大小(4G),而NFS V3新增加了支持64BIT文件大小的技術。 2、文件傳輸尺寸 V3沒有限定傳輸尺寸,V2最多隻能設定為8k,可以使用-rsize and -wsize 來進行設定。 3、完整的信息返回 V3增加和完善了許多錯誤和成功信息的返回,對於伺服器的設置和管理能帶來很大好處。 4、增加了對TCP傳輸協議的支持 V2隻提供了對UDP協議的支持,在一些高要求的網路環境中有很大限制,V3增加了對TCP協議的支持 *5、非同步寫入特性 6、改進了SERVER的mount性能 7、有更好的I/O WRITES 性能。 9、更強網路運行效能,使得網路運作更為有效。 10、更強的災難恢復功能
磁碟陣列盒主要用於外部存儲和備份用,如果你的主板不支持RAID可以通過陣列盒來實現,主要用於擴展。
如果主板支持RAID,弄兩道3塊硬碟自己做就可以了!
因為在主板上集成RAID晶元要比另外從外部設備上弄RAID晶元、框架、轉換器等成本要低。
你好,我是做存儲行業的,就我個人的理解說一下這兩個概念吧,僅供參考。
首先要明確磁碟陣列的概念,磁碟陣列是一種存儲介質,說白了它就是一個堆硬碟形成的一塊大硬碟,通過做RAID實現並行讀寫並通過數據校驗保證數據的正確性和安全性。
而存儲系統是一個大概念,一個典型的存儲系統會分為業務層、備份層、數據保護層和最終的歸檔層:
根據業務層的業務種類,決定了你所用到的存儲類型,是使用基於文件系統的NAS存儲,還是使用基於資料庫塊操作的磁碟陣列;接下來在備份層結合備份軟體,將業務數據備份到磁碟陣列或磁帶中;在數據保護層中,將用到一些數據保護技術,如數據壓縮、數據加密、重復數據刪除等等;最後數據歸檔層中,將數據歸檔到磁帶中。
raid1追求安全不追求性能 只是個別的讀取方面可能比單個盤性能要高 因為兩個盤工作
raid0就是倆一起工作 讀寫性能容量都加倍 但是沒安全措施
raid5就是raid0+raid1 又保證安全又保證性能
磁帶機
磁帶機(Tape Drive)一般指單驅動器產品,通常由磁帶驅動器和磁帶構成,是一種經濟、可靠、容量大、速度快的備份設備。這種產品採用高糾錯能力編碼技術和寫後即讀通道技術,可以大大提高數據備份的可靠性。根據裝帶方式的不同,一般分為手動裝帶磁帶機和自動裝帶磁帶機,即自動載入磁帶機。
自動載入磁帶機實際上是將磁帶和磁帶機有機結合組成的。自動載入磁帶機是一個位於單機中的磁帶驅動器和自動磁帶更換裝置,它可以從裝有多盤磁帶的磁帶匣中拾取磁帶並放入驅動器中,或執行相反的過程。它可以備份100GB-200GB或者更多的數據。自動載入磁帶機能夠支持例行備份過程,自動為每日的備份工作裝載新的磁帶。一個擁有工作組伺服器的小公司可以使用自動載入磁帶機來自動完成備份工作。
磁帶庫
磁帶庫是像自動載入磁帶機一樣的基於磁帶的備份系統,它能夠提供同樣的基本自動備份和數據恢復功能,但同時具有更先進的技術特點。它的存儲容量可達到數百PB(1pb=100萬GB),可以實現連續備份、自動搜索磁帶,也可以在驅動管理軟體控制下實現智能恢復、實時監控和統計,整個數據存儲備份過程完全擺脫了人工干涉。
磁碟陣列,簡稱盤陣,計算機行業使用的一種企業級存儲系統。盤陣把多個磁碟組合成一個陣列,通過RAID和虛擬化等技術手段,作為一個單一的存儲設備來使用。通過把數據分散在不同的物理磁碟中,盤陣可以減低數據的訪問時間、提高訪問速度;通過RAID等容錯機制,它可以提高數據的安全性;另外,它還可以有效的利用磁碟空間。
要全面理解「磁碟陣列」,就還必須了解以下幾個重要概念:
最大存儲容量 是指磁碟陣列設備所能存儲數據容量的極限,通俗的講,就是磁碟陣列設備能夠支持的最大硬碟數量乘以單個硬碟容量就是最大存儲容量,其實這是個理論值。實際上這個數值還取決於所使用RAID(獨立冗餘磁碟整理)的級別,採用不同的RAID級別,有效的存儲容量也就有所差別。通常,一般小型的磁碟陣列設備會支持幾百GB的存儲容量,適合中小型公司作為存儲設備共享數據使用,而中高檔的磁碟陣列設備應該支持T級別的容量(1TB = 1000GB)。
平均傳輸率 是指數據從磁碟陣列的硬碟里讀出送到外部主機或其他地方的穩定速度,而不是突發速率,單位通常是Mb/s(兆位/秒)。這個數值取決於磁碟陣列所使用的外部主機通道和所用磁碟類型,通常使用SCSI硬碟作為陣列和FC(Fiber Channel)光纖主機通道的速率為最高,一般可達1000Mb/s以上。而採用IDE硬碟作為陣列的產品的速率就相對於較低,適合規模不大的用戶群使用。
硬碟轉速 是指硬碟內電機主軸的轉動速度,單位是RPM(每分鍾旋轉次數)。其轉速越高內部傳輸速率就越大。目前常見的IDE介面硬碟轉速為5400RPM和7200RPM,而SCSI介面的硬碟的轉速可達到10000RPM以上。如果是小型公司沒有大量數據存儲的話,用5400RPM或7200RPM的硬碟即可,而對於有大量數據要求的部門則最好選用高速SCSI硬碟,且具有熱插拔的優點。
每台磁碟陣列設備都配備了一定數量的內存作為高速緩存使用,而且大多用戶以後可以擴充。在磁碟陣列設備中,常見的內存類型由SDRAM(同步內存)、FLASH(快閃記憶體)等。不同的磁碟陣列產品出廠時配備的內存容量不同,一般為幾十兆到數GB(1GB=1000MB)容量不等,這取決於磁碟陣列產品的應用范圍,一般來講,應用在小規模的區域網當中的磁碟陣列,如果只是應付幾台設備的訪問,64M以下內存容量即可。如果是上百個節點以上的訪問,就得需要上G容量的內存。當然,這不是絕對的因素,磁碟陣列產品的綜合性能發揮還取決於它的處理器能力、硬碟速度及其網路實際環境等因素的制約。總之,選購磁碟陣列產品時,應該綜合考慮各個方面的性能參數。
MTBF,即平均無故障時間,英文全稱是「Mean Time Beeen Failure」。是衡量一個產品(尤其是電器產品)的可靠性指標。單位為「小時」。它反映了產品的時間質量,是體現產品在規定時間內保持功能的一種能力。具體來說,是指相鄰兩次故障之間的平均工作時間,也稱為平均故障間隔。它僅適用於可維修產品。同時也規定產品在總的使用階段累計工作時間與故障次數的比值為MTBF。磁碟陣列產品一般MTBF不能低於50000小時。
磁碟陣列作為數據的存儲設備,供網路用戶使用,那麼就需要磁碟陣列提供介面,和伺服器主機或其他網路設備相連接,這個介面我們把它叫做主機通道或外接主機通道。現在大多數外接主機通道為Ultra2 SCSI和Ultra3 SCSI,部分產品由於和SAN(存儲區域網路)連接具有FC(Fiber Channel光纖通道)介面。
通常,磁碟陣列有單主機通道磁碟陣列和多主機通道磁碟陣列之別: 單主機通道磁碟陣列只能接一台主機,多主機通道磁碟陣列可接多個主機系統,並同時使用,有很大的靈活擴充能力,可以群集(Cluster)的方式共用磁碟陣列。且大多數的陣列都支持73GB、36GB和18GB的硬碟,也有部分的陣列可以支持180GB的硬碟,並支持熱插拔,其可支持的RAID級別有0、1(0+1)、3和5等。
GIT最有名了
。。磁碟陣列原理是將硬碟數據按規則,同時寫到兩塊或多塊硬碟上保存(有RAID 0、1、5等模式),即相當硬碟並聯同時協作工作,數據的讀寫速度相當疊加翻倍。這種模式下,每塊硬碟中的數據都不是完整數據。雙硬碟時,各自為獨立工作狀態,數據只保存在用戶指定磁碟中,每次操作都是單一磁碟速度。
㈧ 比較集群技術,網格技術和分布式文件系統的異同
簡單說,孝鋒
分布式是以縮短單個任務的執行時間來提升效率的,
而集群則是通過提高單位時間內執行的任務數來提升效率。
例如:
如果一個任務由10個子任務組成,每個子任務鏈和單獨執行需1小時,則在一台伺服器上執行改任務需10小時。
采棚慎盯用分布式方案,提供10台伺服器,每台伺服器只負責處理一個子任務,不考慮子任務間的依賴關系,執行完這個任務只需一個小時。(這種工作模式的一個典型代表就是Hadoop的Map/Rece分布式計算模型)
而採用集群方案,同樣提供10台伺服器,每台伺服器都能獨立處理這個任務。假設有10個任務同時到達,10個伺服器將同時工作,10小後,10個任務同時完成,這樣,整身來看,還是1小時內完成一個任務!
㈨ 什麼是網格,和網路有什麼區別啊
分類: 電腦/網路 >> 互聯網
解析:
網格
一.網格的產生
網格(Grid)這個詞來自於電力網格(PowerGrid)。「網格」與「電力網格」形神相似。一方面,計算機網縱橫交錯,很像電力網;另一方面,電力網格用高壓線路把分散在各地的發電站連接在一起,向用戶提供源源不斷的電力。用戶只需插上插頭、打開開關就能用電,一點都不需要關心電能是從哪個電站送來的,也不需要知道是水力電、火力電還是核能電。建設網格的目的也是一樣,其最終目的是希望它能夠把分布在網際網路上數以億計的計算機、存儲器、貴重設備、資料庫等結合起來,形成一個虛擬的、空前強大的超級計算機,滿足不斷增長的計算、存儲需求,並使信息世界成為一個有機的整體。
電網和網格對照表
電網:當你用洗衣機洗衣服時,你則裂只關心衣服什麼時候洗好。而不在乎洗衣機用的電是來源於水力發電,伏盯沒火電廠還是核電。你只需要把插頭插入插座就行了。
網格:當你在電腦前工作時,你唯一關心的是要做的事(比如一項計算,設計等等)無論電腦連上什麼網路,你都可以得到所需的計算能力出儲存容量。
電網:我們現在用電的基礎建設是「電網「。就是利用輸電站,電力站,變電所和電線等等,把許多不同種類的發電廠和你家聯系起來。
網格:對於上述的基礎建設就叫「網格「。就是把電腦,工作站,伺服器等計算資源連起來,而且提供必要的使用機制。
電網:電網是顯而易見的:你不必擔心你所用的電力是從哪裡或者如何產生的。
網格:網格也將成為顯而易見:你不必擔心你所使用的電腦程序和資料在那裡,網格中間伺服器都會把最適合的計算資源分配給你的工作。
電網:電網很普遍:電力到處都有。只要插上插座就能獲得電力資源。
網格:網格也將很普遍:電腦,筆記本,或者是掌上電腦,手機,甚至是一般的家用電器都可以通過網格插口連 上網格。
電網:電網是公共設施:你只要付錢就可以用電。
網格:網格也試圖想為廣大民眾服務:只要付錢,都可以享用網格無窮無盡的計算資源和儲存能力
註:另一種說法是網格就像一個巨大的網,裡面有很多格子.每個格子就是一個區域網格,每個節點就是一台計算機.這種說法可能起源於中國。
二.究竟什麼是網格
網格是一種新興的技術,正處在不斷發展和變化當中。目前學術界和商業界圍繞網格開展的研究有很多,其研究的內容和名稱也不盡相同因而網格尚未有精確的定義和內容定位。比如國外媒體常用「下一代互聯網」、「Inter2」、「下一代Web」等來稱呼網格相關技術。但「下一代互聯網(NGI)」和「Inter2」又是美國的兩個具體科研項目的名字,它們與網格研究目標相交叉,研究內容和重點有很大不同。企業界用的名稱也很多,有內容分發(Contents Delivery)、服務分發(Service Delivery)、電子服務(e-service)、實時企業計算(Real-Time Enterprise Computing,簡稱RTEC)、分布式計算Peer-to-Peer Computing(簡稱P2P)、Web服務(Web Services)等。中國科學院計算所所長李國傑院士認為,網格實際上是繼傳統互聯網、Web之後的第三次浪潮,可以稱之為第三代互聯網應用。
網格是利用互聯網把地理上廣泛分布的各種資源(包括計算資源、存儲資源、帶寬資源、軟體資源、數據資源、信息資源、知識資源等)連成一個邏輯整體,就像一台超級計算機一樣,為用戶提供一體化信息和應用服務(計算、存儲、訪問等),虛擬組織最終實現在這個虛擬環境下進行資源共享和協同工作,徹底消除資源「孤島」,最充分的實現信息共享。
三.網格技術的特徵及其體系結構
1.網格技術的特徵
在介紹網格的特徵之前,我們首先要解決一個重要的問題:網格是不是分布式系統?這個問題之所以必須回答,因為人們常常會問另一個相關的問題:"為什麼我們需要網格?現在已經有很多系統(比如海關報關系統、飛機訂票系統)實現了資源共享與協同工作。這些系統與網格有什麼區別?"
對這個問題的缺納簡要回答是:網格是一種分布式系統,但網格不同於傳統的分布式系統。IBM Global Service與EDS是在這個分布式領域最著名的公司。構建分布式系統有三種方法:即傳統方法(我們稱之為EDS方法)、分布自律系統(Autonomous Decentralized Systems, ADS)方法,網格(grid)方法。ADS通常用於工業控制系統中。網格方法與傳統方法的區別見下表:
特徵 傳統分布式系統 網格
開放性 需求和技術有一定確定性、封閉性 開放技術、開放系統
通用性 專門領域、專有技術 通用技術
集中性 很可能是統一規劃、集中控制 一般而言是自然進化、非集中控制
使用模式 常常是終端模式或C/S模式 服務模式為主
標准化 領域標准或行業標准 通用標准(+行業標准)
平台性 應用解決方案 平台或基礎設施
通過以上對比,
1.資源共享,消除資源孤島:網格能夠提供資源共享,它能消除信息孤島、實現應用程序的互連互通。網格與計算機網路不同,計算機網路實現的是一種硬體的連通,而網格能實現應用層面的連通。
2.協同工作:網格第二個特點是協同工作,很多網格結點可以共同處理一個項目
3.通用開放標准,非集中控制,非平凡服務質量:這是Ian Foster最近提出的網格檢驗標准。網格是基於國際的開放技術標准,這跟以前很多行業、部門或者公司推出的軟體產品不一樣。
4.動態功能,高度可擴展性:網格可以提供動態的服務,能夠適應變化。同時網格並非限制性的,它實現了高度的可擴展性。
2.網格的體系特徵
網格之所以能有以上所說的種種優勢特徵,是由網格的體系結構賦予它的。網格體系結構的主要功能是劃分系統基本組件,指定組件的目的與功能,刻畫組件之間的相互作用,整合各部分組件。科研工作者已經提出並實現了若干種合理的網格體系結構。下面介紹目前影響比較廣泛的兩個網格體系結構:網格計算協議體系結構(Grid Protocol Architecture,GPA)和計算經濟網格體系結構(GRACE)模型。
OGSA(Open Grid Services Architecture)被稱為是下一代的網格體系結構,它是在原來「五層沙漏結構」的基礎上,結合最新的Web Service 技術提出來的。OGSA包括兩大關鍵技術即網格技術和Web Service 技術。
隨著網格計算研究的深入,人們越來越發現網格體系結構的重要。網格體系結構是關於如何建造網格的技術,包括對網格基本組成部分和各部分功能的定義和描述,網格各部分相互關系與集成方法的規定,網格有效運行機制的刻畫。顯然,網格體系結構是網格的骨架和靈魂,是網格最核心的技術,只有建立合理的網格體系結構,才能夠設計和建造好網格,才能夠使網格有效地發揮作用。
OGSA最突出的思想就是以「服務」為中心。在OGSA框架中,將一切都抽象為服務,包括計算機、程序、數據、儀器設備等。這種觀念,有利於通過統一的標准介面來管理和使用網格。Web Service提供了一種基於服務的框架結構,但是,Web Service 面對的一般都是永久服務,而在網格應用環境中,大量的是臨時性的短暫服務,比如一個計算任務的執行等。考慮到網格環境的具體特點,OGSA 在原來Web Service 服務概念的基礎上,提出了「網格服務(Grid Service)」的概念,用於解決服務發現、動態服務創建、服務生命周期管理等與臨時服務有關的問題。
基於網格服務的概念,OGSA 將整個網格看作是「網格服務」的 *** ,但是這個 *** 不是一成不變的,是可以擴展的,這反映了網格的動態特性。網格服務通過定義介面來完成不同的功能,服務數據是關於網格服務實例的信息,因此網格服務可以簡單地表示為「網格服務=介面/行為+服務數據」。
在目前,網格服務提供的介面還比較有限,OGSA 還在不斷的完善過程之中,下一步將考慮擴充管理、安全等等方面的內容。
3.網格協議體系結構
Ian Foster於2001年提出了網格計算協議體系結構,認為網格建設的核心是標准化的協議與服務,並與Inter網路協議進行類比(如圖1)。該結構主要包括以下五個層次:
構造層(Fabric):控制局部的資源。由物理或邏輯實體組成,目的是為上層提供共享的資源。常用的物理資源包括計算資源、存儲系統、目錄、網路資源等;邏輯資源包括分布式文件系統、分布計算池、計算機群等。構造層組件的功能受高層需求影響,基本功能包括資源查詢和資源管理的QoS保證。
連接層(Connectivity):支持便利安全的通信。該層定義了網格中安全通信與認證授權控制的核心協議。資源間的數據交換和授權認證、安全控制都在這一層控制實現。該層組件提供單點登錄、代理委託、同本地安全策略的整合和基於用戶的信任策略等功能。
資源層(Resource):共享單一資源。該層建立在連接層的通信和認證協議之上,滿足安全會話、資源初始化、資源運行狀況監測、資源使用狀況統計等需求,通過調用構造層函數來訪問和控制局部資源。
匯集層(Collective):協調各種資源。該層將資源層提交的受控資源匯集在一起,供虛擬組織的應用程序共享和調用。該層組件可以實現各種共享行為,包括目錄服務、資源協同、資源監測診斷、數據復制、負荷控制、賬戶管理等功能。
應用層(Application):為網格上用戶的應用程序層。應用層是在虛擬組織環境中存在的。應用程序通過各層的應用程序編程介面(API)調用相應的服務,再通過服務調動網格上的資源來完成任務。為便於網格應用程序的開發,需要構建支持網格計算的大型函數庫。
四. 當今網格的運用
現在國內國外運用得最多的可能是在一些大型院校的計算網格(實現計算資源的共享。 什麼是計算資源: 簡單來說就是計算能力,CPU。 計算資源共享就是CPU計算的共享)。人們把一個集群(cluster, 也就是常說的機房,通常有幾十台操作系統為Linux的計算機)的計算機連成一個局域型網格。這樣就好像把這幾十台電腦連成了一台超級計算機,計算能力當然大大提高了。這種局域計算網格主要運用於一些科研的研究。比如說生物科學。當生物科學的研究員需要高性能的計算資源來幫助他們分析試驗的結果時,他們就把這些分析試驗的程序提交(submit)給網格,網格通過計算再把結果返回給這些研究員。計算結果可能是一些圖像(rendering)也可能是一些數據。這些計算如果在單一PC(Personal puter, 個人計算機)上運行的話,往往會花費幾個月的時間,然而在網格中運行一,兩天也就完成了。這就是網格技術最直觀的優點之一。當然現在有一些大型主機(super-mainframe)也有很強的計算能力(比如常說的IBM deepblue,打敗人類圍棋大師Kasparov那位),但是這種主機太昂貴,而且配置(deploy)往往不方便,是名副其實的重量級(heavyweight)計算。SETI@Home (SETI@Home's,一個分布式計算的項目,通過互聯網路上的計算機搜索地球外智慧訊息,網格在分布式計算的成功運用。 參見:equn/info/fd01)的網站指出,世界上最強大的計算機IBM 的 ASCI White,可以實現12萬億次的浮點運算,但是花費了1億千萬美元;然而SETI@HOME 只用了50萬美元卻實現了15萬億次浮點運算。
網格另外一個顯著的運用可能就是虛擬組織(Virtual Organisations)。這種虛擬組織往往是針對與某一個特定的項目,或者是某一類特定研究人員。在這裡面可以實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享。比如說中國2008年奧運會開幕式研究組就可以運用網格組成一個虛擬組織。在這個虛擬組織里,任何成員不管在哪個地方都可以有權訪問組織的共享資源(如 開幕式場地圖紙,開幕式資金,開幕式節目單);而且可以和另一地方的虛擬組織成員進行交流。這個虛擬組織就像把所有奧運會開幕式的資源,信息,以及人員集中到了一個虛擬的空間,讓人們集中精力研討開幕式項目的問題,而不必考慮其他的問題。據個實例,由英國利茲大學,牛津大學,約克大學和謝菲爾德大學合作的DAME項目就是致力於研究和運用虛擬組織。DAME架構在這四個大學合建的白玫瑰網格White Rose Computational Grid (WRCG)上,運用於對飛機故障的快速檢測和維修。