㈠ 常見的信息資源管理方式主要有哪些它們各自的特點是什麼
1技術手段
(1)基本內容和主要方法
以計算機和通信技術為基礎的現代信息系統和信息網絡和與之適應的信息加工方法是技術手段的基本內容和主要方法.
(2)隨著信息技術的發展,不同的資料庫和功能強大的信息系統研製成功,資料庫成為了現代信息資源的主要存儲形式,信息系統成為了信息資源管理的基本手段,信息網路成為現代信息資源主要的存儲和流通場所,信息系統和信息網路作為基恩的技術手段備受關注。
2.經濟手段。
運用經濟杠桿的利益誘導作用,使信息資源的開發和利用機構從自身的經濟利益上關心自己的經濟活動,是一種間接的輔助手段。
(1)經濟杠桿
同市場決定的市場參數和有政府規定政府參數共同組成經濟參數的三大類,盡管其由政府人為規定,但是同市場參數一樣體現信息資源本身特點及其開發利用活動的規律,只是在市場產生不能有效的起作用或者嚴重偏離政府目標時才使用
(3) 特點
是一種引導性的,非強制性的措施。可以促進信息資源開發利用機構的微觀經濟活動,有利於發揮市場機製作用,能正確體現信息資源本身特徵和其開發利用活動的規律。
(4) 功能
1) 調節功能:包括各信息資源開發利用機構之間,各環節之間,以及國家,集體,個人之間的利益關系。
2) 控制功能:通過價格,利率和稅率等經濟杠桿引導信息資源開發利用活動向信息資源管理的目標靠攏。
3) 核算功能:藉助價格,利潤工資等經濟杠桿核算勞動耗費,比較投入產出,平衡社會需求。
4) 監督功能:藉助會計,審計,銀行監管等手段,根據法律規章制度,對信息資源開發利用機構及其與 政 府,職工和相關企業之間的關系進行監督。
3.法律手段
用以協調信息資源開發利用活動的各種有關法律規范的總稱。
(1) 運用法律手段.
各個層次的信息資源管理者依靠國家政權的力量,通過經濟立法和司法機構,運用經濟法規調整信息資源開發利用各個機構之間,各個環節之間復雜的經濟關系,處理經濟矛盾,解決經濟糾紛,懲辦經濟犯罪。維護信息資源開發利用的正常秩序。
(2) 特點
普遍的約束性,嚴格的強制性,相對的穩定性,明確的規定性
4.行政手段
憑借國家政權的權威,採取命令,指示的形式直接管理控制信息資源及其相關活動。
是必要的輔助手段,其合理運用
1) 有利於整頓經濟秩序2)加強組織,減少混亂。3)有助於更好的運用其他三種手段。
(1) 應注意以下問題
!)明確使用范圍和條件
行政手段一般是不得已而為之,明確其范圍和使用條件是為了使其真正的有效適用,又不破壞阻礙市場機制發揮作用
2)提供運用行政手段的決策水平
各種的命令在發布之前都要有一個決策的過程,為了避免主觀片面性,提高決策的科學有效性,應建立合理的決策程序,決策責任制和審批制度,研究如何使決策活動在高水平上進行。
3) 防止多頭管理
很多信息資源利用機構隸屬於多個部門,關系復雜,在實踐中應注意各部門的配合和協調,不可政出多門。
4) 原則性與靈活性的結合
由於主客觀的因素誰也不能保證出台的政策就一定都是科學的,都反映了信息資源開發利用活動的規律,在具體實踐中要注重靈活性與原則性的有機結合
6. 總結
(1) 技術手段是基礎,最基本的手段
(2) 經濟和法律手段作用越來越重要,其運用不僅是信息資源管理科學化,還有效的促進和適應社會主義和市場經濟
(3) 必要的行政手段不可或缺,特殊情況下有優越性,有直接,迅速,有效的特點。
(4) 繼續完善發展技術手段,強化經濟法律手段,輔以必要的行政手段,強調各手段之間配合協調
㈡ 系統的數據管理方式有哪些
值型和非數值型兩類,這些數據在計算機中都必須以二進制形式表示。一串二進制數既可表示數量值,也可表示一個字元、漢字或其他。一串二進制數代表的數據不同,含義也不同。這些數據在計算機的存儲設備中是如何進行組織存儲的?
數據單位
· 位(bit)
位(bit),音譯為「比特」,是計算機存儲設備的最小單位,由數字0或1組成。
· 位元組(Byte)
位元組(Byte),簡寫為「B」,音譯為「拜特」,簡寫為「B」。8個二進制位編為一組稱為一個位元組,即:1B = 8bit。位元組是計算機處理數據的基本單位,即以位元組為單位解釋信息。通常,一個ASCII碼佔1個位元組;一個漢字國標碼佔2個位元組;整數佔2個位元組;實數,即帶有小數點的數,用4個位元組組成浮點形式等。
· 字(word)
計算機一次存取、處理和傳輸的數據長度稱為字,即:一組二進制數碼作為一個整體來參加運算或處理的單位。一個字通常由一個或多個位元組構成,用來存放一條指令或一個數據。
· 字長
一個字中所包含的二進制數的位數稱為字長。不同的計算機,字長是不同的,常用的字長有8位、16位、32位和64位等,也就是經常說的8位機、16位機、32位機或64位機。例如,一台計算機如果用8個二進制位表示一個字,就說該機是八位機,或者說它的字長是8位的;又如,一個字由兩個位元組組成,即16個二進制位,則字長為16位。字長是衡量計算機性能的一個重要標志。字長越長,一次處理的數字位數越大,速度也就越快。
存儲設備
用來存儲信息的設備稱為計算機的存儲設備,如內存、硬碟、軟盤及光碟等。不論是哪一種設備,存儲設備的最小單位是「位」,存儲信息的單位是位元組,也就是說按位元組組織存放數據。
· 存儲單元
表示一個數據的總長度稱為計算機的存儲單元。在計算機中,當一個數據作為一個整體存入或取出時,這個數據存放在一個或幾個位元組中組成一個存儲單元。存儲單元的特點是,只有往存儲單元送新數據時,該存儲單元的內容用新值代替舊值,否則永遠保持原有數據。
· 存儲容量
某個存儲設備所能容納的二進制信息量的總和稱為存儲設備的存儲容量。存儲容量用位元組數來表示,如:4MB、2GB等,其關系為:1KB = 1024 B、1MB = 1024 KB、1GB = 1024 MB。1千位元組相當於210 Byte,即1024 Byte, 記為1KB;1兆位元組相當於220 Byte,即1024 KB,記為1MB;而1吉位元組相當於230 Byte ,即1024 MB,記為1GB。
內存容量是指為計算機系統所配置的主存(RAM)總位元組數,度量單位是「KB」「MB」,如32MB、64MB、128MB等。外存多以硬碟、軟盤和光碟為主,每個設備所能容納的信息量的總位元組數稱為外存容量,度量單位是「MB」「GB」,如800MB、6.5GB。
目前,高檔微型計算機的內存容量已從幾MB發展到幾百MB,外存容量已從幾百MB發展到幾GB~幾十GB。
編址與地址
· 編 址
對計算機存儲單元編號的過程稱為「編址」,是以位元組為單位進行的。
· 地 址
存儲單元的編號稱為地址。
注意:地址號與存儲單元是一一對應的,CPU通過單元地址訪問存儲單元中的信息,地址所對應的存儲單元中的信息是CPU操作的對象,即數據或指令本身。地址也是用二進制編碼表示,為便於識別通常採用16進制。
問題2
它所提供的功能有以下幾項:
(1)數據定義功能。DBMS提供相應數據語言來定義(DDL)資料庫結構,它們是刻畫資料庫框架,並被保存在數據字典中。
(2)數據存取功能。DBMS提供數據操縱語言(DML),實現對資料庫數據的基本存取操作:檢索,插入,修改和刪除。
(3)資料庫運行管理功能。DBMS提供數據控制功能,即是數據的安全性、完整性和並發控制等對資料庫運行進行有效地控制和管理,以確保數據正確有效。
(4)資料庫的建立和維護功能。包括資料庫初始數據的裝入,資料庫的轉儲、恢復、重組織,系統性能監視、分析等功能。
(5)資料庫的傳輸。DBMS提供處理數據的傳輸,實現用戶程序與DBMS之間的通信,通常與操作系統協調完成。
問題3
著名資料庫管理系統
MS SQL SYBASE DB2 ORACLE MySQL ACCESS VF 常見的資料庫管理系統 目前有許多資料庫產品,如Oracle、Sybase、Informix、Microsoft SQL Server、Microsoft Access、Visual FoxPro等產品各以自己特有的功能,在資料庫市場上佔有一席之地。下面簡要介紹幾種常用的資料庫管理系統。
資料庫管理系統(DBMS)的主要功能
DBMS的主要目標是使數據作為一種可管理的資源來處理,其主要功能如下: 1.數據定義:DBMS提供數據定義語言,供用戶定義資料庫的三級模式結構、兩級映像以及完整性約束和保密限制等約束。 2.數據操作:DBMS提供數據操作語言,供用戶實現對數據的操作。 3.資料庫的運行管理:資料庫的運行管理功能是DBMS的運行控制、管理功能,包括多用戶環境下的並發控制、安全性檢查和存取限制控制、完整性檢查和執行、運行日誌的組織管理、事務的管理和自動恢復,即保證事務的原子性。這些功能保證了資料庫系統的正常運行。 4.數據組織、存儲與管理:DBMS要分類組織、存儲和管理各種數據,包括數據字典、用戶數據、存取路徑等,需確定以何種文件結構和存取方式在存儲級上組織這些數據,如何實現數據之間的聯系。數據組織和存儲的基本目標是提高存儲空間利用率,選擇合適的存取方法提高存取效率。 5.資料庫的保護:資料庫中的數據是信息社會的戰略資源,隨數據的保護至關重要。DBMS對資料庫的保護通過4個方面來實現:資料庫的恢復、資料庫的並發控制、資料庫的完整性控制、資料庫安全性控制。DBMS的其他保護功能還有系統緩沖區的管理以及數據存儲的某些自適應調節機制等。 6.資料庫的維護:這一部分包括資料庫的數據載入、轉換、轉儲、資料庫的重組合重構以及性能監控等功能,這些功能分別由各個使用程序來完成。 7.通信:DBMS具有與操作系統的聯機處理、分時系統及遠程作業輸入的相關介面,負責處理數據的傳送。對網路環境下的資料庫系統,還應該包括DBMS與網路中其他軟體系統的通信功能以及資料庫之間的互操作功能。
㈢ 空間資料庫中,矢量數據的管理方式有哪些,各有什麼優缺點
矢量數據管理的方式分三種:
優點:
除通過 OID 連接之外,圖形數據和屬性數據幾乎是完全獨立組織、管理與檢索的。
其中圖形系統採用高級 語言編程管理,可以直接操縱數據文件,因而圖形用戶界面與圖形文件處理是一體的,兩者中間沒有邏輯裂縫。
缺點:
①需要同時啟動圖形文件系統和關系數據 庫系統,甚至兩個系統來回切換,使用起來不方便。
②屬性數據和圖形數據通過 ID 聯系起來, 使查詢運算、模型操作運算速度慢。
③數據發布和共享困難。
④屬性數據和圖形數據分開儲存,數據的 安全性、一致性、完整性、並發控制以及數據損壞後的恢復方面缺少基本的功能。
⑤缺乏表示空間對象及其關系的能力。
對變長的幾個數據進行關系範式分解,分解成定長記錄的數據表進行存儲。
將圖形數據的變長部分處理成 Binary 二進制 Block 塊欄位。
優點:
圖形數據與屬性數據都採用現有的關系型數據 庫存儲,使用關系資料庫標准機制來進行空間數據與屬性數據的連接。
缺點:
①處理一個空間對象時,需要進行大量的 連接操作,非常費時,並影響效率
②二進制塊的讀寫效率要比定長的屬性欄位慢的多,特別是涉及對象的嵌套,速度更慢。
優點:
主要解決了空間數據的變長記錄的管理,由資料庫軟體商進行擴展,效率要比前面的二進制塊的管理高 的多。
缺點:
沒有解決對象的嵌套問題,空間數據結構也不能由用戶任意定義,使用上仍受到一定限制。
㈣ 大數據時代數據管理方式研究
大數據時代數據管理方式研究
1數據管理技術的回顧
數據管理技術主要經歷了人工管理階段、文件系統階段和資料庫系統階段。隨著數據應用領域的不斷擴展,數據管理所處的環境也越來越復雜,目前廣泛流行的資料庫技術開始暴露出許多弱點,面臨著許多新的挑戰。
1.1 人工管理階段
20 世紀 50 年代中期,計算機主要用於科學計算。當時沒有磁碟等直接存取設備,只有紙帶、卡片、磁帶等外存,也沒有操作系統和管理數據的專門軟體。該階段管理的數據不保存、由應用程序管理數據、數據不共享和數據不具有獨立性等特點。
1.2 文件系統階段
20 世紀 50 年代後期到 60 年代中期,隨著計算機硬體和軟體的發展,磁碟、磁鼓等直接存取設備開始普及,這一時期的數據處理系統是把計算機中的數據組織成相互獨立的被命名的數據文件,並可按文件的名字來進行訪問,對文件中的記錄進行存取的數據管理技術。數據可以長期保存在計算機外存上,可以對數據進行反復處理,並支持文件的查詢、修改、插入和刪除等操作。其數據面向特定的應用程序,因此,數據共享性、獨立性差,且冗餘度大,管理和維護的代價也很大。
1.3資料庫階段
20 世紀 60 年代後期以來,計算機性能得到進一步提高,更重要的是出現了大容量磁碟,存儲容量大大增加且價格下降。在此基礎上,才有可能克服文件系統管理數據時的不足,而滿足和解決實際應用中多個用戶、多個應用程序共享數據的要求,從而使數據能為盡可能多的應用程序服務,這就出現了資料庫這樣的數據管理技術。資料庫的特點是數據不再只針對某一個特定的應用,而是面向全組織,具有整體的結構性,共享性高,冗餘度減小,具有一定的程序與數據之間的獨立性,並且對數據進行統一的控制。
2大數據時代的數據管理技術
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。大數據有 3 個 V,一是大量化(Volume),數據量是持續快速增加的,從 TB級別,躍升到 PB 級別;二是多樣化(Variety),數據類型多樣化,結構化數據已被視為小菜一碟,圖片、音頻、視頻等非結構化數據正以傳統結構化數據增長的兩倍速快速創建;三是快速化 (Velocity),數據生成速度快,也就需要快速的處理能力,因此,產生了「1 秒定律」,就是說一般要在秒級時間范圍內給出分析結果,時間太長就失去價值了,這個速度要求是大數據處理技術和傳統的數據挖掘技術最大的區別。
2.1 關系型資料庫(RDBMS)
20 世紀 70 年代初,IBM 工程師 Codd 發表了著名的論文「A Relational Model of Data for Large Shared DataBanks」,標志著關系資料庫時代來臨。關系資料庫的理論基礎是關系模型,是藉助於集合代數等數學概念和方法來處理資料庫中的數據,現實世界中的實體以及實體之間的聯系非常容易用關系模型來表示。容易理解的模型、容易掌握的查詢語言、高效的優化器、成熟的技術和產品,使得關系資料庫占據了資料庫市場的絕對的統治地位。隨著互聯網 web2.0 網站的興起,半結構化和非結構化數據的大量涌現,傳統的關系資料庫在應付 web2.0 網站特別是超大規模和高並發的 SNS(全稱 Social Networking Services,即社會性網路服務) 類型的 web2.0 純動態網站已經顯得力不從心,暴露了很多難以克服的問題。
2.2 noSQL資料庫
順應時代發展的需要產生了 noSQL資料庫技術,其主要特點是採用與關系模型不同的數據模型,當前熱門的 noSQL資料庫系統可以說是蓬勃發展、異軍突起,很多公司都熱情追捧之,如:由 Google 公司提出的 Big Table 和 MapRece 以及 IBM 公司提出的 Lotus Notes 等。不管是那個公司的 noSQL資料庫都圍繞著大數據的 3 個 V,目的就是解決大數據的 3個 V 問題。因此,在設計 noSQL 時往往考慮以下幾個原則,首先,採用橫向擴展的方式,通過並行處理技術對數據進行劃分並進行並行處理,以獲得高速的讀寫速度;其次,解決數據類型從以結構化數據為主轉向結構化、半結構化、非結構化三者的融合的問題;再次,放鬆對數據的 ACID 一致性約束,允許數據暫時出現不一致的情況,接受最終一致性;最後,對各個分區數據進行備份(一般是 3 份),應對節點失敗的狀況等。
對數據的應用可以分為分析型應用和操作型應用,分析型應用主要是指對大量數據進行分類、聚集、匯總,最後獲得數據量相對小的分析結果;操作型應用主要是指對數據進行增加、刪除、修改和查詢以及簡單的匯總操作,涉及的數據量一般比較少,事務執行時間一般比較短。目前資料庫可分為關系資料庫和 noSQL資料庫,根據數據應用的要求,再結合目前資料庫的種類,所以目前資料庫管理方式主要有以下 4 類。
(1)面向操作型的關系資料庫技術。
首先,傳統資料庫廠商提供的基於行存儲的關系資料庫系統,如 DB2、Oracle、SQL Server 等,以其高度的一致性、精確性、系統可恢復性,在事務處理方面仍然是核心引擎。其次,面向實時計算的內存資料庫系統,如 Hana、Timesten、Altibase 等通過把對數據並發控制、查詢和恢復等操作控制在內存內部進行,所以獲得了非常高的性能,在很多特定領域如電信、證券、網管等得到普遍應用。另外,以 VoltDB、Clustrix 和NuoDB 為代表的 new SQL 宣稱能夠在保持 ACDI 特性的同時提高了事務處理性能 50 倍 ~60 倍。
(2)面向分析型的關系資料庫技術。
首先,TeraData 是數據倉庫領域的領頭羊,Teradata 在整體上是按 Shared Nothing 架構體系進行組織的,定位就是大型數據倉庫系統,支持較高的擴展性。其次,面向分析型應用,列存儲資料庫的研究形成了另一個重要的潮流。列存儲資料庫以其高效的壓縮、更高的 I/O 效率等特點,在分析型應用領域獲得了比行存儲資料庫高得多的性能。如:MonetDB 和 Vertica是一個典型的基於列存儲技術的資料庫系統。
(3)面向操作型的 noSQL 技術。
有些操作型應用不受 ACID 高度一致性約束,但對大數據處理需要處理的數據量非常大,對速度性能要求也非常高,這樣就必須依靠大規模集群的並行處理能力來實現數據處理,弱一致性或最終一致性就可以了。這時,操作型 noSQL資料庫的優點就可以發揮的淋漓盡致了。如,Hbase 一天就可以有超過 200 億個到達硬碟的讀寫操作,實現對大數據的處理。另外,noSQL資料庫是一個數據模型靈活、支持多樣數據類型,如對圖數據建模、存儲和分析,其性能、擴展性是關系資料庫無法比擬的。
(4)面向分析型的 noSQL 技術。
面向分析型應用的 noSQL 技術主要依賴於Hadoop 分布式計算平台,Hadoop 是一個分布式計算平台,以 HDFS 和 Map Rece 為用戶提供系統底層細節透明的分布式基礎架構。《Hadoop 經典實踐染技巧》傳統的資料庫廠商 Microsoft,Oracle,SAS,IBM 等紛紛轉向 Hadoop 的研究,如微軟公司關閉 Dryad 系統,全力投入 Map Rece 的研發,Oracle 在 2011 年下半年發布 Big Plan 戰略計劃,全面進軍大數據處理領域,IBM 則早已捷足先登「,沃森(Watson)」計算機就是基於 Hadoop 技術開發的產物,同時 IBM 發布了 BigInsights 計劃,基於 Hadoop,Netezza 和 SPSS(統計分析、數據挖掘軟體)等技術和產品構建大數據分析處理的技術框架。同時也涌現出一批新公司來研究Hadoop 技術,如 Cloudera、MapRKarmashpere 等。
3數據管理方式的展望
通過以上分析,可以看出關系資料庫的 ACID 強調數據一致性通常指關聯數據之間的邏輯關系是否正確和完整,而對於很多互聯網應用來說,對這一致性和隔離性的要求可以降低,而可用性的要求則更為明顯,此時就可以採用 noSQL 的兩種弱一致性的理論 BASE 和 CAP.關系資料庫和 noSQL資料庫並不是想到對立的矛盾體,而是可以相互補充的,根據不同需求使用不同的技術,甚至二者可以共同存在,互不影響。最近幾年,以 Spanner 為代表新型資料庫的出現,給資料庫領域注入新鮮血液,這就是融合了一致性和可用性的 newSQL,這種新型思維方式或許會是未來大數據處理方式的發展方向。
4 結束語
隨著雲計算、物聯網等的發展,數據呈現爆炸式的增長,人們正被數據洪流所包圍,大數據的時代已經到來。正確利用大數據給人們的生活帶來了極大的便利,但與此同時也給傳統的數據管理方式帶來了極大的挑戰。