⑴ 非數值信息編碼的主要特徵
非數值信息編碼的主要特徵:通過編碼可建立數據間的內在聯系,便於計算機識別和管理。地理信息系統中主要的數據編碼是服務於空間信息分析的地理編碼。
將信息分類編碼以標準的形式發布,就構成了標准信息分類編碼,或稱標准信息分類代碼。人們通常藉助代碼進行手工方式或計算機方式的信息檢索和查詢,特別是在用計算機方式進行信息處理時,標准信息分類編碼顯得尤為重要。
模擬退火演算法
模擬退火演算法來源於固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時,固體內部粒子隨溫升變為無序狀,內能增大,而徐徐冷卻時粒子漸趨有序,在每個溫度都達到平衡態,最後在常溫時達到基態,內能減為最小。根據Metropolis准則,粒子在溫度T時趨於平衡的概率為e-ΔE/(kT),其中E為溫度T時的內能,ΔE為其改變數,k為Boltzmann常數。
⑵ 數據編碼的編碼特性
在進行數據編碼時應遵循系統性、標准性、實用性、擴充性和效率性。
數據編碼數據通過編碼可建立數據間的內在聯系,便於計算機識別和管理。地理信息系統中主要的數據編碼是服務於空間信息分析的地理編碼。即為識別圖形點、線、面或格網位置及屬性而建立的編碼方法,包括拓撲編碼和坐標編碼。前者是表示空間數據位置相鄰邏輯關系的編碼方法;後者是表示空間數據位置在某一坐標系統下的量度,可以是隱式的(對格網數據)或顯式的。
⑶ 計算機常用的信息編碼有哪幾種
信息編碼(Information Coding)是為了方便信息的存儲、檢索和使用,在進行信息處理時賦予信息元素以代碼的過程。即用不同的代碼與各種信息中的基本單位組成部分建立一一對應的關系。信息編碼必須標准、系統化,設計合理的編碼系統是關系信息管理系統生命力的重要因素。
一般應有的代碼有兩類,一類是有意義的代碼,即賦予代碼一定的實際意義,便於分類處理;一類是無意義的代碼,僅僅是賦予信息元素唯一的代號,便於對信息的操作。常用的代碼類型有:
(1)順序碼,即接信息元素的順序依次編碼;
(2)區間碼,即用一代碼區間代表某一信息組;
(3)記憶碼,即能幫助聯想記憶的代碼。
⑷ 信息編碼方式有哪些
編碼方式有哪些_簡述常用的編碼方式
1、ASCII碼
學過計算機的人都知道ASCII碼,總共有128個,用一個位元組的低7位表示,0~31是控制字元如換行回車刪除等;32~126是列印字元,可以通過鍵盤輸入並且能夠顯示出來。
2、ISO-8859-1
128個字元顯然是不夠用的,於是ISO組織在ASCII碼基礎上又制定了一些列標准用來擴展ASCII編碼,它們是ISO-8859-1~ISO-8859-15,其中ISO-8859-1涵蓋了大多數西歐語言字元,所有應用的最廣泛。ISO-8859-1仍然是單位元組編碼,它總共能表示256個字元。
3、GB2312
它的全稱是《信息交換用漢字編碼字元集基本集》,它是雙位元組編碼,總的編碼范圍是A1-F7,其中從A1-A9是符號區,總共包含682個符號,從B0-F7是漢字區,包含6763個漢字。
4、GBK
全稱叫《漢字內碼擴展規范》,是國家技術監督局為windows95所制定的新的漢字內碼規范,它的出現是為了擴展GB2312,加入更多的漢字,它的編碼范圍是8140~FEFE(去掉XX7F)總共有23940個碼位,它能表示21003個漢字,它的編碼是和GB2312兼容的,也就是說用GB2312編碼的漢字可以用GBK來解碼,並且不會有亂碼。
5、GB18030
全稱是《信息交換用漢字編碼字元集》,是我國的強制標准,它可能是單位元組、雙位元組或者四位元組編碼,它的編碼與GB2312編碼兼容,這個雖然是國家標准,但是實際應用系統中使用的並不廣泛。
6、UTF-16
說到UTF必須要提到Unicode(UniversalCode統一碼),ISO試圖想創建一個全新的超語言字典,世界上所有的語言都可以通過這本字典來相互翻譯。可想而知這個字典是多麼的復雜,關於Unicode的詳細規范可以參考相應文檔。Unicode是Java和XML的基礎,下面詳細介紹Unicode在計算機中的存儲形式。
UTF-16具體定義了Unicode字元在計算機中存取方法。UTF-16用兩個位元組來表示Unicode轉化格式,這個是定長的表示方法,不論什麼字元都可以用兩個位元組表示,兩個位元組是16個bit,所以叫UTF-16。UTF-16表示字元非常方便,每兩個位元組表示一個字元,這個在字元串操作時就大大簡化了操作,這也是Java以UTF-16作為內存的字元存儲格式的一個很重要的原因。
7、UTF-8
UTF-16統一採用兩個位元組表示一個字元,雖然在表示上非常簡單方便,但是也有其缺點,有很大一部分字元用一個位元組就可以表示的現在要兩個位元組表示,存儲空間放大了一倍,在現在的網路帶寬還非常有限的今天,這樣會增大網路傳輸的流量,而且也沒必要。而UTF-8採用了一種變長技術,每個編碼區域有不同的字碼長度。不同類型的字元可以是由1~6個位元組組成。
UTF-8有以下編碼規則:
如果一個位元組,最高位(第8位)為0,表示這是一個ASCII字元(00-7F)。可見,所有ASCII編碼已經是UTF-8了。
如果一個位元組,以11開頭,連續的1的個數暗示這個字元的位元組數,例如:110xxxxx代表它是雙位元組UTF-8字元的首位元組。
如果一個位元組,以10開始,表示它不是首位元組,需要向前查找才能得到當前字元的首位元組。
⑸ 信息的特徵有哪些,請舉例說明這些特徵
信息的十大特徵
1 可量度。信息可採用某種度量單位進行度量,並進行信息編碼。如現代計算機使用的二進制。
2可識別。信息可採取直觀識別、比較識別和間接識別等多種方式來把握。
3可轉換。信息可以從一種形態轉換為另一種形態。如自然信息可轉換為語言、文字和圖像等形態,也可轉換為電磁波信號或計算機代碼。
4可存儲。信息可以存儲。大腦就是一個天然信息存儲器。人類發明的文字、攝影、錄音、錄像以及計算機存儲器等都可以進行信息存儲。
5可處理。人腦就是最佳的信息處理器。人腦的思維功能可以進行決策、設計、研究、寫作、改進、發明、創造等多種信息處理活動。計算機也具有信息處理功能。
6可傳遞。信息的傳遞是與物質和能量的傳遞同時進行的。語言、表情、動作、報刊、書籍、廣播、電視、電話等是人類常用的信息傳遞方式。
7可再生。信息經過處理後,可以其他形式等方式再生成信息。輸入計算機的各種數據文字等信息、可用顯示、列印、繪圖等方式再生成信息。
8可壓縮。信息可以進行壓縮,可以用不同的信息量來描述同一事物。人們常常用盡可能少的信息量描述一件事物主要特徵。
9可利用。信息具有一定的實效性和可利用性。
10可共享。信息具有擴散性,因此可共享。
⑹ 計算機編碼的一般特徵
計算機編碼的一般特徵是採用二進制數據來編碼。由於電路的復雜性因素,電腦中都使用二進制數,只有0和1兩個數碼,逢二進一,最容易用電路來表達。
將數據轉換為代碼或編碼字元,並能譯為原數據形式。是計算機書寫指令的過程,程序設計中的一部分。在地圖自動制圖中,按一定規則用數字與字母表示地圖內容的過程,通過編碼,使計算機能識別地圖的各地理要素。
n位二進制數可以組合成2的n次方個不同的信息,給每個信息規定一個具體碼組,這種過程也叫編碼。
數字系統中常用的編碼有兩類,一類是二進制編碼,另一類是十進制編碼。
(6)信息編碼特點有哪些擴展閱讀
GB編碼標准中,比較常用的是GB2312和GBK兩種,GB2312是GBK的一個子集,GB2312編碼范圍是 0xA1A1 - 0xFEFE ,如果純粹的 GB2312編碼,處理起來是十分簡單的,但處理GBK字元集時有些小的提示。
GBK 採用雙位元組表示,總體編碼范圍為 8140-FEFE,首位元組在 81-FE 之間,尾位元組在 40-FE 之間。
總計 23940 個碼位,共收入 21886 個漢字和圖形符號,其中漢字(包括部首和構件)21003 個,圖形符號 883 個。
電腦中的一個字元大都是用一個八位數的二進制數字表示。這樣就有256個不同的數值,可以用來表示256個不同的字元。由於美標只規定了128個編碼,剩下的另外128個數碼沒有規范,各家用法不一。另外美標中的33個控制碼,各廠家用法也不盡一致。
⑺ 什麼是字元編碼 他們各有什麼特點
信息編碼標准化工作根據信息化管理需求用代碼表達事物(概念)或其特徵,並將其標識原則和方法以標准(規范)的方式進行發布和管理。該項工作是一項基礎性工作,影響面廣且深遠、推進難度大,具備如下4個基本特點。
1.信息編碼標准化本質上屬於高層次的標准化。
信息分類與編碼標准化解決的是數據層面的規范化問題,所以應該結合企業信息化總體工程進行統一規劃和部署,實現企業層面更廣泛的協調和統一, 為信息集成共享和資源整合優化鋪平道路。
2.信息編碼標准化涉及多專業和多學科。
信息分類編碼標准化涉及設計、製造、管理、計算機、標准等多個學科和專業,各學科和專業相互交叉、相互滲透,所以一個編碼方法往往需要計算機技術人員、工程技術人員和標准化人員共同研究確定,它不僅要反映信息組織與管理的模式,而且要求具有科學性與實用性,需要各有關單位、部門及專業人員大力協同工作實現。
3.信息編碼標准化工作具有全過程、全方位特點。
製造企業的信息編碼標准化工作范疇涵蓋從產品、零部件到原材料、設備、工裝等各種製造物資,從市場調查(軍工產品的立項論證)到產品設計、製造、裝配、試驗、定型、使用直至報廢的全過程,前端延伸到供應商,後端延伸到客戶,具有全過程、全方位的顯著特點。
4.信息編碼標准化工作以追求代碼統一(唯一)為目的。
在實際工作中,對具體事物(或概念)進行分類與編碼時,往往有多種方法可選,這些方法各有其優缺點,在很難判斷哪一種方法是最佳選擇時,追求代碼統一(唯一)成為主要目的,這時,企業應當盡快確定一種方法,立為標桿,形成標准統一發布和使用。
對於信息編碼標准化工作來講, 明確哪些信息對象需要編碼、收集和分析代碼的生成與使用要求等是該項工作關鍵的步驟,本文從企業業務、產品全生命周期和信息系統實施3個途徑探討企業信息編碼標准化需求的收集與分析過程。
⑻ 地籍信息編碼的內容與特點
數字地籍測量的基本原理 這里的首要問題是如何使各種地籍要素能為計算機所識別.地籍要素包
括反映隸屬關系的行政名稱、地理名稱和宗地名稱,反映權屬關系的界址點
和界址線,反映土地利用現狀的獨立地物、線狀地物和面狀地物,反映位置
關系的定位坐標,反映數量關系的土地佔有面積和土地利用面積,以及反映
地物特徵的某些說明、注記等.眾所周知,計算機只能識別數碼,因此必須
將地籍要素數字化.從地籍要素的圖形特徵和屬性特徵的分析說明,地籍要
素可分為兩類信息:一類是圖形信息,用平面直角坐標、編碼和連接信息表
示;另一類是屬性信息,用數碼文字表示.
一、地籍信息編碼
地籍信息編碼就是採用規定的代碼表示一定的地籍信息,從而簡化和方
便了對地籍信息的各種處理.在數字地籍測量中,地籍信息編碼是有效地組
織數據和管理數據的手段,它在數據採集、數據處理、資料庫管理及成果輸
出的全過程中都起著至關重要的作用.
測點的編碼問題是野外採集數據時的一個非常重要的問題.若僅僅有野
外採集點的觀測值,而對所測點不加任何屬性及幾何相關性的說明,那麼這
些點都是一些孤立點,在處理和加工野外採集的數據時,計算機不能對其進
行識別,也就無法進行數據處理.因此,在輸入觀測值到電子手簿或電子記
錄器的同時,應對每個測點賦予一個屬性及幾何相關性說明,即通常所說的
標識代碼(也稱編碼或特徵碼).
(一)地籍信息編碼的內容
地籍信息是一種多層次、多門類的信息,對地籍信息如何分類、編碼,
目前尚無充分的論證和統一的規定,根據有效組織數據和充分利用數據的原
則,對地籍信息的編碼至少考慮如下四個信息系列:
(1)行政系列.包括省(市)、市(地)、縣(市)、區(鄉)、村等有行
政隸屬關系的系列,這個系列的特點是呈樹狀結構.
(2)圖件系列.包括地籍圖、土地利用現狀圖、行政區劃圖、宗地圖
(即權屬界線圖)等.這些圖件均是地籍信息的重要內容.
(3)符號系列.包括各種獨立符號、線狀符號、面狀符號以及各種注
記.
(4)地類系列.包括土地利用現狀分類和城填土地利用現狀分類.
這里的首要問題是如何使各種地籍要素能為計算機所識別.地籍要素包 括反映隸屬關系的行政名稱、地理名稱和宗地名稱,反映權屬關系的界址點 和界址線,反映土地利用現狀的獨立地物、線狀地物和面狀地物,反映位置 關系的定位坐標,反映數量關系的土地佔有面積和土地利用面積,以及反映 地物特徵的某些說明、注記等.眾所周知,計算機只能識別數碼,因此必須 將地籍要素數字化.從地籍要素的圖形特徵和屬性特徵的分析說明,地籍要 素可分為兩類信息:一類是圖形信息,用平面直角坐標、編碼和連接信息表 示;另一類是屬性信息,用數碼文字表示. 一、地籍信息編碼 地籍信息編碼就是採用規定的代碼表示一定的地籍信息,從而簡化和方 便了對地籍信息的各種處理.在數字地籍測量中,地籍信息編碼是有效地組 織數據和管理數據的手段,它在數據採集、數據處理、資料庫管理及成果輸 出的全過程中都起著至關重要的作用. 測點的編碼問題是野外採集數據時的一個非常重要的問題.若僅僅有野 外採集點的觀測值,而對所測點不加任何屬性及幾何相關性的說明,那麼這 些點都是一些孤立點,在處理和加工野外採集的數據時,計算機不能對其進 行識別,也就無法進行數據處理.因此,在輸入觀測值到電子手簿或電子記 錄器的同時,應對每個測點賦予一個屬性及幾何相關性說明,即通常所說的 標識代碼(也稱編碼或特徵碼). (一)地籍信息編碼的內容 地籍信息是一種多層次、多門類的信息,對地籍信息如何分類、編碼, 目前尚無充分的論證和統一的規定,根據有效組織數據和充分利用數據的原 則,對地籍信息的編碼至少考慮如下四個信息系列: (1)行政系列.包括省(市)、市(地)、縣(市)、區(鄉)、村等有行 政隸屬關系的系列,這個系列的特點是呈樹狀結構. (2)圖件系列.包括地籍圖、土地利用現狀圖、行政區劃圖、宗地圖 (即權屬界線圖)等.這些圖件均是地籍信息的重要內容. (3)符號系列.包括各種獨立符號、線狀符號、面狀符號以及各種注 記. (4)地類系列.包括土地利用現狀分類和城填土地利用現狀分類.