『壹』 漢字區位碼分別用十進制的區號和位號范圍是什麼
漢字區位碼分別用十進制的區號和位號范圍是區位碼的區號是1-94,位號是1-94。一個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的"區位碼"。在漢字的區位碼中,高兩位為區號,低兩位為位號。
在區位碼中,01-09區為682個特殊字元,16~87區為漢字區,包含6763個漢字 。其中16-55區為一級漢字(3755個最常用的漢字,按拼音字母的次序排列),56-87區為二級漢字(3008個漢字,按部首次序排列)。
簡介
所謂漢字編碼,就是採用一種科學可行的辦法,為每個漢字編一個唯一的代碼,以便計算機辨認、接收和處理。在此介紹的是《國家標准信息交換漢字編碼》。
這種編碼經過加工整理一律以漢語拼音的字母為序,音節相同的字以使用頻率為序,其查找方法與一般漢語字典的漢字拼音音節索引查找法相同。
『貳』 中國國家標准漢字信息交換編碼是
中國國家標准漢字信息交換編碼是GB2312-80。
GB2312-80是中國人民共和國國家標准漢字信息交換用編碼,習慣上稱為國際碼、GB碼或區位碼。
信息交換用漢字編碼字元集和漢字輸入編碼之間的關系是,根據不同的漢字輸入方法,通過必要的設備向計算機輸入漢字的編碼,計算機接收之後,先轉換成信息交換用漢字編碼字元,這時計算機就可以識別並進行處理;漢字輸出是先把機內碼轉成漢字編碼,再發送到輸出設備。
(2)漢字信息交換碼有多少個區擴展閱讀
GB2312收錄簡化漢字及符號、字母、日文假名等共7445個圖形字元,其中漢字佔6763個。GB2312規定「對任意一個圖形字元都採用兩個位元組表示,每個位元組均採用七位編碼表示」,習慣上稱第一個位元組為「高位元組」,第二個位元組為「低位元組」。
GB2312將代碼表分為94個區,對應第一位元組;每個區94個位,對應第二位元組,兩個位元組的值分別為區號值和位號值加32(2OH)。01-09區為符號、數字區,16-87區為漢字區,10-15區、88-94區是有待進一步標准化的空白區。
GB2312將收錄的漢字分成兩級: 第一級是常用漢字計3755個,置於16-55區,按漢語拼音字母/筆形順序排列;第二級漢字是次常用漢字計3008個,置於56-87區,按部首/筆畫 順序排列。故而GB2312最多能表示6763個漢字。
『叄』 漢字信息處理過程中需要使用哪些漢字編碼各自的作用是什麼
輸入碼(數字編碼,拼音編碼,字形編碼)區位碼,國標碼,機內碼,字形碼(點陣和矢量)以及其他編碼:GBK碼,BIG5碼,通用字元集和Unicode。
作用:
輸入碼:為了直接用西文標准鍵盤將漢字輸入計算機
區位碼和國標碼:計算機內部處理的信息,都是用二進制代碼表示的,漢字也不例外。而二進制代碼使用起來是不方便的,於是需要採用信息交換碼。區位碼是國標碼的另一種表現形式,把國標GB2312--80中的漢字、圖形符號組成一個94×94的方陣,分為94個「區」,每區包含94個「位」,其中「區」的序號由01至94,「位」的序號也是從01至94。94個區中位置總數=94×94=8836個,其中7445個漢字和圖形字元中的每一個佔一個位置後,還剩下1391個空位,這1391個位置空下來保留備用。
機內碼:計算機內部加工處理漢字所用的編碼,無論什麼輸入法輸入的漢字,在存入存儲器時都將其轉化為統一的機內碼。
字形碼:用於在顯示器或列印機上輸出各種字體,字型大小的文字和符號。