A. 数据编码的常见编码
常见的数据编码方案有:单极性码、极性码、双极性码、归零码、双相码、不归零码、曼彻斯特编码、差分曼彻斯特编码、多电平编码、4B/5B编码。
单极性码:在这种编码方案中,只适用正的(或负的)电压表示数据。单极性码用在电传打字机接口以及PC机和TTY兼容的接口中,这种代码需要单独的时钟信号配合族悉携定时,否则当传送一长串0或1时,发送机和接收机的时钟将无法定时,单极性码的抗噪声特性也不好。
极性码:在这种编码中,分别用正和负电压表示二进制数“0”和“1”。这种代码的电平差比单极码大,因而抗干扰特性好,但仍需另外的时钟信号。
双极性码:信号在三个电平(正、负、零)之间变化。一种典型的双极性码就是信号反转交替编码(AMI)。在AMI信号中,数据流遇到“1”时使电平在正和负之间交替翻转,而遇到“0”时则保持零电平。
归零码:(Return to Zero,RZ)码元中间信号回归到零电平,比如从正电平到零电平的转换表示码元“0”,而从负电平到零电平表示码元“1”。
双相码:双相码要求每一位中都要有一个电平转换。因而这种代码的最大优点是自定时,同时双相码也有检测错误的功能,如果某一位中间缺少了电平翻转,则被认为是违例代码。
非归零电平编码(Non-Return to Zero Level,NRZ-L):不使用0电平陆升,用正电平表示“0”,负电平表示“1”。
非归零反相编码(Non-Return to Zero Inverted,NRZ-I):当“1”出现时电平翻转,当“0”出现时电平不翻转。这种代码也叫差分码。
曼彻斯特码(Manchester):高电平到低电平的转换边表示0,低电平到高电平的转换边表示1,位中间的电平转换边既表示数据代码,也作定时信号使用。曼彻斯特编码用在以太网中。
差分曼彻斯特码(Differential Manchester):也叫做相位编码(兆伏PE);常用于局域网传输。在曼彻斯特编码中,每一位的中间有一跳变,“0”表示位的开头有跳变,“1”表示位的开头没有跳变,位中间的跳变既作时钟信号,又作数据信号。
多电平编码:码元可取多个电平之一,每个码元可代表几个二进制位。
4B/5B编码:百兆位快速以太网的光纤分布式数据接口(FDDI,Fiber Distributed Data Interface)中采用的信息编码方案。这种编码的特点是将欲发送的数据流每4bit作为一个组,每四位二进制代码由5位编码表示,这5位编码称为编码组(code group),并且由NRZI方式传输。
B. 计算机的数据是以什么编码形式表示的
在电脑内部,所有数据都是以二进制编码形式表示的。
由于电路的复杂性因素,电脑中都使用二进制数,只有0和1两个数码,逢二进一,最容易用电路来表达,比如0代表电路不通,1代表电路通畅。我们平时用电脑时感觉不到它是在用二进制计算是因为电脑会把你输入的信息自动转换成二进制,算出的二进制数再转换成你能看到的信息显示到屏幕上弯陆。
二进制加法法则:和十进制加法法则相同,但由于二进制,只有0和1两个数码,因纤缓此必须逢二进一,口诀是:0+0=0,0+1=1,1+0=1,1+1=10。
二进制减法法则:和十进制减法法则相同,但某位不够减时,要向前一位借一作二。
二进制乘法口诀:0*0=0,0*1=0,1*0=0,1*1=1。
二进制除法法则:和十进制除法埋竖顷法则相同。
C. 计算机中数的表示一般采用什么编码方法
计算机中数的表示一般采用二进制编码方法,采用如册槐0和1来表示,8位的二进制数是1bit。
二进制是由1和0两个数字组成的。它可以表示两种状态,即开和关。这种状态可以由电位的高低来实现。计算机是由各种电渣友子元器件组成的。其中有一种重要的元件就是半导体即我们熟悉的二极管、三极管等。半导体可以通过它的开关状态来传递和处理信息。如果用其它的进制必将使计算机的制造和信息的处理更为复杂。所姿局以输入电脑的任何信息最终都要转化为二进制。目前通用的是ASCII码。最基本的单位为bit。
D. 计算机常用的信息编码有哪几种
计算机常用的编码有:ASCII码,汉字编码等
字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。
汉字进入计算机的三种途径:
①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。
②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。
③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。
以上内容参考:网络-汉字编码
E. 数据编码的常见编码
数据编码的目的是将数字数据转化成数字信号,以便在数字信道中传输。最常见的数据编码方式有三种:
(1)非归零码:数字编码的一种方式,分别用正负2种不同的电平来分别表示0和1。
要点:最简单,容易出错。
(2)曼彻斯特编码:数字编码的一种方式,在非归零码码元的正中间时间出现了一次电平跳变,这样接收方可以将此作为同步信号。数字0对应信号从低电平到高电平,数字1对应信号从高电平到低电平。
要点:中间跳变、同步信号,0低高、1高低
(3)差分曼彻斯特编码:数字编码的一种方式,在非归零码码元的正中间时间出现了一次电平跳变,这样接野此收方可以将此作为誉脊猛同庆桥步信号。数字0的起始电平与前一数字的结尾电平相反,发生跳变,数字1的起始电平与前一数字的结尾电平一致。
要点:曼彻斯特,0变1不变
F. 属性数据编码的原则、内容与方法是什么(15分)
属性数据编码一般包括部分、部分和部分三方面的内容。其编码一般应考虑高、好和方属便三个原则。
方法通常有缩写码、助记码、特征码、层次码。
通过编码可建立数据间的内在联系,便于计算机识别和管理。地理信息系统中主要的数据编码是服务于空间信息分析的地理编码。即为识别图形点、线、面或格网位置及属性而建立的编码方法,包括拓扑编码和坐标编码。
(6)数据元素命名用什么编码扩展阅读:
编码的主要目的是减少信息量,因为数据影响处理效率和精度,效率低主要是由于大量字符用于名称或描述,许多时间用于报告、录入、辨认及理解。更重要的是必须有足够空间存放那些字符及数字。这种低效率对手工操作及计算机处理都有很大影响。
另一方面,要提高计算机处理精度,必须实现数据项定义标准化。设计好的编码结构可以解决上述问题。例如一个三位数编码000-999,唯一并简洁标识1000个不同条目,明显比每一条用语言描述占用空间少。
G. mysql编码数据库,数据表,字段各用什么编码
1. ASCII
用途:用来映射简单的单字节字符,比如大小写英文字母、阿拉伯数字、常用的标点符、运算符、控制字符等。
编码范围:U+0000 - U+007F
注意:对于用这类字符的场景够用了,但是却无法表达比如汉字,日文等编码。
2. UNICODE
用途:用来映射包含 ASCII 以内的其他的所有字符。
编码范围:U+0000 - U+10FFFF
注意:ASCII 是 UNICODE 的子集,ASCII 编码的字符可以无损转换为 UNICODE 编码的字符。
MySQL 常用字符集
1. Latin1
Latin1 是 cp1252 或者 ISO-8859-1 的别名。ISO-8859-1 编码是单字节编码,向下兼容 ASCII。
编码范围:U+0000 - U+00FF
ISO-8859-1 收录的字符除 ASCII 收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。
单字节内的空间都被 ISO-8859-1 编码占用,所以能够用 ISO-8859-1 编码存储、传输其他任何编码的字节流。
比如把一个 Utf8mb4 的编码或者 GBK 的编码存入 Latin1,不会有任何问题。因为 Latin1 保留了原始的字节流,这也就是 MySQL 长期以来把 Latin1 做默认字符集的原因。
但是由于 Latin1 对任何字符都存放字节流,造成了字符个数的浪费。
比如:
CHAR(10) CHARACTER SET LATIN1;CHAR(10) CHARACTER SET UTF8;
该字段中存储字符个数 UTF8 是 Latin1 的三倍!!!
2. GB18030
GB18030 是中国官方标准字符集,向前兼容 GBK、GB2312,是这两个的超集。用 1、2、4 个字节分别表示一个符号。比如对一般中文字符,默认是用两个字节编码存储。Windows 系统,默认用的就是 GB18030。
若只是存储中文字符,那 GB18030 最佳。
原因有两点:
1)占用空间小,比如比 UTF8 小。
2)存储的汉字根据拼音来排序,检索快。
3. UTF8
UTF8 是 Unicode 的编码实现,可以存储 UNICODE 编码对应的任何字符, 这也是使用最多的一种编码。最大的特点就是变长的编码方式,用 1 到 4 个字节表示一个符号,可以根据不同的符号编码字节长度。
字母或数字用 1 字节,汉字用 3 字节,emoji 表情符号用 4 字节。UTF8 字符集目前是使用最广泛的。
注意!MySQL 里常说的 UTF8 是 UTF8MB3 的别名,UTF8MB3 是 UTF8MB4 的子集,UTF8MB4 才是真正的 4 字节 UTF8 字符集!
UTF8MB3 表示最大支持 3 个字节存储字符,UTF8MB4 表示最大 4 个字节存储字符。根据实际需要和未来展望,MySQL 8.0 已经默认用 UTF8MB4 基础字符集。
H. 计算机内部处理数据和指令的编码是什么
计算机内部处理数据和指令的编码是二毁拦扮进制编码。二进制编码是一种使用0和1表纤灶示数字和字符的编码方式,它是计算机内部处理数据和指令的基础。在计算机内部,所有衡竖的数据和指令都以二进制编码的形式存储和处理。计算机通过对二进制编码的操作来完成各种任务,包括运算、存储、传输等。
I. 数据元素命名比较适合哪种分类编码方法
元素命名: 一局棚耐、以地名命名 这类元素不少,约占了总数的近四分之一。这些元素的中文名称基本上都是从拉丁文名称的第一桐春(或第二)音节音译而来,采用的是谐声造字法。如: 镁—拉丁文和神意是“美格里西亚”,为一希腊城市。