gb2312简体中文编码表

概述

GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。但对于人名、古汉语等方面出现的罕用字和繁体字,GB2312不能处理,因此后来GBK及GB18030汉字字符集相继出现以解决这些问题。

分区表示

GB2312字符集构成一个94行、94列的二维表,行号称为区号,列号称为位号,每一个汉字或符号在码表中的位置用它所在的区号和位号来表示。这种表示方式也称为区位码。

  • 01-09区为特殊符号。
  • 16-55区为一级汉字,按拼音排序。
  • 56-87区为二级汉字,按部首/笔画排序。
  • 10-15区及88-94区则未有编码。

编码原则

  1. 小于127的字符意义与原来ASCII码表字符意义相同,127之后的奇异符号们(即EASCII)取消。
  2. 两个大于127的字符连在一起时,就表示一个汉字,这样我们就可以组合出大约7000多个简体汉字了,原因后面有详细说明。
  3. 汉字用两个字节表示,每个字节用七位码,且每个字节高位为0,前面的一个字节(高字节)从0xA1用到0xF7,后面一个字节(低字节)从0xA10xFE
  4. 国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码
  5. 在这些编码里,还把数学符号、罗马希腊的字母、日文的假名们都编进去了,连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这就是常说的全角字符,而原来在127号以下的那些就叫半角字符了。

举例来说,字是GB2312之中的第一个汉字,它的区位码就是1601,如字在二维代码表中处于17区第3位,区位码即为1703

编码详细说明

国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为(以下数字后的D表示为10进制数字,H则表示此数字为16进制,B表示为字节byte):

  1. 先将十进制区码和位码转换为十六进制的区码和位码。
  2. 这样就得了一个与国标码有一个相对位置差的代码。
  3. 再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码,相当于如果不转换的话,在两个字节上分别加上32即可。

如:字的国标码为3123H,它是经过下面的转换得到的:1703D => 1103H => +2020H => 3123H

国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如字,国标码为31H和23H,而西文字符1#的ASCII也为31H23H,现假如内存中有两个字节为31H23H,这到底是一个汉字,还是两个西文字符1#呢?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:

将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,也就是如果国标码是16进制的,直接加上8080H即可。

如:由上面我们知道,字的国标码为3123H,前字节为00110001B,后字节为00100011B高位改110110001B10100011B即为B1A3H,因此,字的机内码就是B1A3H,其国标编码为%b1%a3

汉字机内码的每个字节都大于128,通过这样的设计就解决了与西文字符的ASCII码冲突的问题。

公式总结

区位码 + 2020H = 国标码国标码 + 8080H = 机内码

码表

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0   · ˉ ˇ ¨ -
A1B0
A1C0 ± × ÷
A1D0
A1E0 ° ¤ §
A1F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A2A0
A2B0
A2C0
A2D0
A2E0
A2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0
A3B0
A3C0
A3D0 _
A3E0
A3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A4A0
A4B0
A4C0
A4D0
A4E0
A4F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A5A0
A5B0
A5C0
A5D0
A5E0
A5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A6A0 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
A6B0 Π Ρ Σ Τ Υ Φ Χ Ψ Ω
A6C0 α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
A6D0 π ρ σ τ υ φ χ ψ ω
A6E0 ︿
A6F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A7A0 А Б В Г Д Е Ё Ж З И Й К Л М Н
A7B0 О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
A7C0 Ю Я
A7D0 а б в г д е ё ж з и й к л м н
A7E0 о п р с т у ф х ц ч ш щ ъ ы ь э
A7F0 ю я
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A8A0 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ
A8B0 ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ ń ň ǹ
A8C0 ɡ
A8D0
A8E0
A8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A9A0
A9B0
A9C0
A9D0
A9E0
A9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AAA0
AAB0
AAC0
AAD0
AAE0
AAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ABA0
ABB0
ABC0
ABD0
ABE0
ABF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ACA0
ACB0
ACC0
ACD0
ACE0
ACF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ADA0
ADB0
ADC0
ADD0
ADE0
ADF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AEA0
AEB0
AEC0
AED0
AEE0
AEF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AFA0
AFB0
AFC0
AFD0
AFE0
AFF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B0A0
B0B0
B0C0
B0D0
B0E0
B0F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B1A0
B1B0
B1C0
B1D0
B1E0 便
B1F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B2A0
B2B0 簿
B2C0
B2D0
B2E0
B2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B3A0
B3B0
B3C0
B3D0 齿
B3E0
B3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B4A0 穿
B4B0 椿
B4C0
B4D0 蹿
B4E0
B4F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B5A0
B5B0
B5C0
B5D0
B5E0 殿
B5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B6A0
B6B0
B6C0
B6D0
B6E0
B6F0 饿
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B7A0
B7B0
B7C0 仿 访
B7D0 忿
B7E0
B7F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B8A0
B8B0
B8C0 竿
B8D0
B8E0 稿
B8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B9A0
B9B0
B9C0
B9D0
B9E0 广
B9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BAA0
BAB0
BAC0
BAD0
BAE0 鸿
BAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BBA0
BBB0 怀
BBC0
BBD0 贿
BBE0
BBF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BCA0
BCB0
BCC0
BCD0
BCE0
BCF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BDA0
BDB0
BDC0 轿
BDD0
BDE0
BDF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BEA0
BEB0
BEC0
BED0
BEE0
BEF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BFA0
BFB0
BFC0
BFD0
BFE0
BFF0 岿
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C0A0
C0B0
C0C0
C0D0
C0E0
C0F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C1A0
C1B0
C1C0
C1D0
C1E0
C1F0 窿
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C2A0
C2B0 鹿
C2C0 绿
C2D0
C2E0
C2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C3A0
C3B0
C3C0
C3D0
C3E0
C3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C4A0
C4B0
C4C0
C4D0
C4E0
C4F0 尿
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C5A0
C5B0
C5C0
C5D0
C5E0
C5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C6A0
C6B0
C6C0
C6D0
C6E0
C6F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C7A0
C7B0
C7C0
C7D0
C7E0
C7F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C8A0
C8B0
C8C0
C8D0
C8E0
C8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C9A0
C9B0
C9C0
C9D0
C9E0
C9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CAA0 湿
CAB0 使
CAC0
CAD0 寿
CAE0
CAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CBA0
CBB0
CBC0
CBD0 宿
CBE0
CBF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CCA0
CCB0
CCC0
CCD0
CCE0
CCF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CDA0
CDB0
CDC0 退
CDD0
CDE0
CDF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CEA0
CEB0
CEC0
CED0
CEE0
CEF0 西
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CFA0
CFB0
CFC0
CFD0 线
CFE0
CFF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D0A0
D0B0
D0C0
D0D0
D0E0
D0F0 婿
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D1A0
D1B0
D1C0
D1D0 沿
D1E0
D1F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D2A0 耀
D2B0
D2C0
D2D0 亿
D2E0
D2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D3A0
D3B0
D3C0
D3D0
D3E0 屿
D3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D4A0
D4B0
D4C0
D4D0
D4E0
D4F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D5A0
D5B0
D5C0
D5D0
D5E0
D5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D6A0
D6B0
D6C0
D6D0
D6E0
D6F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D7A0
D7B0
D7C0 姿
D7D0
D7E0
D7F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D8A0 廿 丿
D8B0
D8C0
D8D0
D8E0
D8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D9A0
D9B0
D9C0
D9D0
D9E0
D9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DAA0
DAB0
DAC0 诿
DAD0
DAE0
DAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DBA0
DBB0
DBC0
DBD0
DBE0
DBF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DCA0
DCB0
DCC0
DCD0
DCE0
DCF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DDA0
DDB0
DDC0
DDD0
DDE0
DDF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DEA0
DEB0
DEC0
DED0
DEE0
DEF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DFA0
DFB0
DFC0
DFD0
DFE0
DFF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E0A0
E0B0
E0C0
E0D0
E0E0
E0F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E1A0
E1B0
E1C0
E1D0
E1E0
E1F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E2A0
E2B0
E2C0
E2D0
E2E0
E2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E3A0
E3B0
E3C0
E3D0
E3E0
E3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E4A0
E4B0
E4C0 涿
E4D0
E4E0
E4F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E5A0
E5B0
E5C0
E5D0
E5E0
E5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E6A0
E6B0
E6C0
E6D0
E6E0 驿
E6F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E7A0
E7B0
E7C0
E7D0
E7E0
E7F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E8A0
E8B0
E8C0
E8D0
E8E0
E8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E9A0
E9B0
E9C0 槿
E9D0
E9E0
E9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EAA0
EAB0
EAC0
EAD0
EAE0
EAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EBA0
EBB0
EBC0
EBD0
EBE0
EBF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ECA0
ECB0
ECC0
ECD0
ECE0
ECF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EDA0
EDB0
EDC0
EDD0
EDE0
EDF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EEA0
EEB0
EEC0
EED0
EEE0
EEF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EFA0
EFB0
EFC0
EFD0
EFE0
EFF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F0A0
F0B0
F0C0
F0D0
F0E0
F0F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F1A0
F1B0
F1C0
F1D0
F1E0
F1F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F2A0
F2B0
F2C0
F2D0
F2E0
F2F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F3A0
F3B0
F3C0
F3D0
F3E0
F3F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F4A0
F4B0
F4C0
F4D0
F4E0 羿
F4F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F5A0
F5B0
F5C0 趿
F5D0
F5E0
F5F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F6A0
F6B0
F6C0 鱿
F6D0
F6E0
F6F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F7A0
F7B0
F7C0
F7D0
F7E0
F7F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F8A0
F8B0
F8C0
F8D0
F8E0
F8F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F9A0
F9B0
F9C0
F9D0
F9E0
F9F0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FAA0
FAB0
FAC0
FAD0
FAE0
FAF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FBA0
FBB0
FBC0
FBD0
FBE0
FBF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FCA0
FCB0
FCC0
FCD0
FCE0
FCF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FDA0
FDB0
FDC0
FDD0
FDE0
FDF0
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FEA0
FEB0
FEC0
FED0
FEE0
FEF0

References

  1. https://zh.wikipedia.org/zh-cn/GB_2312
  2. http://www.cnblogs.com/skynet/archive/2011/05/03/2035105.html
  3. http://www.knowsky.com/resource/gb2312tbl.htm
  4. https://zh.wikipedia.org/wiki/GB_18030
  5. GBK汉字内码扩展规范
  6. 输入码、区位码、国标码与机内码关系简介