代码页都有哪些

代码页有:1、OEM(IBM PC)代码页;2、Windows(ANSI)代码页;3、中日韩语言代码页;4、其他代码页;5、Windows操作系统中使用的代码页。其中,OEM(IBM PC)代码页有437、737、850、852、855、857等。

代码页都有哪些-Worktile社区

1、OEM(IBM PC)代码页

  • 437—最初的IBM PC代码页,实现了扩展ASCII字符集
  • 737—希腊语
  • 850—「多语言(Latin-1)」(西欧语言)
  • 852—「斯拉夫(Latin-2)」(中欧及东欧語言)
  • 855—西里尔(Cyril)字母
  • 857—土耳其语
  • 858—带欧元符号的「多语言」
  • 860—葡萄牙语
  • 861—冰岛语
  • 863—法语加拿大英语
  • 865—北欧
  • 866—西里尔(Cyril)字母
  • 869—希腊语(两者为表示希腊字符的两种不同字符集)
  • 737—希腊语(两者为表示希腊字符的两种不同字符集)

2、Windows(ANSI)代码页

Windows代码页最初是根据ANSI草案实现的,这个草案最终成为ISO 8859-1。这是Windows代码页被称作ANSI的缘由。

  • 874—泰文字母
  • 1250—东欧拉丁字母
  • 1251—古斯拉夫语
  • 1252—西欧拉丁字母ISO-8859-1.
  • 1253—希腊语
  • 1254—土耳其语
  • 1255—希伯来语
  • 1256—阿拉伯语
  • 1257—巴尔
  • 1258—越南
  • 1254—土耳其语

Windows-1252与ISO-8859-1并不完全一致。ISO-8859-1在0x80-0x9F范围的控制字符,在Windows-1252中被可打印字符取代。由于在web网页中,ASCII控制字符不起作用,所以网页一般用Windows-1252代码页标记替代ISO-8859-1标记。

3、中日韩语言代码页

既是OEM代码页,也是Windows代码页。

  • 20936 —简体中文(GB2312)
  • 936 —简体中文(GBK)
  • 54936 —简体中文(GB18030)
  • 950 —繁体中文(大五码)
  • 932 —日文(Shift_JIS)
  • 949 —韩文(EUC-KR)

4、其他代码页

  • 10000—Macintosh Roman encoding(followed by several other Mac character sets)
  • 10007— Macintosh Cyrillic encoding
  • 10029—Macintosh Central European encoding
  • 1200—UCS-2LEUnicode小端序
  • 1201—UCS-2BEUnicode大端序
  • 65000—UTF-7Unicode
  • 65001—UTF-8Unicode

5、Windows操作系统中使用的代码页

Windows平台上的GUI程序使用ANSI代码页,而在控制台程序使用OEM代码页(以便向后兼容)。这意味着,如果在记事本程序(notepad.exe)打开一个8位字符集编码的文本文件,将使用ANSI代码页;如果在命令行中用type命令显示这个文本文件的内容,将使用OEM代码页。这两个代码页在前128个字符的编码是一样的,但后128个字符的编码可能不一致。在Windows的命令行窗口通过标记、复制操作把一部分文本内容复制到记事本程序中,实际上是把Unicode格式的内容保存在剪贴板,使得这种文本复制保持了字符编码的透明转换。

对于Windows操作系统中的命令行窗口(Command Prompt),chcp命令在没有参数时,显示当前代码页;chcp命令带一个整数参数,则改变命令行窗口的当前代码页为参数所指定。

延伸阅读

OEM代码页转换为ASCII代码页

对于中日韩的多字节编码的代码页,OEM代码页与ASCII代码页相同,例如对于简体中文的OEM代码页与ASCII代码页就是GBK代码页。而对于单字节编码的代码页,如英语、俄语等,OEM代码页与ASCII代码页一般不同。这是因为在MS-DOS时代,计算机只能使用字符界面在屏幕上画出表格的框线,所以OEM代码页要在单字节字符集中包含方框绘制字符;此外,OEM代码页437提供的有限的变音符号,只能覆盖法语、西班牙语、德语、意大利语、瑞典语的字母表。而在Windows的早期时代,仍然使用单字节字符集,这时就舍弃了这些不必要的方框绘制字符,取而代之的是丹麦语、挪威语、冰岛语、加拿大法语的变音符号。为此,一个用OEM代码页的字节流要在Windows上正确显示,就需要或者显式设定使用OEM代码页;或者要显式把OEM代码页的字节流转化为ASCII代码页的字符流,这需要使用Windows系统调用OemToChar()。

文章标题:代码页都有哪些,发布者:Z, ZLW,转载请注明出处:https://worktile.com/kb/p/33684

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Z, ZLW的头像Z, ZLW

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部