计算机常用信息编码有哪些

计算机常用信息编码有:1、ASCII码;2、unicode;3、UTF-8;4、GB2312;5、GBK;6、BIG5;7、GB18030;8、HZ码。ASCII码是指,美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

计算机常用信息编码有哪些-Worktile社区

1、ASCII码

ASCII (American Standard Code for Information Interchange):美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准 ISO/IEC 646。ASCII名列前茅次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。

ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等。
  • ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
  • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。
  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
  • 在标准ASCII中,其较高位(b7)用作奇偶校验位。
  • 后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。

2、unicode

统一码(Unicode),也叫万国码、单一码,由统一码联盟开发,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且少数的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

统一码是一种在计算机上使用的字符编码,1990年开始研发,1994年正式公布。随着计算机工作能力的增强,统一码也在面世以来的十多年里得到普及。统一码是基于通用字符集(Universal Character Set)的标准来发展,同时也以出版物的形式(The 统一码 Standard,目前第五版由Addison-Wesley Professional出版,ISBN-10: 0321480910)对外发表。

3、UTF-8

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的名列前茅个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部分修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来区分UTF-16或UTF-32文本。UTF-8是字节顺序无关的。它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。

4、GB2312

GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。

把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。

GB 2312的“分区”(每区含有94个汉字/符号)

  • 01-09区为特殊符号。
  • 16-55区为一级汉字,按拼音排序。
  • 56-87区为二级汉字,按部首/笔画排序。
  • 10-15区及88-94区则未有编码。
  • 举例来说,“啊”字是GB2312之中的名列前茅个汉字,它的区位码就是1601。

5、GBK

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的名列前茅个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。2000年已被GB18030-2000《信息交换用 汉字编码字符集 基本集的扩充》国家强制标准替代。 [2] 2005年GB18030-2005发布,替代了GB18030-2000。

GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容。ISO 10646.1 是该标准的名列前茅部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。

6、BIG5

Big5,又称为大五码或五大码,是使用繁体中文(正体中文)社区中最常用的电脑汉字字符集标准,共收录13,060个汉字。Big5虽普及于台湾、香港与澳门等繁体中文通行区,但长期以来并非当地的国家/地区标准或官方标准,而只是业界标准。倚天中文系统、Windows繁体中文版等主要系统的字符集都是以Big5为基准,但厂商又各自增加不同的造字与造字区,派生成多种不同版本。

7、GB18030

GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030-2005共收录汉字70,244个。

特点

  • 采用变长多字节编码,每个字可以由1个、2个或4个字节组成。
  • 编码空间庞大,非常多可定义161万个字符。
  • 完全支持Unicode,无需动用造字区即可支持中国国内少数民族文字、中日韩和繁体汉字以及emoji等字符。

8、HZ码

HZ 码是中国留学生为了使汉字信息能在网络上直接传送而产生的。因目前大多数 (西方)网络系统为7位,较高位被屏蔽掉,因此 GB 码无法被直接传输,HZ 码是为了达到在7位网络系统中直接传递汉字信息的目的而规范的。

“HZ”方案的特点,是以“纯国标”的中文与美标码混用。那么“HZ”是怎样区分国标符和美标符的呢?答案其实也很简单:当一串美标码中间插入一段国标码的时候,我们便在国标码的前面加上~,后面加上~。这些附加码分别叫“逃出码”和“逃入码”。 由于这些附加码本身也是美标形象码,整个文件就俨然是一个美标文本文件,可以安然地 在电脑网上传递,也和大部分英文文本处理软件兼容。

延伸阅读

计算机中的编码

在计算机硬件中,编码(coding)是指用代码来表示各组数据资料,使其成为可利用计算机进行处理和分析的信息。代码是用来表示事物的记号,它可以用数字、字母、特殊的符号或它们之间的组合来表示。将数据转换为代码或编码字符,并能译为原数据形式。是计算机书写指令的过程,程序设计中的一部分。在地图自动制图中,按一定规则用数字与字母表示地图内容的过程,通过编码,使计算机能识别地图的各地理要素。

文章标题:计算机常用信息编码有哪些,发布者:Z, ZLW,转载请注明出处:https://worktile.com/kb/p/35472

(1)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年1月13日 下午1:51
下一篇 2023年1月13日 下午2:58

相关推荐

  • 半监督学习和few shot的区别在哪里

    半监督学习和few shot的区别在:1、数据标注;2、模型训练;3、应用场景。半监督学习是一种利用带标签数据和无标签数据进行模型训练的方法。Few-shot学习是一种处理少样本学习问题的方法,其目标是通过少量样本(通常为1到5个)来进行模型训练和预测。 一、数据标注 半监督学习:半监督学习是一种利…

    2023年7月30日
    7500
  • 云计算与大型超级计算机的区别联系

    区别:云计算是分布式计算的一种,通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。超级计算机是指能够执行一般个人电脑无法处理的大量资料与高速运算的电脑。

    2023年2月13日
    45100
  • 研发管理用什么软件

    研发管理用的软件有:1、JIRA;2、Confluence;3、Trello;4、Asana;5、GitLab。JIRA是一种非常流行的软件研发管理工具,提供了丰富的功能,例如缺陷跟踪、项目管理、工作流程管理、报告和分析等。 研发管理软件是一种帮助企业实现高效管理研发过程的工具。在现代企业中,研发管…

    2023年3月2日
    12400
  • 资产管理APP开发有什么作用

    资产管理APP开发有什么作用:1、资金记录;2、每日额度;3、超支提醒;4、管理计划;5、未来计划。资金记录是指,app会自动帮助用户记录下每笔资金的进入与支出,对于每一笔资金的动向都能够心知肚明。 一、资产管理app开发有什么作用 1、资金记录 app会自动帮助用户记录下每笔资金的进入与支出,对于…

    2023年6月3日
    5800
  • 冒烟测试和回归测试的区别

    冒烟测试和回归测试的区别是:冒烟测试主要是在新版本发布后,对其最基本的功能进行测试,保证最基本流程能走通,以便进行后续的测试回归测试主要是验证之前版本产生的所有缺陷已全部被修复和确认修复这些缺陷没有引发新的缺陷。

    2023年1月31日
    56500
  • 软件开发包括哪些方面

    软件开发包括:1、需求捕捉;2、需求分析;3、设计;4、编码;5、测试;6、维护。 换句话说,软件开发就是一系列最终构建出软件产品的活动。其中需求捕捉是一个市场调查和头脑风暴阶段的过程。在公司开发软件之前,它需要进行广泛的市场调查,以确定产品的可行性。 一、需求捕捉 需求捕捉是一个市场调查和头脑风暴…

    2023年5月8日
    20600
  • 项目管理机构组成表怎么填

    步骤:1、确定项目管理机构;2、填写基本信息;3、填写部门或岗位信息;4、填写项目团队成员信息;5、填写其他信息。在填写项目管理机构组成表之前,需要先确认项目管理机构的组织结构。 1、确定项目管理机构 在填写项目管理机构组成表之前,需要先确认项目管理机构的组织结构。通常情况下,项目管理机构应该包括以…

    2023年2月27日
    56900
  • 什么网址可以知识共享

    以下网址可以知识共享:一、中国知网;二、好知网;三、百度传课;四、粉笔网;五、多贝网。中国知网知识发现网络平台-面向海内外读者提供中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源统一检索、统一导航、在线阅读和下载服务。 一、中国知网 中国知网知识发现网络平台-面向海内外读者提供中…

    2023年3月19日
    7700
  • java oa系统有哪些模块

    java oa系统有以下模块:一、个人事务模块;二、工作流模块;三、行政事务模块;四、人力资源模块;五、公文档案管理模块;六、EPR管理模块;七、CMS管理模块;八、系统管理模块。个人事务模块有内部邮件、手机短信管理、消息管理、提醒设置、微讯群管理等。 一、个人事务模块 内部邮件、手机短信管理、消息…

    2023年3月31日
    8000
  • 什么是网页cookie

    Cookie,有时也用其复数形式 Cookies。类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。 一、什么是网页cookie Cookie,有时也用其复数形式 Cookies。类型为“小…

    2023年6月3日
    4600

发表回复

登录后才能评论
联系我们
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部