计算机常用信息编码有哪些

计算机常用信息编码有:1、ASCII码;2、unicode;3、UTF-8;4、GB2312;5、GBK;6、BIG5;7、GB18030;8、HZ码。ASCII码是指,美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

计算机常用信息编码有哪些-Worktile社区

1、ASCII码

ASCII (American Standard Code for Information Interchange):美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准 ISO/IEC 646。ASCII名列前茅次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。

ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等。
  • ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
  • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。
  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
  • 在标准ASCII中,其较高位(b7)用作奇偶校验位。
  • 后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。

2、unicode

统一码(Unicode),也叫万国码、单一码,由统一码联盟开发,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且少数的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

统一码是一种在计算机上使用的字符编码,1990年开始研发,1994年正式公布。随着计算机工作能力的增强,统一码也在面世以来的十多年里得到普及。统一码是基于通用字符集(Universal Character Set)的标准来发展,同时也以出版物的形式(The 统一码 Standard,目前第五版由Addison-Wesley Professional出版,ISBN-10: 0321480910)对外发表。

3、UTF-8

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的名列前茅个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部分修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来区分UTF-16或UTF-32文本。UTF-8是字节顺序无关的。它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。

4、GB2312

GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。

把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。

GB 2312的“分区”(每区含有94个汉字/符号)

  • 01-09区为特殊符号。
  • 16-55区为一级汉字,按拼音排序。
  • 56-87区为二级汉字,按部首/笔画排序。
  • 10-15区及88-94区则未有编码。
  • 举例来说,“啊”字是GB2312之中的名列前茅个汉字,它的区位码就是1601。

5、GBK

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的名列前茅个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。2000年已被GB18030-2000《信息交换用 汉字编码字符集 基本集的扩充》国家强制标准替代。 [2] 2005年GB18030-2005发布,替代了GB18030-2000。

GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容。ISO 10646.1 是该标准的名列前茅部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。

6、BIG5

Big5,又称为大五码或五大码,是使用繁体中文(正体中文)社区中最常用的电脑汉字字符集标准,共收录13,060个汉字。Big5虽普及于台湾、香港与澳门等繁体中文通行区,但长期以来并非当地的国家/地区标准或官方标准,而只是业界标准。倚天中文系统、Windows繁体中文版等主要系统的字符集都是以Big5为基准,但厂商又各自增加不同的造字与造字区,派生成多种不同版本。

7、GB18030

GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030-2005共收录汉字70,244个。

特点

  • 采用变长多字节编码,每个字可以由1个、2个或4个字节组成。
  • 编码空间庞大,非常多可定义161万个字符。
  • 完全支持Unicode,无需动用造字区即可支持中国国内少数民族文字、中日韩和繁体汉字以及emoji等字符。

8、HZ码

HZ 码是中国留学生为了使汉字信息能在网络上直接传送而产生的。因目前大多数 (西方)网络系统为7位,较高位被屏蔽掉,因此 GB 码无法被直接传输,HZ 码是为了达到在7位网络系统中直接传递汉字信息的目的而规范的。

“HZ”方案的特点,是以“纯国标”的中文与美标码混用。那么“HZ”是怎样区分国标符和美标符的呢?答案其实也很简单:当一串美标码中间插入一段国标码的时候,我们便在国标码的前面加上~,后面加上~。这些附加码分别叫“逃出码”和“逃入码”。 由于这些附加码本身也是美标形象码,整个文件就俨然是一个美标文本文件,可以安然地 在电脑网上传递,也和大部分英文文本处理软件兼容。

延伸阅读

计算机中的编码

在计算机硬件中,编码(coding)是指用代码来表示各组数据资料,使其成为可利用计算机进行处理和分析的信息。代码是用来表示事物的记号,它可以用数字、字母、特殊的符号或它们之间的组合来表示。将数据转换为代码或编码字符,并能译为原数据形式。是计算机书写指令的过程,程序设计中的一部分。在地图自动制图中,按一定规则用数字与字母表示地图内容的过程,通过编码,使计算机能识别地图的各地理要素。

文章标题:计算机常用信息编码有哪些,发布者:Z, ZLW,转载请注明出处:https://worktile.com/kb/p/35472

(1)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Z, ZLWZ, ZLW认证作者
上一篇 2023年1月13日 下午1:51
下一篇 2023年1月13日 下午2:58

相关推荐

  • 什么是pc编程

    什么是PC编程? PC编程是指在个人计算机(Personal Computer)平台上进行的软件编程活动。1、通过使用特定的编程语言;2、编写可供计算机理解和执行的指令集合;3、最终实现特定功能的过程。例如,Windows平台常用的编程语言包括C++、C#,而Linux则广泛使用Python和She…

    2024年4月26日
    1000
  • linux音频编程是什么

    Linux音频编程是通过在Linux操作系统上编写程序来控制和处理音频数据的技术。1、它包括从硬件层面的音频捕捉和播放控制,到软件层面的音频信号处理,还涉及音频数据的编解码、混音、效果处理等多个方面。例如,在开发一个音乐播放器软件时,开发者需要使用Linux音频编程的技术来实现音乐文件的解码播放、音…

    2024年4月26日
    700
  • 如何在远程工作环境中保持研发效能

    在当前的职场环境中,远程工作成为了一种普遍模式,然而,维持和提升研发效能依然是众多企业追求的目标。主要策略有1、明确目标和期望;2、使用正确的工具和平台;3、建立有效的沟通机制;4、制定团队协作协议;5、追踪进度和绩效;6、关注员工福祉。实施这些策略能够帮助远程研发团队保持清晰的方向,利用合适的技术…

    2023年11月17日
    24100
  • ERP系统在供应链管理中的作用是什么

    企业资源规划(ERP)系统在供应链管理中的作用主题是提升整个供应链的透明度、效率以及协同工作能力。ERP系统的核心观点围绕数据整合、流程自动化、实时信息共享、成本控制和决策支持这五个方面展开。ERP系统通过整合供应链中的各个环节,如1、采购管理、2、库存控制、3、需求预测、4、订单处理、5、物流协调…

    2023年11月27日
    45900
  • 需求池怎么建立

    建立需求池的步骤是:一、产品需求整理;二、产品需求分类;三、划分产品需求优先级;四、构建产品需求池。需求整理是整个需求管理的第一步,完整记录原始需求。虽然不是所有的需求都会进需求池的,但要尽量保证完善的记录反馈结果。 一、产品需求整理 需求整理是整个需求管理的第一步,完整记录原始需求。虽然不是所有的…

    2023年3月31日
    65400
  • MBO与OKR有什么区别

    MBO和OKR的区别有:1、目标制定方式不同;2、结果评估方式不同;3、透明度不同;4、频率不同;5、驱动方式不同;6、适用场景不同。目标制定方式不同指的是MBO侧重于上下级之间的目标制定,而OKR则强调的是全员参与目标制定。结果评估方式不同指的是MBO注重的是结果的实现,只有达成目标,才能算是完成…

    2023年7月13日
    88400
  • devops适合什么人群

    DEVOPS适合何种人群 DevOps之流行,非偶然。本质上,它呈现出一种新型的信息技术实践,旨在突破传统软件开发和技术运维之间的壁垒。而针对DevOps的适合人群,关键因素分别为:1、对自动化持开放态度;2、喜好跨学科学习;3、能够在压力下维持高效沟通;4、具备解决问题的能力。尤其第一点,对自动化…

    2024年3月26日
    8100
  • 人力资源如何支持员工健康和福祉

    人力资源在支持员工健康和福祉方面扮演着重要角色,涉及以下几个方面:1、创建健康的工作环境;2、提供健康和福利计划;3、促进工作与生活平衡;4、提供心理健康支持;5、鼓励健康的生活方式。例如,在提供心理健康支持方面,人力资源部门可以设置员工援助计划,为员工提供心理健康的咨询和支持服务。 1、创建健康的…

    2023年8月21日
    55100
  • 如何用表格管理生产项目

    在管理生产项目时,使用表格工具可以极大地提高效率和精准性。表格的主要优点包括:便于数据整理、便捷的信息检索、高效的资源分配、以及实时的进度跟踪。通过将复杂的项目信息系统化,表格提供了一个清晰的视图,帮助项目经理监控和调整生产过程。特别要提出的是,高效的资源分配是表格管理中不可或缺的一部分。合理的资源…

    2024年4月10日
    6000
  • 项目风险评估与管理方法

    项目风险评估与管理是确保项目成功的关键因素。本文将探讨其核心观点:1、风险识别;2、风险分析;3、风险评估;4、风险应对;5、风险监控。 首先,项目组需通过全面识别潜在风险来开始风险管理过程,确保隐患可被提前发现并处理。接着,对已识别风险进行定性与定量分析,以明确风险可能带来的影响及发生概率。评估步…

    2023年11月16日
    52400

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部