站长之家 - 业界 2022-09-20 18:45

Unicode联盟正式发布15.0标准 添加4489个新字符

作为一个非营利性组织,Unicode Consortium 致力于开发、拓展和促进相关全球化标准的采用。联盟成员中有许多企业和组织代表,且其中不少来自计算机和信息处理行业。而在 15.0 新标准中,Unicode 联盟继续实施了针对核心规范、附件和数据文件的改进 —— 为其引入了 4489 个新字符且总数达到了 14 万 9186 个。

首先,本次新增内容包括了两组新脚本(总计 161 个)、20 个新的表情符号(Emoji)、以及 4393 个中日韩(CJK)表意文字

其次,Unicode 15.0 版本中的新脚本和字符增加了对更多现代语言的支持:

● 包括在印度地区使用的 Nag Mundari;

● 在印度使用的 Kannada 字符(用于书写 Konkani、Awadhi 和 Havyaka Kannada);

● 以及由阿拉斯加卡克托维克的伊努皮亚克人设计、用于因纽特语和尤皮克语的 Kaktovik 数字。

新增的 20 个表情符号,包括发夹(hair pick)、沙锤(maracas)、水母(jellyfish)、khanda(印度的一种古老武器)、以及粉色爱心(pink heart)。

其它新增符号还包括:

● 九颗尖白星(巴哈伊信仰者使用)

● 八个天体符号(天文学家和占星者使用)

● 29 个额外的埃及象形文字(格式控件)

针对其它语言和学术工作的支持:

● 在东南亚发现的历史文字 Kawi(用于书写古爪哇语和其它语言)

● 三个附加的阿拉伯文字(土耳其使用的古兰经标记)

● 三个 Khojki 字符(在手写和印刷文件中被发现)

● 十个梵文字符(用于表示在土耳其发现的吉祥标志铭文和手稿)

● 六个拉丁字母(马拉雅拉姆语的音译使用)

● 63 个西里尔字母修饰符(音标中使用)

重要的图表字体更新:

● 一组埃及象形文字(除了支持文本中旋转字形的标准化变体序列外)

● 统一加拿大土著音节的字形(为 Carrier 和其它语言提供更好的支持)

● 一套 Wancho 新字体(具有改进和简化的形状)

● 针对中日韩(CJK)语言的更新添加:

● H 块中的 CJK 统一表意文字扩展(4192 个字符)

● C 块中的一个统一表意文字扩展

最后,Unicode 属性和规范决定了文本在计算机(包括手机)上的行为,以下 15.0 版新标准的重要更新。

【UAX #9】Unicode 双向算法,修改了 UAX9-C2 中的注释,以强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。

【UAX #31】Unicode 标识符与模式参数,提供更多关于默认标识符配置文件的指导,阐明标识符中默认可忽略代码点的使用,并讨论 Pattern_White_Space 与编程语言中的双向排序问题之间的关系。

【UAX #38】Unicode Han 数据库,增加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别变更为字典索引、扩展 kKangXi 属性,并且加入了第 3.0、3.10 和 4.5 节。

【UTS #39】Unicode 安全机制,将零宽度连接符(ZWJ)和零宽度非连接符(ZWNJ)字符从 Identifier_Status=Allowed 变更为 Identifier_Status=Restricted,默认情况下的通用安全配置文件将不再允许。

【UAX #45】U-Source 语义符,在其数据文件中记录了新的表意文字、添加了 ExtH 作为新状态、改进现有 CJK 统一表意文字块的状态标识符、并添加了第 2.5 节。

【UTS #46】Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况、并添加了有关新 IDNA 派生属性数据文件的文档。

推荐关键词

24小时热搜

查看更多内容

大家正在看