作为一个非营利性组织,Unicode Consortium 致力于开发、拓展和促进相关全球化标准的采用。联盟成员中有许多企业和组织代表,且其中不少来自计算机和信息处理行业。而在 15.0 新标准中,Unicode 联盟继续实施了针对核心规范、附件和数据文件的改进 —— 为其引入了 4489 个新字符,且总数达到了 14 万 9186 个。
首先,本次新增内容包括了两组新脚本(总计 161 个)、20 个新的表情符号(Emoji)、以及 4393 个中日韩(CJK)表意文字。
其次,Unicode 15.0 版本中的新脚本和字符增加了对更多现代语言的支持:
● 包括在印度地区使用的 Nag Mundari;
● 在印度使用的 Kannada 字符(用于书写 Konkani、Awadhi 和 Havyaka Kannada);
● 以及由阿拉斯加卡克托维克的伊努皮亚克人设计、用于因纽特语和尤皮克语的 Kaktovik 数字。
新增的 20 个表情符号,包括发夹(hair pick)、沙锤(maracas)、水母(jellyfish)、khanda(印度的一种古老武器)、以及粉色爱心(pink heart)。
其它新增符号还包括:
● 九颗尖白星(巴哈伊信仰者使用)
● 八个天体符号(天文学家和占星者使用)
● 29 个额外的埃及象形文字(格式控件)
针对其它语言和学术工作的支持:
● 在东南亚发现的历史文字 Kawi(用于书写古爪哇语和其它语言)
● 三个附加的阿拉伯文字(土耳其使用的古兰经标记)
● 三个 Khojki 字符(在手写和印刷文件中被发现)
● 十个梵文字符(用于表示在土耳其发现的吉祥标志铭文和手稿)
● 六个拉丁字母(马拉雅拉姆语的音译使用)
● 63 个西里尔字母修饰符(音标中使用)
重要的图表字体更新:
● 一组埃及象形文字(除了支持文本中旋转字形的标准化变体序列外)
● 统一加拿大土著音节的字形(为 Carrier 和其它语言提供更好的支持)
● 一套 Wancho 新字体(具有改进和简化的形状)
● 针对中日韩(CJK)语言的更新添加:
● H 块中的 CJK 统一表意文字扩展(4192 个字符)
● C 块中的一个统一表意文字扩展
最后,Unicode 属性和规范决定了文本在计算机(包括手机)上的行为,以下 15.0 版新标准的重要更新。
【UAX #9】Unicode 双向算法,修改了 UAX9-C2 中的注释,以强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
【UAX #31】Unicode 标识符与模式参数,提供更多关于默认标识符配置文件的指导,阐明标识符中默认可忽略代码点的使用,并讨论 Pattern_White_Space 与编程语言中的双向排序问题之间的关系。
【UAX #38】Unicode Han 数据库,增加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别变更为字典索引、扩展 kKangXi 属性,并且加入了第 3.0、3.10 和 4.5 节。
【UTS #39】Unicode 安全机制,将零宽度连接符(ZWJ)和零宽度非连接符(ZWNJ)字符从 Identifier_Status=Allowed 变更为 Identifier_Status=Restricted,默认情况下的通用安全配置文件将不再允许。
【UAX #45】U-Source 语义符,在其数据文件中记录了新的表意文字、添加了 ExtH 作为新状态、改进现有 CJK 统一表意文字块的状态标识符、并添加了第 2.5 节。
【UTS #46】Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况、并添加了有关新 IDNA 派生属性数据文件的文档。