系统中 zh-cn 与 zh-hans 等众多语言编码都有什么区别

原创
2022/02/06 18:19
阅读数 83


一、语言标签格式规则

        语言文字标签书写顺序:
 

language-extlang-script-region-variant-extension-privateuse
语言文字种类-扩展语言文字种类-变体(或方言)-使用区域-变体(或方言)-扩展-私有

        “zh”是中文,代表的是宏语言(Macrolanguage),单独使用表示“中文”整体,可以是方言、文言文、简体、繁体等单独一种,也可以是任意组合的混合内容。“zh-CN”理论上表示的是“中文 (中国大陆)”,因为中国大陆的官方语言是“普通话 (简体)”,所以这个“zh”的局限性就体现出来了:比如“尋尋覓覓,冷冷清清,悽悽慘慘戚戚”,用“zh-CN”描述没法表达出“繁體”和“文言文”,但描述成“zh-TW”则成了“中文 (繁體, 台灣)”,虽然指明了“繁体”,但还是没能体现出“文言文”,同时还丢失了“中国大陆”。
        语言文字标签示例:

language:
fr 法语
es 西班牙语

language-extlang:
zh-lzh 中文 (文言文)
sgn-csl 手语 (中国大陆)

language-script:
cmn-Hans 普通话 (简体)
yue-Hant 粤语 (繁体)

language-region:
zh-CN 简体中文, 中国大陆
en-US 英语 ,美国
zh-HK 繁体中文,香港特别行政区
zh-MO 繁体中文,澳门特别行政区
zh-SG 繁体中文,新加坡-
zh-SG 简体中文,新加坡
zh-TW 繁体中文,台湾

language-script-region:
cmn-Hans-CN 普通话 (简体, 中国大陆)
cmn-Hant-TW 普通话 (繁体, 台湾)

language-script-variant:
zh-Latn-pinyin 汉语拼音(例:nǐ,拉丁字母形式)
zh-Bopo-pinyin 注音拼音(例:ㄋ丨ˇ,罗马字形式,中国大陆 1958 年以前使用,台湾目前使用)

        常见的一般有 language、language-script 和 language-region 三种。
        为了方便辨识和识别,通常还有约定:
 

language:主语言,用代码“zh”表示汉语,规范全小写,通常两位,最新规范三位

以下两种写法均正确,后者描述更精准,但大部分程序和操作系统都只能识别前者,使用新标准可能会造成无法匹配浏览器用户定义字体、网页翻译、程序语言自动切换等功能,为了兼容性的考量,推荐使用前者:
zh-CN 中文 (简体, 中国大陆)  对应 cmn-Hans-CN 普通话 (简体, 中国大陆)
zh-SG 中文 (简体, 新加坡)   对应 cmn-Hans-SG 普通话 (简体, 新加坡)
zh-HK 中文 (繁体, 香港)     对应 yue-Hant-HK 粤语 (繁体, 香港)
zh-MO 中文 (繁体, 澳门)     对应 yue-Hant-MO 粤语 (繁体, 澳门)
zh-TW 中文 (繁体, 台湾)     对应 cmn-Hant-TW 普通话 (繁体, 台湾)


extlang:规范全小写、三位;翻译成“扩展的语言”。 表示扩展语言对于汉语而言,这个部分表示的是普通话和方言。比如“cmn”表示普通话,“yue”表示粤语等

cmn 普通话(官话、国语)
wuu 吴语(江浙话、上海话)
czh 徽语(徽州话、严州话、吴语-徽严片)
hak 客家语
yue 粤语(广东话)
nan 闽南语(福建话、台语)
cpx 莆仙话(莆田话、兴化语)
cdo 闽东语
mnp 闽北语
zco 闽中语
gan 赣语(江西话)
hsn 湘语(湖南话)
cjy 晋语(山西话、陕北话)


script:书写格式,首字母大写,四位,表示变体;汉语不存在西方语言的拼写变化,只有“简体”和“繁体”之分。比如,“Hans”表示简体,“Hant”表示繁体
region:全大写,两位,表示用于地区,跟汉语有关的地区大概就是中国大陆(CN)、中国台湾(TW)、中国香港(HK)、中国澳门(MO)、新加坡(SG)这五处

 

二、 zh-CN 和 zh-Hans 区别

        这是两种不同分类方式下的两种不同的东西。在做运营国际化时通常要对指定地区进行特定的翻译,例如同样是繁体中文,TW和HK的翻译可能就有差别。简体中文也分中国大陆和新加坡,其中用法习惯差别可能更大。

    zh-CN 表示(language - country/region)用在中国大陆区域的中文。包括各种大方言、小方言、繁体、简体等等都可以被匹配到。
    zh-Hans 表示(language - script)简体中文。适用区域范围是全宇宙用中文简体的地方,内容包括各种用简体的方言等。

 

三、zh-CHS/zh-Hans 和 zh-CHT/zh-Hant的关系

zh-CHS 是单纯的简体中文

zh-CHT 是单纯的繁体中文

zh-Hans和zh-CHS相同相对应

zh-Hant和zh-CHT相同相对应

 

--------------------------------------

版权声明:本文为【PythonJsGo】博主的原创文章,转载请附上原文出处链接及本声明。

博主主页:https://my.oschina.net/u/3375733

本篇文章同步在个人公众号:

 

 

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
0
分享
返回顶部
顶部