U外八辅字整理第一批,附带一些八辅外、U外地名字

U外八辅字整理第一批,附带一些八辅外、U外地名字

先说点与题目无关的,我一直很想写篇文章说一说的。

首先,我想说这些地名用字早就应该提交,其中的八辅(《信息技术 信息交换用字符集 第八辅助集》【SJ/T 11239-2001】,2001年制定的行业标准)字更是如此。当年G源以一句“难以逐个找证据”放弃了向unicode(统一码,官方介绍网址:What is Unicode? in Simplified Chinese)提交,致使很多字现在电脑仍无法显示。如果说第一次撤回提交可以理解,但是拖了16年,错过了几次提交,这是无论如何也说不过去的

试想,如果就是你的身份证上有电脑无法显示的汉字,办银行卡,办驾驶证都需要先开证明才能办成;所有的电脑除非使用公安局字库(涉密,公安系统使用)或者自造字库否则无法显示,这有多不方便?然而如此重要的汉字却一直少有人来考证

以我的经历,我承认,考证这些字很有难度,但绝非不可能完成的任务,即使不可能找到全部,也应该尽力去找,专门去找,不能无所作为。

除此之外,我想说一下地名用字标准化的问题。我认为,地名用字是该标准化,但标准化的方式不应该是改,而是收。收,是为方便人民办事;改,是让人民为办事提供方便。并且我国幅员辽阔,文化丰富多彩,自然村众多,改不可能彻底,还会造成大量地域性文化的流失。80年代进行的地名标准化已经很好地说明了这个问题。县以上改的很彻底(乡镇级并没有,有下石太乡,直到扩展G都应该不会收录),然而后来又改回来了不少;行政村及以上改的比较彻底,而自然村生僻字遗留严重。这就造成了一个很尴尬的局面:生僻字仍大量存在(注意是大量),相关文化散失严重,自然村名中的生僻字更加难以考证和收录。对于这种标准化,我认为,不做也罢,不能因为无知,所以无畏,对于所谓的生僻字,只是你不认识,并不代表它用的不广,就应该被改。这就好比一些书上的知识你不懂,你应该做的是学,而不是把书用涂改液或者修正带抹了。

来看一看这个字:⿵门外(扩展E,U+2CBA1) 这个字直到扩展E(2015年6月正式发布)才收,你能说它影响的人不多吗?即使是一个自然村,也有十几口几十口人,他们办事有多不方便呢?然而还有很多地名字没有被unicode收录,而八辅就是这些字的一个大集合。


@Kushim Jiang 的统计,《信息技术 信息交换用字符集 第八辅助集》中的2501个字,截止到扩展E,还未被unicode收录1308字。乐观估计截止到扩展G大概会有900―1000个仍不能被收录,这就意味着直到扩展G这些字电脑仍然无法显示,4-6年内电脑仍然无法显示,4-6年内他们办银行卡、学车等等仍然要先开证明。如果下次提交期再错过,那就是更久的时间。然而已经错过了16年。

这些字我以前在汉典论坛发过一次,但并未有几人重视。
除了这些字,我还整理了其它的一些,具体数量请见我的U外地名用字整理总结:U外地名用字整理总结 - 知乎专栏其余的我会在日后整理发表。
如果你想问我为什么非要考证这些汉字,我只能引用英国登山家乔治·马洛里的一句话回答:“因为它就在那”。
已经说的够多,下面是我的第一批整理。




谨以此希望能让更多人关注Unicode,了解unicode;能让更多人了解八辅、重视八辅。

编辑于 2017-04-30

文章被以下专栏收录

    《信息用交换字符集-第八辅助集》,简称八辅,其中收录了大量地名用字,但由于向Unicode提交汉字的G源(中国源)“以难以逐个找证据”为由撤回了向Unicode(统一码协会)提交的众多的八辅字,致使很多地名用字直到现在仍无法用电脑显示。本专栏所发布的内容主要致力于考证这些字的读音、字义、用例等信息,并探究这些汉字所承载的文化。本专栏内容包括但不限于八辅,作者也可以在此发表有关八辅外U外地名字以及其它有关地名生僻字的内容。 本专栏所有内容未经作者本人同意,一概不允许转发或者引用!