汉字
首发于汉字
汉字科普网站推荐(一)——小学堂

汉字科普网站推荐(一)——小学堂

今天笔者给大家推荐的网站名为「小学堂」,它的地址是:→小學堂

小学堂是一个集字形、字音、字义为一体的综合文字学资料库。这也是笔者最常用的古文字字形检索网站(没有之一)。

这个资料库是由台湾当地研究机构和高校共同研发而成的,权威性上有保证(当然,原始资料、书籍大多数是大陆过来的);同时这个资料库有政府经费补助,研究机构和高校的技术支持(无论是文字学专业技术,还是计算机技术),定期更新扩充后续资料,所以它也代表了古文字学的最新研究成果。

在古文字字形方面,目前小学堂主要收录了甲骨文、金文、楚系简帛文字、秦系简牍文字以及说文小篆字形(其中秦系简牍文字是后加的,所以笔者乐观预计以后可能还有更多古文字资料库(比如陶文、砖文、货币文字、汉代玺印文字以及战国文字中的三晋文字、齐文字、燕文字等等)扩充进来),算是全世界最全最新的面向公众的古文字检索资料库。

以下摘录自官方简介:

「小學堂文字學資料庫」是一個形、音、義綜合的文字學資料庫,可提供使用者根據文字的形、音等屬性先檢索出字頭,再透過字頭連接到個別的形、音、義資料庫或字書索引。

本資料庫由行政院國家科學委員會經費補助,臺灣大學中國文學系、中央研究院歷史語言研究所、資訊科學研究所共同開發;臺灣大學整合聲韻資料,中央研究院整合字形資料及開發檢索系統。

本資料庫收錄的字形涵蓋甲骨文、金文、戰國文字(瑾昀按,戰國文字資料庫目前包括楚系簡帛文字、秦系簡牘文字兩个子資料庫)、小篆及楷書,總數超過十八萬字;收錄的聲韻資料涵蓋上古、中古、近代及現代,總數超過一百萬筆;收錄的字書索引資料則超過二十五萬筆。

本資料庫主要由漢字古今字資料庫及漢字古今音資料庫組成。漢字古今字資料庫由甲骨文、金文、楚系簡帛文字(瑾昀按:這份簡介沒有更新,所以沒有列出後加的「秦系簡牘文字」)、小篆、異體字表資料庫組成,而漢字古今音資料庫則由上古音、中古音、官話、晉語、吳語、徽語、贛語、湘語、閩語、粵語、平話、客語、其他土話資料庫組成,各資料庫除可互相連結外,也可獨立使用。

说了这么久了,下面大家跟着笔者实作一次吧。

我们以「泱泱中華」的「中」字为例。

我们在「字形」栏中键入「中」字,接着点击「確定送出」提交请求。(为了方便大陆用户,输入简化字也是可以的,因为资料库检索默认开启了简繁转换。如需关闭简繁转换,可以在检索栏下方的「選項」中进行设置)

接着我们便跳转到了这个页面。对于研究古文字字形的同仁来说,这个页面中最重要的就是笔者画线的部分。

我们可以点击小篆金文甲骨文楚系簡帛文字秦系簡牘文字以跳转到「中」字的各类古文字字形的资料库做进一步查询。

同时我们可以依照下方给出的「相關索引」,按图索骥,快速定位到包含「中」字的文字学著作的相关页面(这个笔者在以后的书籍推荐中还会提到)。至于图书,这个检索网站并不提供,诸位可以自行去网上搜索电子版,或者去图书馆借阅(大多文字学书籍太过昂贵,动辄上千,不建议购买),或者向我索要 PDF 档(如果我有的话)。这个查阅书籍的过程,必不可少。因为字形资料库只提供了最基本的古文字字形,而相关学者对此的考释、解读就只能落实到书籍上了。笔者在文字学研习网站推荐(序)中提到的「拿着个网上扒下来的『甲骨文』就开始大谈『造字本意』」的「民间科学家」,指的就是这类光顾着看古文字字形,而不看古文字学家考释、解读的人。针对甲骨文、金文和战国文字的考释,笔者推荐《甲骨文字诂林》、《金文诂林》(含补篇)、《战国古文字典》一读(小学堂都有相关索引)。

(「中」字楚系簡帛文字的相关资料,含古文字字形,以及相关书籍索引。另外每个古文字字形在下方还有列明出处(如郭店楚简、上博简、望山楚简等等))

对于初学者而言,「中」字的字形演變页面也相当有用。这个页面中,资料库按照时间顺序列出了「中」字具有代表性的古文字字形,并且引用了《汉语大字典》的字形解释(主要依《说文解字》,如果《说文解字》有明显错误,则补充近现代文字学家的考释)。(此处笔者就不截图了)

-

以上部分,是笔者对「小学堂」的检索流程做的一个简单的 demo。下面笔者针对古文字隶定字中的缺字问题,介绍一下「小学堂」是如何解决的。

比如甲骨文中的常见字「?」(⿰柰又),直到 Unicode 8.0 才为他安排编码,这也为古文字的电子化检索带来了不便。

在录入这种生僻的缺字时,我们可以在字形框中用半角括弧()包住缺字的部件,如 「?」字则键入「(柰又)」,即可跳转到相关页面,效果如下:

-

关于「小学堂」的介绍,就到此结束了。接下来笔者谈谈除「小学堂」之外,人民群众普遍使用的两个网站,并对此做出客观评价。

在问题汉字叔叔的研究是否属于民科范畴?(题主似乎是因看到我昨天的序文然后过来提问的),@波斯基 老师的回答也道出了我的心声。

我对汉字叔叔的精神,是百分百钦佩的。但是我并不经常使用他的网站。原因如下:

  1. 汉字叔叔所扫描的《甲骨文编》和《金文编》,是上个世纪中叶的作品。这两套古文字编放在今天看来,有很多漏释、误释的成份,已经不太适合今天的古文字学研究。过时的说法,会把不明所以的研究者引向歧途。(所以请不要忽略古文字学家从上个世纪至今的所有劳动成果,抱着上个世纪的书不放)
  2. 汉字叔叔并没有对古文字中的缺字(比如笔者提到的「?」字),做出很好的处理。这也是专业人士与爱好者制作的索引系统的最大不同。
  3. 汉字叔叔的网站,只列出了从《甲骨文编》、《金文编》、《六书通》、《说文解字》上摘录下来的古文字字形,并没有把古文字学家的考释列上来(哪怕是索引都没有),客观上助长了「民间科学家」漠视古文字学家的劳动成果,自行歪解、戏说汉字的行径。
  4. 古文字学的新兴学科——简帛学,研究的是战国、秦汉时期的简帛文字。而这种文字,上接两周金文,下启汉代隶书,是当今古文字学研究的热门和重点所在。 汉字叔叔使用的,仍然是上个世纪的文字学资料,所以对于战国简帛文字这一块,完全没涉及,不能不说是个巨大的遗憾。另一方面,也助长了「民间科学家」事事以「甲骨文」、「金文」为本,漠视简牍文字字形的事实。(或许他们根本不知道有这个东西吧)
  5. 检索系统长时间缺少专人维护,存在很明显的错误。如「夏」的甲骨文,明显是「秋」的古文字形错放了字头。如「春」的甲骨文,也是极不可信。

汉字叔叔所扫描的四本书中,真正对笔者有用的,只有 《六书通》这一本。因为这本书是明末清初的学者撰写的古文字编,搜集的是古代(自汉代以降)发现的先秦文字字形。鉴于这本书的特殊性质,已经没有再作更新的必要,所以现代人引用《六书通》是没问题的。但是《甲骨文编》、《金文编》,面向的是近现代考古发掘出来的出土文献资料,这类书籍是要跟着文字学的研究成果常常更新的(至少十年一更新)。

所以各位要是把汉字叔叔的「字源网」用作「小学堂」的补充的话,只要看《六书通》即可,其他古文字字形最好不要轻易相信。

汉典是笔者经常使用的网站之一,不过笔者只用他来查现代各地区字形对比。因为汉典不太适合查询古文字字形。其理由如下:

  1. 字形太少,每种字形(甲骨文、金文、小篆)才一个,不足以反映问题。这方面汉字叔叔的字源网做得好多了,当然笔者推荐用小学堂。另外汉典也有和汉字叔叔一样的通病,没有战国文字字形。
  2. 有错放字头的情况,客观上会误导使用者。比如「冑」「胄」不分、「喦」「嵒」不分、「萑」「雈」不分(另参:查《说文解字》不可尽信「汉典」
  3. 汉典所列的小篆,有部分现代字体公司制作的字体,完全没学术参考价值。比如这个楷书阶段才形成的「乒」字,汉典竟然列出了小篆字形(经考察,为方正小篆):

笔者的个人建议是,如果没有足够分辨真伪的能力,应该使用小学堂。若有分辨真伪的能力,而且有时候为了图方便(毕竟是大陆网站,访问速度更快,不容易被墙),用用也未尝不可。

编辑于 2016-06-03

文章被以下专栏收录