使用Python库判断字符是否在字体里

在TrueFont字体里,使用Unicode来标记字符,但是Unicode是一个非常庞大的集合,所以考虑到适用性,一些字体只会选取Unicode的某一类字符设计字体,比如英文字体通常没有汉字,汉鼎简中黑-站长字体里的汉鼎简中黑字体没有数字。

在Python编程环境中,我使用Pillow (PIL Fork) 3.0.0 documentation进行字体的绘制,然而查阅文档我发现,如果字体没有某字符的话,仍然是能够绘制的,但是绘制的结果是一片空白。排除这种情况一个很直观的做法就是判断绘制的图片是不是一片白色,但我认为这种做法不是那么elegant,这里我试着从字体除法去判断字符是否在字体里。


这里需要利用FontTools及字体文件结构的信息,有兴趣的可以参考Michael:解决了困扰了一个礼拜的一个坑,只在Windows下可以使用的一个字体终于可以在Linux下使用了

使用的库就是FontTools,可以这样安装:

pip install fontTools

安装后输入如下代码:

from fontTools.ttLib import TTFont
fontType = os.path.join("fonts", "KyhotaOne.ttf")

font = TTFont(fontType)
uniMap = font['cmap'].tables[0].ttFont.getBestCmap()

打印uniMap,得到如下信息:

{32: 'space', 33: 'exclam', 34: 'quotedbl',...}

可以看到,key代表的unicode的int值,value代表unicode的名字。比如32: 'space'就表示unicode=32表示space。

知道这个信息后,就可以这样来判断字符是否在字体里了:

print (ord('1') in uniMap.keys())
print (ord('A') in uniMap.keys())
print (ord('一') in uniMap.keys())

结果是:

True
True
False


【2019年5月15日更新】

感觉很多字体真像无良字体,明明没有一些字符非要加到表里,结果就是按照上述方法打印出来是空白的,如果你观察其glyf表的话,是没有contour的。

这种情况最好判定下cmap里面的内容在glyf表里是否有对应的contour,我一般是这么处理的:

glyfMapDict = TTFont(fontType)['glyf']
len(glyfMapDict[ord('1')].getCoordinates(0)[0])

如果长度为0表示该字体是没有用的,反之可以用。


【已完结】

编辑于 2019-06-15

文章被以下专栏收录