【体育与语言3】外语人名音译转写的规范化讨论——总论

【体育与语言3】外语人名音译转写的规范化讨论——总论

【体育与语言】系列

宋宁世:【体育与语言1】体育运动中外名称用语考

宋宁世:【体育与语言2】世界各国足球联赛名称考

分论部分①辅音篇

【体育与语言3】外语人名音译转写的规范化讨论——辅音篇

分论部分②元音篇

【体育与语言3】外语人名音译转写的规范化讨论——元音篇


引言

“体育与语言”这个系列的宗旨,是挖掘我们在中文语境下所接触的体育信息与其原文语境有何具体差别,在这个系列的前两篇里,我们涉及的其实是同样的话题——由于汉语比较排斥音译,导致对于体育领域的一些专有名词概念,汉语进行了大量的意义转换,使得使用汉语的我们在接受同一件事物时,可能无法很快还原回原来的语境。这篇文章,我们就把眼光放到汉语音译系统上,讨论一下,在必须使用音译来翻译外语概念的时候,我们该要如何应对。

毫无疑问,体育圈子中文语境中接触外语音译的频率最高的爱好圈,我们需要处理大量的外国人名、地名、球队名,这之中又以接触范围遍及西方每一门主流语言的足球圈子为甚。在足球圈子里,一个经久讨论的话题,就是外国人名的“正音运动”,从早年的“亨利/昂立”“温格/旺热”和“哈维”的问题,到现在,已经陆续有从欧洲各民族的文化背景出发的人名读法科普出现,像“里杰卡尔德”这种著名的翻译错误已经能为人所知。

不过本文并不讨论外国人名该怎么读这个问题,本文的主题是我们说的汉语本身,即在知道了外国人名的正确读音的前提下,如何用汉语普通话读音的汉字来把它写出来?

这个问题在互联网时代的重要性显而易见——互联网主流媒介是文字,我们如果想要通过互联网查找外国人名、地名,得保证起码的命中准确率,比如在搜索引擎中输入“没息”,即便读音能近似阿根廷足球运动员Messi,但搜索引擎不会给你任何Messi的信息。对于汉字这套不表音的文字系统,一套让全中国人都能准确地描述“Messi”这名运动员的规范,这更是至关重要的。

这篇文章讨论范围不仅限于体育的领域,简单说是类似“特朗普”还是“川普”的广泛问题,本文的“规范化”讨论,旨在根据当今中文媒体界外语人名、地名转写的现状进行一点总结,并讨论一些与语言有关的问题。


总论——外来语音译转写的问题

学过日、韩语的同学都知道,当代的日、韩语中外来语入侵之势剧烈,大量直接音译自以英语为主的外语的词汇充斥着日常生活。但中国人对于这种外来概念直接音译的处理方式显示出了很大的不适应,也很难理解日、韩语中的音译词泛滥的现象。在“体育与语言”系列的上一篇里我们也看到,中文对音译高度排斥,以致用自己的术语给全世界足球联赛重新起了一套的名字,而日韩则全部是音译(以致中超的名字都是英语)。

为什么中文如此不喜欢音译?主要原因可能是,中文对于读音的处理,长期以来一直是“标音”而非“记音”。从古代的反切法,到注音符号,再到汉语拼音,中文所做的一直是在给出视觉提示——汉字的前提下,说出这个符号的读音,而不是在给出听觉提示的前提下来记录下该读音。这使得中文习惯于一字一音一意,而很不适应音译时多个没有意义的字堆叠在一起的这种不平衡的表达,只有人名、地名这些养成了整体理解习惯的事物例外。而日韩在发展出本民族的记音符号后,能相对接受这种不协调感,可以适应大量的外来概念转写。

但是中文的字音意合一系统仍然有一个副作用——不适合处理“同位异音”(allophone)问题。对于这个语言学概念本文不细讲,只要举几个例子就能明白了。比如an这个韵母,普通话中安、单、山等字发音是符合规律的/an/,但当an前面有介音i(y)时,组合出的烟、颠、仙等字的an韵母要发成/ɛn/,这个音对应于世界上很多语言的en。但是,如果我们要转写其他语言中的/ɛn/,普通话虽然有这个音,却无法单独抽出来使用,因为这个音必须跟一个介音i,只能退而使用近似音“安”或“恩”。很多时候,取近似还是取带枝节的原音,这导致了音译转写的分歧。

另一个问题则是,单靠汉字进行转写,前提是某个音得要有这一个字。但有时候,由于历史演变,或是某些读音本来就没产生,使得某些声韵母组合即便我们可以用拼音拼出来,现实中却并没有这么一个字。以i这个元音为例,在普通话音系中,fi、gi、ki、hi等拼读不存在,zhi、shi、zi、si等又有同位异音变化,这使得以字为单位的转写存在很大限制。


简单统计分析

作为直观的讨论,我从2014年世界杯除去日本和韩国之外的30支国家队的名单中,汇总了所有球员的中文译名。名单来自中国媒体的官方报道(2014年巴西世界杯32强最终大名单--体育--人民网),世界杯名单给我们提供了非常丰富的样本,基本涵盖了世界上的主流语言,30支球队的所有球员的全名一共有3400来字,我把出现次数超过5次的字按出现的次数总结在下表,并给出一个粗略的可能对应原读音的关系:

由此表可以看出汉语普通话音译转写的一些普遍现象:

1. 不支持多辅音组合和鼻音外的辅音词尾(闭音节),使得斯、特、德、克、尔这些单辅音专用字的出现频率非常高。这个规律在日韩的转音中同样存在,日语本身没有闭音节,韩语虽然允许辅音结尾,但由于韩语的p、t、k类词尾不出声,在转译外来语时仍要单列为一个带元音的音节。

2. 不区分舌音r和l,这是亚洲语言里非常普遍的现象,日韩同样也完全不分。对于词头的r/l,汉语一般归并入l。有意思的是,基于北京音的普通话存在一个卷舌r词尾,且对应有一系列读er的字(通常使用“尔”),这个读音非常适合模拟世界语言中单辅音出现的r/l,而不至于像日语那样只能转成“ru”。这个“尔”字在很多方言里跟舌头完全挨不着边(比如粤语读yi),所以香港的粤语翻译对于舌音经常直接跳过,比如“朗拿度”(罗纳尔多)“尼玛”(内马尔),给大陆人造成费解。

3. 没有v这个音,这也是中日韩的共同现象。和日韩用发音位置类似的唇音来拟v音不同,普通话音系使用一个不是唇音的近音w(但单独出现的v倾向于转成f),相比日韩不分b/v,普通话是不分v/w。这牵涉到了后面会讨论到的“听感”和“读感”音译原则的问题,这里先不细说。

另外,在这张表里,普通话里读音完全一样的字有:

西-希、马-玛、弗-福、博-伯、维-韦、奇-齐

声韵母相同,只是声调不同的字有(按四声顺序排列):

里-利、罗-洛、科-克、西-希-席、迪-蒂、加-贾、夫-弗-福、波-博-伯、姆-穆、菲-费、卢-鲁-路、伊-易

第一种情况里,除了马-玛完全等同,剩下几组其实都是有规律的,比如西-希组,西用于si,希用于hi(经典的尖团音关系);弗-福组,弗用于fu,福用于fo;博-伯组,博用于bo,伯用于ber;韦-维组,韦用于wi,维用于vi。后面几个是比较经验性的法则,对应不到什么语言学规律,现实中也时有混淆。从弗-福、博-伯这两组字里能看出,o这个元音在普通话里是个很令人头疼的问题,后面的分论里我们会细讲。

第二种情况,后面会我们专门讲外来语音译中如何使用声调的问题。这几组字里,有区别明显的,如姆-穆、加-贾、迪-蒂,也有看不出什么区别的,如罗-洛、菲-费。


“听感”还是“读感”

在外来语的音译中,一个贯穿始终的原则性问题是,“听感”和“读感”孰为优先?也就是说,我们的音译转写,是应该记录下听到的语言并尽量模仿出相似的声音,还是应该尽量模仿外国人说话的方式来读出一个外国名称。很多时候后者更重要的意义是,尽量区分开两个名字不同(但听起来像)的事物。比如将现任美国总统叫做“川普”,就是听感主义,而叫成“特朗普”,则是读感主义。

对于这两者,主要的区别在于,我们要是要应用这些音译来跟母语者沟通,还是单纯把它们作为记录的符号。事实上,单靠几个汉字不可能模拟出母语者的语境,因为汉语的音系与西方语言差别太大了,“川普”之名纯粹只是听起来“像”,但你说出普通话的“川普”,这两个字的声母、韵母、音调,跟英语发音都不是一回事。实际上Trump的中文译名只需要在中文语境中存在,我们需要尽量保证Trump这个人和另一个可能叫Champ的人不混淆,所以从发音方式上分解出来的“特朗普”才是正式场合对这个人物的官方称号。

“听感”主义的另一个问题是,我们依靠的“听”是指何种口音?比如像法国足球队这样的一整支队都找不到一个本土出身的阵容,靠听写法国巴黎标准音的方法来定义他们的名字,这终归显得很奇怪。比较正确的处理,应该是在尊重本人出身和母语的前提下,尽量按发音的方式来转写名字,但尽量不要记录某种口音的流变。比如“tr”这个组合,听起来像ch这只是标准英语中r的发音特殊导致的口音现象,这种转变并不需要去记录。

当下中日韩的官方在原则上都倾向于读感主义,即主要依据本民族语言的发音方式来转写外语,而不特别记录外语的口语读音中的音流变。在很多细化的问题,比如清浊音处理、本族语言没有的语音的近似、闭音节和重音表记等问题上,区分主义都优于等同主义。在后面的辅音和元音的分论里,本文也会默认以读感主义为主要处理原则。


声调的使用

汉语区别于日韩语的一大重要特征是,汉语中有充分的具备区分音位功能的声调,并且声调系统是与一字一音一意模式绑定。普通话中,不考虑声调所具有的音节总数大概400个出头,而考虑了声调后允许的音节能超过1300个,接近了保留复杂韵尾的朝鲜语的常用音节数量。相比日语算上全部浊音、拗音和外来语专用音总数也就100个多一点。

在现实使用中,声调的作用时常被忽视。汉语拼音方案虽然制定了声调的标号,但由于符号不容易适配计算机键盘,在现实中不方便实用。人们在需要表述语音的场合,比如转述方言词或拟声词时,基本不会特别加入普通话的声调来完善定义。

中文对于声调系统的作用,有一个很形象的成语——抑扬顿挫,这个词概括了基本的韵律现象。普通话对于“顿挫”不太敏感,表示“顿”的长元音、声门塞音,表示“挫”的闭音节收音,在普通话中都大为简化。但普通话对“抑扬”的表现非常丰富,普通话的声调里,一声(55)为平调,二声(35)为强升调,四声(51)为强降调,三声(214)在口语中常简化成21,可以视为弱降调,也可以近似做弱平调。对于轻重重音语言,用四声汉字表示重读,非四声字表示非重读,这个规则在上面列举的若干同声不同调的组合中有诸多例子,如里-利、罗-洛、科-克、迪-蒂、姆-穆、菲-费等。

但是,在世界很多语言中,重音并不产生意义的区分(最多产生英语里的语法区分,比如名词的重音前移),对于人名、地名这种具体概念,从前面“读感”主义出发,拘泥于重音位置会不会显得有些多余?但既然普通话对长元音、闭音节的区分偏简单,再不区分重读,似乎整体的辨别力就很不乐观了。还是以日韩为例,日语明确区分长短元音,用促音强调重读闭音节;韩语有长元音但书写上不标,有闭音节,有带重读特征的紧音。日语的音系简单,于是对长音和促音抠得特别死,专有名词基本是能标就必须标(非专有的外来语倒可能会简化)。对普通话这种音系也不算复杂的系统,尽量发挥出声调的作用,起码还是“推荐”的。

在实践中可以采用的做法是:尽量避免在不重读的位置出现四声字,避免在该重读的位置出现一声字。三声字有弱的降调走势,但调值变化不那么明显,可以作为通用的选择。但实际情况仍要复杂,比如普通话中很多音所有的调有限,te、le只有四声,de只有二声,而且译音用字时常要考虑诸多其他音素,如何选字这也是一门学问,下一节我们会专门讨论这个问题。


用字的原则

汉语的音译系统的另一个问题是,我们得尽量让读者看出这个词是单纯的音译。日文有片假名,韩文有词间空格,这两者都有一定的区分作用。但对中文而言,突出音译概念只能靠尽量地剥离汉字的意义,使读者先入地联想到读音。在具体应用中,这几条原则是应该注意的:

1. 不要用太日常的字,比如的、不这种虚词字,或是打、开等太通俗的动词。像“不列颠”“伏打”这种老译名里的“不”“打”字就不太合适,现在基本都只用“布”。

2. 不要用意思太直白的字,比如数字,日常的形容词、颜色词,以及意思直白的名词,这些字很容易让人理解为意译。过去对英语人名常用的“大卫”“山姆”这些译名里,“大”和“山”就太直白,不适合用来表音,现在也已普遍改成了“戴维”“萨姆”

3. 不要用贬义或不雅观的字,包括不雅观的偏旁部首,这很好理解,毕竟我们主要音译的对象是人名和地名,给人安上不好的字号显然是不合适的。这一点主要涉及到上一节所说的声调选择的问题,有时候某个读音有多个声调可用,但有些声调可用的字若不太文雅,这也不适合使用。对于偏旁,像虫、犭、月、疒、饣这些会联想到食物、动物、人体的偏旁也是不建议用的。

4. 音译词语内部不要能组合出实意,比如“川普”这个名字的一个问题在于它的字面会产生“四川普通话”这样的意义。

当然,最关键的一点,用的字得让大部分人认得,不要用生僻字,这点就不用强调了。有时“生僻”不仅仅指读音,若读音清晰但声调不够明确,也尽量不要选用。另外,常用字的生僻读音,或者名词用字的非名词读音,也都不适合使用。

我们结合上面图表来举两个简单的例子:

La音,普通话里不生僻的读音有lā和là,lā音有一个音译高频字“拉”,là音的常用字里,腊、蜡、辣都不太雅观,老音译中有“希腊”这样用四声标记重读的译法,但现代音译已经全部按“拉”字处理,但是用“拉”这个平声字来表记重读的确不太科学。

有类似情况的字还有多、兹、恩、兰、梅等。

Bei音,普通话里不生僻的读音有bēi、běi和bèi,bèi音有音译高频字“贝”。但相应的平声bēi音的常用字里,杯、碑偏直白,卑、悲则带贬义,都不适合使用。běi音只有一个“北”字,这个字同样过于直白。老译音里有“卑尔根”这样的名称,但现在已统一使用“贝”。“贝”作为去声字,很容易误导重音的位置,比如以前波兰有过一名黑人选手“奥利萨德贝”(Olisadebe),一个译名连续冒出了四个去声,这实在是逼疯强迫症的翻译(关键是重音偏偏是在唯一是平声的那个“德”字上)。

有类似情况的字还有曼、霍、布、诺、纳、沃、库等。


附录:中日韩人名音译的比较分析

在这一节,我用相同的方法制作了2014年世界杯人员名单的日、韩语转写的音节频率表,摘录于下(均不统计日本队和韩国队)。日韩的名单皆来自维基百科,参赛球员的样本总数为23*30=690。

其中,日语中的拗音以及ファ、ウェ这种两个假名复合而成的外来语专用音节皆表示成一个整体的音节,长音和促音则单独计数。韩语统计出现次数超过5次的音节。

日语人名转写音节频率统计
韩语人名转写音节频率统计(出现5次以上)

将中日韩的数据汇总,结果如下表所示。

对于中文,字符总数表示不同的汉字,音节总数包括合并同音同调和合并同音不同调两种情况。日文的字符总数中,大写和小写的假名以及促音、拨音、长音皆分别计算,但不计入人名中的分隔符・和=,音节总数中小写的假名与前音归并为一个音节,拨音作为一个独立音节(日语的外来语中允许拨音ン位于词头),促音和长音视为衍生符号,不计入总数。韩语在理论上有不同字同音的问题,但外来语转写系统里为此专门设计过,比如韵尾只允许鼻音和k、l,在这里字符和音节数量视为相同。

中日韩排名前25位的字符汇总如下:

由于三国媒体对于球员全名的处理标准不一,尤其因为世界杯上拉美系球队很多,而西语人名的构成相当繁琐,单名、双名、三名、绰号标记都能见到,所以字符总数的统计偏差较大。不过我们直接列举几个具体的个例,简单看看三国语言音译的“字符效率”对比:

Neymar da Silva Santos Júnior

内马尔·达·席尔瓦·桑托斯·儒尼奥尔

ネイマール・ダ・シウバ・サントス・ジュニオール

네이마르 다 시우바 산투스 주니오르

Lionel Andrés Messi

利昂内尔·安德烈斯·梅西

リオネル・アンドレス・メッシ

리오넬 안드레스 메시

中日韩都有把复合辅音拆分成单独音节的习惯,所以整体而言字符的占用空间相差并不算太大。日语不带鼻音韵尾,加上长音、促音区分严格,空间占用显然是最多的。中文相比日韩的一个长处是支持i结尾的复合元音(ai、ei),而日韩都需要抽出一个元音i。但韩文不仅有充分的鼻音韵尾(m、n、ng),同时也支持l直接作为儿化尾,这方面比中文节省一些,所以字符总数上中韩应该不相上下。

考虑不重复的字符,日文基本是把能用的符号都用了。日文的元音简单,尤其缺乏中韩语言中的表现弱化音节的元音(拼音的e、韩文的ㅡ),使得日文只能用u或o来表示辅音从里的单辅音,比如日文里无法区别st和suto,而汉语里用斯特和苏托就可以轻松实现。这导致日文的高频音节的出现次数还要远多于中韩。

有意思的是,韩文除去大量只出现1次的音节后,使用的字符数量其实跟中文差不多。韩文并不像日文那样,对于闭音节高度敏感,所以收音和紧音的出现频率都不高。比如按日语的做法,梅西在韩文里应该表示成멧시,但这样重音就落到后面的si上了。韩文中还有一个有意的点,尽管对应汉语“尔”的르已经在高频使用,但仍有大量的l韵尾的音节出现,也就是这个音可能单抽出来也可能放前面词尾,这应该是韩语为了规避l的音变做的处理,尤其是避免l跟后面n、h发生连音的问题。

将中日韩三语的音节出现次数和排名制作成折线图。由此图可以看出,三国语言人名音译的高频音节都在60个左右,60位之后,无论音节最复杂的韩语还是音系最简单的日语,音节出现频率基本趋同。但日语的高频音节的使用频率仍要明显高于中韩。中韩在15位之前有一些差距(可能是人名使用全名的问题),但15位之后的字频十分接近,这一点体现了中韩转音系统的类似,比如都有鼻音尾、都有i和u两套介音等。

附录②:

本文尽可能地只用“普通话”而避免使用“汉语”,是因为对音译的问题,不同方言的结果差别太大了。当今我们可能会接触到的一个方言音译系统是香港地区的粤语音译,我根据自己的观察简单总结一下粤语对外来语音译与普通话的不同点:

1. 粤语中尖团音仍区分,所以ki、hi、si等常见音可以比较好地区别。

2. 粤语有m鼻音尾,带m尾的音节可以只用一个字,尤其是经典的“咸”(ham)。

3. 粤语的e、o类元音接声母时可以不跟一个介音i或u,类似do、le这样的音处理起来更方便。

4. 对于粤语的p、t、k韵尾该不该用,目前香港的音译系统并不统一,但主流是不用,即p、t、k仍要作为一个音节处理。

5. 粤语缺少成对的塞擦音-擦音,比如普通话的平舌和卷舌,所以s/sh、ts/ch、z/dge等在粤语中无法区分。

6. 粤语缺少中央元音,转写轻读的音节不太方便,比如粤语只能用“达”(daat)来转单辅音t。

7. 粤语没有普通话里的卷舌儿化尾,对于外语中单独的r/l尾的处理也比较混乱。

现在香港体育网站的人名系统,基本处于外文原文、传统译名、民间译名和大陆借用名四者并存的状态,甚至一个名称里经常有粤语音和普通话音杂糅的现象。似乎香港没有一个新华社级别的机构颁布专门的统一音译用字规定。



参考资料

2014年世界杯中文名单:2014年巴西世界杯32强最终大名单--体育--人民网

2014年世界杯日文名单:https://ja.wikipedia.org/wiki/2014_FIFAワールドカップ参加チーム

2014年世界杯韩文名单:2014년 FIFA 월드컵 선수 명단


扩展阅读

【趣话体育】系列

趣话体育2——时间的科学

宋宁世:趣话体育——排名的科学

文章被以下专栏收录