首发于理性派HiFi

人耳的听觉极限

对于纯音而言,人耳听觉对于频率响应的感知范围大致在20Hz~20kHz。

Pumphrey R J. Upper limit of frequency for human hearing[J]. Nature, 1950, 166(4222): 571.

对于纯音而言,人耳听觉对于响度变化的差别阈限(阶跃极限)约为0.3dB,但一般情况下约为0.5~1dB,这个数值换算为百分比大约为10%.

Harris J D. Loudness discrimination[J]. Journal of Speech & Hearing Disorders. Monograph Supplement, 1963.

对于纯音而言,在500Hz~2kHz范围内,人耳听觉对于频率变化的差别阈限约为0.2%,这是以百分比为衡量,人类能够感知到的最小声音差别。

Moore B C J. Relation between the critical bandwidth and the frequency‐difference limen[J]. The Journal of the Acoustical Society of America, 1974, 55(2): 359-359.

对于非线性失真而言。并不是数值越小影响就越小。JBL的Alex Voishvillo博士曾经证明,硬削波产生的22.6%的THD,比交越失真产生的2.8%的THD更容易令人接受一些。

Voishvillo A. Assessment of Nonlinearity in Transducers and Sound Systems–from THD to Perceptual Models[C]//Audio Engineering Society Convention 121. Audio Engineering Society, 2006.

对于大部分情况下出现的低次谐波失真,恰好能够被人耳感知到的数值大约是1%.

Moir J. Just detectable' distortion levels[J]. Wireless World, 1981, 87: 32.

交越失真有可能在0.3%或者更低一些被人耳感知到。

Moir J. Transients and Loudspeaker Damping[J]. Wireless World, 1950, 56: 166-170.

P.A. Fryer的研究表明,对于钢琴而言,刚好能被人耳感知的互调失真IMD约为2%~4%,而对于其他类型的测试信号,约为5%.

Russell K F, Fryer P A. Loudspeakers: An Approach to Objective Listening[C]//Audio Engineering Society Convention 63. Audio Engineering Society, 1979.


我们不难发现,以上引用的数值都很高。因此,你可能想要知道,为什么这么多年过去了,对于HiFi产品的低失真的追求没有被停止。一方面是,以上这些数字如此之高,对于很多人来说是难以置信的。另一方面则是,会有商业利益推动这些技术指标继续进步,不论这些技术指标是否可以被人感知。

Douglas Self, Audio Power Amplifier Design

对于1~2米的RCA信号线而言,不同线材之间THD的差别约为0.0001%,低于人耳听觉极限3个数量级。而对于音箱而言,在一般的房间内,人头移动1~5cm,某些频段的响度变化约为1~2dB,大约是20%,约为不同线材之间区别的200000倍。

鬼斧神工119:房间对音箱声音的影响(入门篇)。也许是对所有“老烧”的会心一击。zhuanlan.zhihu.com图标

对于头戴式耳机而言,在94dB测试条件下,除去低频部分,THD通常为0.1%~1%这个数量级。在82c-wt ITU标准音量下,除了低频部分,通常THD会在0.1%~0.5%左右。

对于入耳式耳机而言,94dB测试条件下,全频段通常THD会低于0.5%。而在ITU标准音量下,全频段通常低于0.2%.

入耳式耳机的非线性失真普遍小于头戴式,这也是入耳式耳机虚拟耳机的相关系数更高的原因之一。

Steve Temme, Sean Olive博士等人的实验把几款头戴式耳机使用均衡器EQ调节至相同的频响曲线并录音,在一个非线性失真超低的耳机STAX009上进行回放。分别测试了THD,IMD,Multi-tone和以音乐为测试信号的非相干失真。并通过人的主观听音实验及实验结果的数据分析得出的部分结论如下:

  1. 除了某款耳机(真正的音乐),听音者对于其他几款耳机没有明显的偏好差别;
  2. 音乐与耳机之间存在显著的交互作用,影响了偏好评分。听音者的主观评价证实了某些音乐在某些耳机上产生的声音失真比其他音乐更多。(但是后续的研究表明,这种影响相比于不同耳机频响曲线之间的差别是微小的)
  3. 听音者的主观评价表明某款耳机的声音存在失真。而对于其他耳机,听音者的主观评价在重复的观察中往往不一致,并且表示在耳机中听到声音失真是多么困难。
  4. 虽然没有一项耳机失真测量能够可靠地预测频响相同的耳机的声音失真的听音者主观评分,但以音乐为测试信号的非相干失真产生了最佳结果。最不受欢迎的耳机(真正的音乐)在100Hz以下的总谐波失真THD最大(远超1%),在100Hz和1kHz之间的非相干失真量最大。IMD和Multi-tone指标的成功率较低。

总之,非线性失真的感知和测量是一个迷人但具有挑战性的研究领域。耳机中的线性失真(频响曲线)比非线性失真高出几个数量级,并且更容易被听到。

Temme S, Olive S, Tatarunis S, et al. The correlation between distortion audibility and listener preference in headphones[C]//Audio Engineering Society Convention 137. Audio Engineering Society, 2014.

以我过去测试过的上百款耳机,对于不同的价位的耳机,THD并没有明显的差异,均维持在相对较低的水平。例如我之前测试过的森海塞尔HD800S与小米头戴式耳机轻松版有着类似的THD表现。

森海塞尔HD800S THD
小米头戴式耳机轻松版THD


相位的可听性


声学欧姆定理

音乐中的音色完全取决于其谐波的数量和相对电平,而不是相对相位。


麦克风-录音设备-扬声器链路中的大部分器件都具有最小相位特性。最大的例外是多分频扬声器和多单元耳机。但是Møller H等人的实验证明,在一般情况下,人耳听觉对于群时延的听觉阈限在1.6ms~2ms。一般的扬声器不会超出这个数值。

Møller H, Minnaar P, Olesen S K, et al. On the audibility of all-pass phase in electroacoustical transfer functions[J]. Journal of the Audio Engineering Society, 2007, 55(3): 113-134.

Lipshitz等人在1982年发表的一篇关于中频相位失真可听性的重要论文有如下结论:

  1. 采取合适的测试信号(通常是单独的敲击声),非常小的相位非线性是可以被听到的;
  2. 当采用耳机时,相位可听性会明显增加;
  3. 当采用耳机时,在一个消声室内所产生的简单的声音信号会显示出清晰的相位可听性;
  4. 对于正常的音乐和语音信号,相位失真通常是听不到的。
Lipshitz S P, Pocock M, Vanderkooy J. On the audibility of midrange phase distortion in audio systems[J]. Journal of the Audio Engineering Society, 1982, 30(9): 580-595.

类似的实验还有:

Moir J. More Comments on-On the Audibility of Midrange Phase Distortion in Audio Systems[J]. Journal of the Audio Engineering Society, 1983, 31(12): 939-939.


Harwood H D. AUDIBILITY OF PHASE EFFECTS IN LOUDSPEAKERS-ARE LINEAR-PHASE-LOUDSPEAKERS A GIMMICK[J]. Wireless World, 1976, 82(1481): 30-32.


时域的可听性

就瀑布图CSD而言,对于200Hz以上,我们听到的是频响曲线的高Q值而不是时域的振铃(啸叫音)。

Toole F E. Sound reproduction: The acoustics and psychoacoustics of loudspeakers and rooms[M]. Routledge, 2017.


动态范围

人耳听觉的动态范围通常在120dB~140dB之间。对于Naive listener而言,大约为125dB;对于有经验的听音者而言,可以达到135dB~140dB。

Huber D M, Robert E. Runstein Modern Recording Techniques Focal Press[J]. 2009.


Newman, Edwin B. (1972-01-01). "Speech and Hearing".American Institute of Physics handbook. New York: McGraw-Hill. pp. 3–155.ISBN978-0070014855.OCLC484327.

歌剧院内的音乐演奏的动态范围通常不超过80dB,人正常讲话的动态范围约为40dB。

John Eargle (2005).Handbook of Recording Engineering. Springer Science & Business Media.ISBN9780387284705.


空间感知

在水平面上,人对正前方的方向的分辨率最高,约为1度~3度。随着声源向两侧移动,人耳对方向分辨的阈限会逐渐增加,在正左侧和正右侧时达到最大,约为正前方的3~10倍。当声源方向水平方位角继续增加时,人耳对声源方向分辨的阈值会再次变小,人耳对正后方声源方向感知的阈限约为正前方的两倍。

扩展阅读:

鬼斧神工119:理性派HiFi特别剧场篇之人耳听觉极限。金耳朵原来是。。。zhuanlan.zhihu.com图标https://www.bilibili.com/video/av60931243/www.bilibili.com

以上是一些对人类听觉极限的权威研究结果。但也不排除有些人的听力异于常人。以下是吉尼斯世界纪录的官方网站。

吉尼斯世界纪录官方网站www.guinnessworldrecords.cn图标

各地的公证处联系方式可以通过各大搜索引擎查询。

编辑于 2019-07-28

文章被以下专栏收录