理性派HiFi
首发于理性派HiFi

耳机的瀑布图真的有意义吗?关于耳机的瀑布图,你需要知道的。

其实这个问题我一直不太想写,因为这是个很基础的问题,但是很多人都说“耳机不能只看频响,不能只看三频均衡,还要看素质,看瞬态”,素质也好,音质也罢,之前写过很多文章,耳机的非线性失真通常较小,并不是一个影响耳机音质的重要因素。很多时候,一个耳机的音质差都是线性失真引起的,而非非线性失真。而对于所谓的“瞬态”到底又是什么觉得的呢?“瞬态”和瀑布图有什么关系?希望这篇文章能给你一个明确的答案。

其实关于“能量累积图CSD”也就是大家常见的瀑布图的可闻性实验,当代心理声学奠基人之一的Floyd Toole博士早就有非常深入的研究。

瀑布图让我们看到了令人担忧的信息,那就是谐振不利于精确的声音重复,特别是高Q值的谐振。
主观主义者暗指瞬态细节的不完美之处,并声称他们可以听出这些时域效果。

但是,他们真的能听出来吗?(滑稽)

对这个观点进行实验将会很有趣。

上述实验告诉我们,至少在200Hz以上的频率,谐振的察觉过程依靠的是频谱信息而不是瞬态特征。

而关于频响曲线本身的隆起和凹陷的可闻域限,这本书里也有详细的实验和论述。(这就是为什么我如此推荐Sound Reproduction)

其实从上图我们就能很明显的看出,Q值越小,也就是“变化越缓慢”的频响偏差反而更容易被察觉,这是因为相同的频响偏差,Q值越小面积越大。

而这种低Q值的现象反而是不容易导致“啸叫”的。

关于频响偏差的Q值与可闻性的关系,我早在半年多之前的很多测评文章中都有提到,这也是调音中非常基础的问题,EQ中Q值的问题。

所以总结一波:

  1. 对于瀑布图而言,200Hz以上高Q值的谐振,我们听到的是频响的影响而不是时域上的“啸叫音”;
  2. 对于频响而言,我们更容易感知低Q值的频响变化(偏差),而低Q值的频响变化往往不会导致时域的“啸叫音”。也就是说,频响中越平滑的偏差越容易被人感知到,因为它影响的面积往往更大。

造成第一点这种结果,很大程度上和人类听觉系统主的掩蔽效应相关。

除非在图中(d)所描绘的,时域上的“衰减”过程中的信号反而比“0时刻”信号还要高的情况下,“振铃”才有可能被察觉。

至于CSD瀑布图的时间精度和频域精度之间的关系,并不是本篇文章的重点,感兴趣的小伙伴可以去阅读一下原著。


那么“代表瞬态的瀑布图”和频响完全没关系吗?

在讨论这个问题之前,我们首先还是要了解几个最基础的概念。

什么是声音?

声音的本质是一种振动,更确切的说是一种机械振动。声音本身遵循物理定律与数学规律。

什么是频率?

单位时间内完成振动或振荡的次数或周数。常用单位是赫兹。1赫兹等于1次/秒或1周/秒。

什么是相位?

相位(phase)是对于一个波,特定的时刻在它循环中的位置:一种它是否在波峰、波谷或它们之间的某点的标度。相位描述信号波形变化的度量,通常以度 (角度)作为单位,也称作相角。 当信号波形以周期的方式变化,波形循环一周即为360° 。

什么是群时延?

群时延即系统在某频率处的相位(相移)对于频率的变化率。

什么是希尔伯特变换?

什么是最小相位系统?

定义:在幅频特性相同的系统中,相频变化最小的那个系统成为最小相位系统。

结论:最小相位系统的开环传递函数的零极点的实部均小于等于0。

应用:最小相位系统的传递函数可以由幅频唯一确定。即,最小相位系统的幅频特性与相频特性一一对应。也就是说,一个幅频特性只与一个相频特性对应,一个相频特性也只与一个幅频特性对应。

最小相位系统的对数谱的实部和虚部互为希尔伯特变换。因此,可以通过幅频特性推出最小相位系统的相频特性,反之亦然。

而关于扬声器、音箱和耳机的最小相位系统的讨论和最小相位特性的证明。结论则是,耳机可以近似看作是最小相位系统,或者说,耳机具有最小相位特性。

当然,这一结论只适合单单元的系统,比如绝大多数头戴式耳机和一些单单元的入耳式耳机。然而,最新的研究表明,即便是多单元系统,分频点出产生的群时延也接近或低于人耳的听觉域限。

而对于最小相位系统,或者说具有最小相位特性的系统。幅频特性和相频特性可以通过希尔伯特变换进行相互转换。改善耳机频响的同时也会改善相位特性进而改善时域衰减特性,也就是瀑布图。

那么说了这么多理论,来点实验吧!

一个入耳式耳机,在7.5kHz处由于Q值较高的凸起峰,在时域上导致了“振铃”。(虽然这个频段的振铃已经被Floyd Toole博士的实验证实相比于频响不具有可闻性,并且,高Q值本身相比于低Q值的可闻性也小很多)

仅使用一个最简单的GEQ,消除高Q值的“振铃”

事实上我都不知道这个EQ是什么类型,不过通常这样的GEQ都是Bi-quad Filter,也就是二阶IIR滤波器,连FIR都不是。结果:

瀑布图让我们看到了令人担忧的信息,那就是谐振不利于精确的声音重复,特别是高Q值的谐振。

主观主义者暗指瞬态细节的不完美之处,并声称他们可以听出这些时域效果。

罗老师,别这样!

视频讲解~

https://www.bilibili.com/video/av58019366/www.bilibili.com

此处应有音乐~

编辑于 2019-07-06

文章被以下专栏收录