首发于理性派HiFi
一种仅通过频响曲线预测耳机音质的方法

一种仅通过频响曲线预测耳机音质的方法

为此我还专门录了一个关于入耳式耳机预测方法的视频,有兴趣的可以去看一下~

https://www.bilibili.com/video/av53111011/www.bilibili.com


这是目前最新的头戴式耳机主观音质/听感预测公式。其中,SD代表被测耳机曲线与目标曲线偏差的标准差;AS是一个和耳机曲线与目标曲线偏差的对数几率回归有关的值。而加权系数由大量统计样本和机器学习得出。

我在这里解释一下,音质对于绝大多数消费者而言是一个很玄的词汇,很多人所谓的音质其实就是他的主观听感,并不是耳机和真实的声音的偏差,因为绝大多数人没有听过参考级的音乐回放。所以才会有主观音质这种奇葩概念,也可以理解为听感或者好不好听,不过这样对绝大多数消费者更有意义。

我们再看这张图。

其中,黑色数字代表人们通过盲听给出的耳机主观评价分数。绿色曲线为哈曼曲线(在这里我不探讨哈曼曲线的效果,这个绿色曲线你也可以理解为任何目标曲线),蓝色曲线为主观评价时落在对应评分区间的所有耳机频响的平均值,而不是单独特指某个耳机,实际上可以代表这一整类的耳机,因为有着相似频响的耳机都落在了对应的区间内。红色曲线代表着蓝色曲线和绿色曲线的偏差值。黑色虚线代表着红色偏差值的回归曲线。

我们再回来看这个公式。

耳机听感/主观音质的预测分数与SD和AS值都有关系。SD代表着耳机曲线和目标曲线的偏差,这个很好理解。而对于AS值,由上面的黑色曲线我们可以大致看出,这是一个代表着耳机频响曲线与目标曲线的整体偏移趋势的值。并且是对数回归。所以100Hz~1kHz所占的权重和1kHz~10kHz是一样的。这和人的听觉系统也是相吻合的,其实以我的调音经验,人最敏感的频段大概在200~300Hz,而稍微过大范围应该在200~800Hz,这和等响曲线是无关的。

值得注意的是,大量统计结果表明,人对头戴式耳机的主观音质/听感的评价,在50Hz以下和10kHz以上有着不确定性,或者说是弱相关。所以,这个公式中只计算50Hz~10kHz的采样点。而这个公式相比于2017年的版本已经有了简化,反而最终的测试结果的可信度变高了,这从侧面说明,引入过多的变量反而会降低评价系统的可信度。

也就是说,像图中的“fair”这样的曲线,明明1kHz~10kHz这一段是非常贴合目标曲线的,但一方面由于50Hz~500Hz的偏差较大,另一方面因为50Hz~500Hz的凸起导致曲线整体倾斜的程度偏离目标曲线。所以用公式预测出的评分会偏低,这与人的主观听感一一致,你们有兴趣的话可以回去看我之前的200元以下耳机测评,基本上那个测评里的所有入耳式耳机的频响曲线都是这个趋势。如果是训练有素的听音者,很容易听出这个频段的瑕疵,而对于一般消费者,很多时候就变成了混沌的听感不好。而传统的1kHz拟合,这样的耳机高频表现应该是完美的,但实际上有可能会主观上高频也会有问题,这就是和整个耳机曲线的偏移有关。这其实和心理声学中的掩蔽效应也很吻合,就是即便耳机在高频处的曲线不发生任何变化,只改变低频的频响依旧会影响人对高频的主观判断,这是人耳听觉系统的一个特点。

一个响亮的纯音很容易就把另一个频率更高的纯音给掩蔽掉。当然,对于音乐信号而言,这种掩蔽效应会更复杂。

目前这种预测算法的可信度约为95%。但并不代表主观评价就没有意义,实际上即便这是目前可信度最高的算法,其结果仍然在一定范围内浮动,训练有素的听音者的主观评价可以更准确的对耳机进行评价。

横坐标是通过哈曼曲线和相应的算法对耳机主观听感的预测分数,纵坐标是人实际盲听打出的耳机主观评分。目前来说这种目标曲线和算法可信度约为95%。(建议先看一下大学里的统计学基础/统计学原理)

而相应的,也有入耳式耳机的评价方法,入耳式耳机的评价方法相比于头戴式耳机更复杂。

但无论怎样,频响曲线都是这种预测耳机听感/主观音质的算法的唯一指标。

这是因为大多数耳机的非线性失真较小,而频响偏差较大。

所以才使得虚拟耳机成为可能。

而在之前的实验种,仅通过频响和最小相位响应生成的虚拟耳机模拟真实耳机的可信度高达R=0.98,甚至在一半的测试样本中高达r=0.99。

相比之下,仅通过频响和最小相位响应生成的虚拟头戴耳机也有着不错的表现(r=0.85),但表现并不完美的原因一方面是因为泄露因数(漏气)不同,另一方面则可能是因为耳罩触感不同导致佩戴者识别出了耳机(比如说比较有的点的HD800S)而保留一些固有的偏见。以上这些验证研究共同提供了证据,证明虚拟耳机方法可以得出有效和有意义的结果。

虚拟耳机的可行性从侧面说明了非线性失真对于耳机尤其是入耳式耳机的主观听感的影响很小,但值得注意的是,影响很小不等于完全没有影响。

而对于头戴式耳机,对于大尺寸单元的耳机(头戴式耳机),非线性失真同样并不是影响耳机音质的重要因素(除了D耳机)(D耳机是beats)。这项研究进一步提供了实验证据,传统的非线性失真指标对于预测头戴式耳机的音质好坏并不是特别有用。

更多相关资料可以在Audio Engineering Society查看

参考文献(参考文献是这篇论文的,而这篇论文本身在上面的图片里,不要搞混)

[1] J. Breebaart, “No correlation between headphone frequency response and retail price,” J. Acoustical Society of America, vol. 141, issue 6, (June 2017).

[2] S. Olive and T. Welti, “Factors that Influence Listeners’ Preferred Bass and Treble Levels in Headphones,” presented at the 139th Audio Eng. Soc., Convention, New York, USA, (2015).

[3] S. Olive, T. Welti, and O. Khonsaripour, “A Statistical Model That Predicts Listeners’ Preference Ratings of In-Ear Headphones: Part 1 – Listening Test Results and Acoustic Measurements,” presented at the 143rd Audio Eng. Convention, New York, USA (October 2017).

[4] S. Olive, T. Welti, and O. Khonsaripour, “A Statistical Model That Predicts Listeners’ Preference Ratings of In-Ear Headphones: Part 2 – Development and Validation of the Model,” presented at the 143rd Audio Eng. Convention, New York, USA, (October 2017).

[5] G. Lorho, 2009. “Subjective Evaluation of Headphone Target Frequency Responses,” 126th Audio Eng. Soc. Convention, 126, Paper Number 7770. (2009).

[6] F. Fleischmann, F. Silzle, and A. Plogsties, ” Identification and Evaluation of Target Curves for Headphones,” 133rd Audio Eng. Soc. Convention, Paper Number: 8740 (2012).

[7] S. Olive. T. Welti, and E. McMullin, “Listener Preference For Different Headphone Target Response Curves” 134th Convention, Audio Eng. Soc., preprint no. 8867, (2013 May).

[8] ITU–R Recommendation BS.708: Determination of the electro–acoustical properties of studio monitor headphones, ITU-R. (1990).

[9] International Telecommunications Union, 2015. ITU-R BS 1116-3, “Methods for the subjective assessment of small impairments in audio systems,” February 2015.

[10] European Broadcast Union Tech, 3276, 2nd edition, “Listening conditions for the assessment of sound programme material: monophonic and two–channel stereophonic,” EBU (1998).

[11] S. Olive, T. Welti, and O. Khonsaripour, “The Influence of Program Material on Sound Quality Ratings of In-ear headphones,” presented at the 142nd Audio Eng. Convention, Berlin, Germany, (May 2017).

[12] T. Welti, S.E. Olive, and O. Khonsaripour, “Validation of a Virtual In-Ear Headphone Listening Test Method,” presented at the 141st Audio Eng. Soc. Convention, Los Angeles, USA, (September 2016).

[13] T. Welti, “Improved Measurement of Leakage effects for Circum-aural and Supraaural Headphones,” presented at the 138th Audio Eng. Soc., Convention, Warsaw, Poland, (May 2015).


再解释一下人的主观感受和客观参数之间的关系。

主观音质和听感是人的主观感受,存在个体差异这点不假,但仍然存在着一定的规律。

这就好比我们吃菜的口味咸淡也是人的主观偏好,但不代表这个偏好是随意的,无规律的,仍然是在一定范围内的,我相信没有人喜欢一盘菜放一斤盐。。。

最后再解释一下,虽然我说了全称了,但是有很多人还不懂数学公式。。。

这是入耳式耳机的

这个PPT是公开的,Google、Bing上都可以搜到,自己动手,丰衣足食。

编辑于 2019-05-21

文章被以下专栏收录