首发于理性派HiFi
一个可以预测头戴式耳机主观听感评分的统计模型

一个可以预测头戴式耳机主观听感评分的统计模型

之前的很多测评中,总有人对“客观数据只测试频响和THD”这样的。但是我想说错误解读数据、用数据误导和完全相信主观一样可怕。尤其是很多不同的指测试标很容易给人一种很专业的感觉,实际上测试这些指标在SoundCheck里都是完全自动化的,而我之所以不使用这些指标是因为它们都不是影响耳机音质的主要因素,展示过多的数据而没有准确的权重,反而会给人一种混乱和误导。于是又把问题陷入无休止的争吵中,这是我不想看到的。

不知道是不是因为一些人的英语不好,或者不会用Google,很多别人早就做了实验早就有确切结论的事情到现在还是经常讨论的日常。

虽然这个问题我已经解释很多了遍了,但是还是有人不仔细看我之前写过的文章。所以这次我再解释一遍。不过与以往不同的是,这次我想通过对Sean Olive博士一年前发表在AES意大利米兰的一篇论文(其实严格意义上这应该算国际会议)来给这个问题做一个总结。

由于我英语也不太好,而且很久没有写论文了,所以翻译中的一些语句达不到信达雅还请各位大佬多多包涵。并且因为一次翻译的太多也不太好,因为太长了可能有些人就不看了,到最后又是明明别人做过的实验不去看还要抬杠。。。所以我打算分章节逐步翻译,并对一些关键句做注释,防止即便这样还是有人不仔细看就评论。

A Statistical Model that Predicts Listeners’ Preference Ratings of Around-Ear and On-Ear Headphones

ABSTRACT

A controlled listening test was conducted on 31 different models of around-ear (AE) and on-ear (OE) headphones to determine listeners’ sound quality preferences. 130 listeners both trained and untrained rated the headphones based on preference using a virtual headphone method wherein a single replicator headphone was equalized to match the magnitude and minimum phase responses of the different headphones. Listeners rated 8 headphones in each trial that included high (the new Harman AE/OE target curve) and low anchors. On average, both trained and untrained listeners preferred the high anchor to 31 other choices. (这句话表述存疑,以原文实验结果和结论为准) Using machine learning a model was developed that predicts the listeners’ headphone preference ratings using deviations in magnitude response from the Harman target curve.

一个可以预测头戴式耳机主观评分的统计模型

摘要

这是一个受控制的实验,包涵31种不同款式的包耳式(Around-Ear)和压耳式(On-Ear)头戴式耳机。通过虚拟耳机的方法,130个训练有素和未经过训练的听音者通过主观偏好对不同的耳机进行打分;其中,所有不同的耳机均通过同一款复制耳机上加载不同的幅度偏差和最小相位响应进行模拟。听音者在每项试验中对8个耳机进行评分,这其中包括高度符合哈曼曲线的耳机和不太符合哈曼曲线的耳机。通常,训练有素的听音者和未经训练的听音者相比于这31款耳机都更喜欢哈曼曲线耳机(这句话表述存疑,以原文实验结果和结论为准)。通过使用机器学习发明了一种通过与哈曼曲线的幅度偏差而预测耳机的主观评分的数学模型。

1 引言

耳机厂商对理想的耳机目标频响曲线应该是什么样子才能获得最佳的音质还没有达成共识。这是Breebaart在测量了283款耳机的频响曲线(这其中包括包耳式、压耳式和入耳式耳机,价格从4美元到5000美元)所得出的结论。当他把这些耳机的频响曲线和一个听感较好的目标频响曲线相对比时,他发现这些耳机的频响曲线与目标频响曲线之间的偏差和价格几乎没有关系,甚至完全没有关系。对此,我们也有着相似的结论,听音者对耳机的主观音质偏好与耳机价格之间的关系很小。

一些研究人员研究了最近的IEC、ITU和EBU标准中所推荐的扩散场耳机目标曲线,发现听音者更喜欢这种目标曲线的音质。耳机行业和他们的标准组织可以从更多的科学研究中受益,这些研究涉及耳机听起来如何更好,以及如何客观地定义和衡量它。这是我们研究的主要目的,也是本篇论文的主要目的。

这个行业有太多的时间和精力浪费在无休止的争吵中,而不是如何去提升产品的音质。
不过实验证明,扩散场耳机曲线(diffuse-field (DF) curve)的听感相比哈曼曲线有较大差距,甚至有可能比不加EQ的原始耳机还要差。

在之前的一篇论文中,我们报告了从听音者对30种不同的入耳式耳机的主观偏好的受控实验中所得出的结论。其中,每一项试验都包括一个隐藏的曲线(哈曼入耳式耳机目标曲线),训练有素的听音者和未经训练的听音者总体上都更喜欢它。并且建立了一个基于耳机偏离目标频响曲线的程度的统计模型来准确地预测了听音者对其音质的综合评价。

在本篇论文中,作者使用类似的方法来测试和验证新的针对头戴式耳机优化的目标频响曲线。训练有素的听音者和未经训练的听音者对来自18个厂商的31款不同型号的耳机进行受控的双盲听测试。通过机器学习在主观和客观的耳机测量中的应用,根据被测耳机的幅频响应,模拟并预测听音者是如何对耳机进行主观评分的。通过这种方法,耳机的音质就可以用一个简单的声学参数来衡量,而不需要花费大量时间和金钱的主观听音测试。

机器学习的引入,使得新的拟合算法拥有更高的可信度,而非传统的1kHz基准点拟合。

本文共分为六个章节。第二章详细介绍了听音测试是如何进行的,第三章报告了测试结果。统计模型在第4章中建立,然后在第5章和第6章中分别进行讨论和总结。

2 听音测试

2.1 耳机选择

本次测试中一共选择了来自18个不同厂商的31款头戴式耳机。价格从60美元到4000美元不等,同时包括开放式与封闭式、动圈耳机(26种)与平板耳机(5种)。其中10款为蓝牙耳机,5款为主动降噪耳机。

2.2 虚拟耳机方法

本次听音测试采用虚拟耳机的方法,因为这是一种可以实现在多个不同耳机之间快速切换的受控的、可重复的、双盲听测试方法。该方法已经在之前的论文中成功的虚拟了头戴式耳机和入耳式耳机。

科学的耳机听音测试是很难进行的,因为控制听力测试中有很多讨厌的变量及其固有的偏见。它们包括视觉和触觉偏差、渗漏效应、听者之间佩戴契合度的一致性,以及切换不同耳机之间比较时产生的巨大时间间隔导致的听觉记忆丧失。
虚拟耳机实现快速切换,防止传统耳机对比听音中由于更换耳机的过程而引入的不可控因素,比如说人很容易忘记之前听过的声音,哪怕只有10s,或者是更换新耳机时佩戴偏差而导致的误差。

虚拟耳机方法的准确性已经通过真实耳机与虚拟耳机的主观评分对比以及真实耳机与虚拟耳机的录音文件对比得到了验证。对于入耳式耳机而言,真实耳机与虚拟耳机有着几乎完美的一致性(r=0.98),而对于头戴式耳机而言,真实耳机与虚拟耳机有着不错的一致性(r=0.85),这是因为在实际耳机的测试中,泄露因数(漏气)不同和耳罩触感不同都可能导致这种偏差。以上这些验证研究共同提供了证据,证明虚拟耳机方法可以得出有效和有意义的结果。

虚拟耳机只模拟耳机的幅度(频响)和最小相位部分,并排除了真实耳机中存在的任何非线性失真或过度相位畸变。然而,多个验证研究和其他耳机调查表明,频响是决定耳机声音好坏的主导因素。

仅通过频响和最小相位部分响应,模拟入耳式耳机可以达到r=0.98的一致性,说明人的主观在评价耳机的音质时,频响占绝对主导地位,而非非线性失真。造成这种现象的原因我在之前的文章已经多次提到,最主要还是因为耳机单元的非线性失真比较容易做到较小值,所以往往小于音箱单元的非线性失真,而耳机的频响很难做到标准,而音箱的频响相对来说很容易做到标准。

每个耳机的频响和最小相位响应测量使用了一个G.R.A.S. 45 CA耦合器和哈曼优化订制的人工耳廓,以更好地模拟泄漏对人耳听觉的影响。最终的测量结果是根据耳机3次重新放置在人工耳的测量平均值得出的。然后,在一个复制耳机(AKG K712)上模拟每个耳机的测量幅度响应,选择该复制耳机是因为其低失真、相对平稳和宽广的频率响应。复制耳机的开式设计提供了一个自然的泄漏,从而确保在低频率下耳机对于不同听音者的响应更加一致。耳机与听音者头部的配合方式和机械耦合方式会影响其在200Hz以下的响应。复制耳机使用了一根弯曲的硬线来增加夹紧力,初步测试表明这种方法可以减少因泄漏带来的 偏差。

实验采用哈曼订制的人工耳廓,与市面上所有在售的人工耳廓不同。

设计一个FIR滤波器并应用到复制耳机上,模拟测量的响应(详见引用文献[12]中的2.3节)。真实耳机与虚拟耳机测量的幅度响应在12kHz以内都匹配良好(±1 dB),在此基础上,我们并没有尝试主动均衡,这是由于耳机在耦合器上不同位置的灵敏度及其精度超出与该范围相关的误差。

未完,待续


参考文献

[1] J. Breebaart, “No correlation between headphone frequency response and retail price,” J. Acoustical Society of America, vol. 141, issue 6, (June 2017).

[2] S. Olive and T. Welti, “Factors that Influence Listeners’ Preferred Bass and Treble Levels in Headphones,” presented at the 139th Audio Eng. Soc., Convention, New York, USA, (2015).

[3] S. Olive, T. Welti, and O. Khonsaripour, “A Statistical Model That Predicts Listeners’ Preference Ratings of In-Ear Headphones: Part 1 – Listening Test Results and Acoustic Measurements,” presented at the 143rd Audio Eng. Convention, New York, USA (October 2017).

[4] S. Olive, T. Welti, and O. Khonsaripour, “A Statistical Model That Predicts Listeners’ Preference Ratings of In-Ear Headphones: Part 2 – Development and Validation of the Model,” presented at the 143rd Audio Eng. Convention, New York, USA, (October 2017).

[5] G. Lorho, 2009. “Subjective Evaluation of Headphone Target Frequency Responses,” 126th Audio Eng. Soc. Convention, 126, Paper Number 7770. (2009).

[6] F. Fleischmann, F. Silzle, and A. Plogsties, ” Identification and Evaluation of Target Curves for Headphones,” 133rd Audio Eng. Soc. Convention, Paper Number: 8740 (2012).

[7] S. Olive. T. Welti, and E. McMullin, “Listener Preference For Different Headphone Target Response Curves” 134th Convention, Audio Eng. Soc., preprint no. 8867, (2013 May).

[8] ITU–R Recommendation BS.708: Determination of the electro–acoustical properties of studio monitor headphones, ITU-R. (1990).

[9] International Telecommunications Union, 2015. ITU-R BS 1116-3, “Methods for the subjective assessment of small impairments in audio systems,” February 2015.

[10] European Broadcast Union Tech, 3276, 2nd edition, “Listening conditions for the assessment of sound programme material: monophonic and two–channel stereophonic,” EBU (1998).

[11] S. Olive, T. Welti, and O. Khonsaripour, “The Influence of Program Material on Sound Quality Ratings of In-ear headphones,” presented at the 142nd Audio Eng. Convention, Berlin, Germany, (May 2017).

[12] T. Welti, S.E. Olive, and O. Khonsaripour, “Validation of a Virtual In-Ear Headphone Listening Test Method,” presented at the 141st Audio Eng. Soc. Convention, Los Angeles, USA, (September 2016).

[13] T. Welti, “Improved Measurement of Leakage effects for Circum-aural and Supraaural Headphones,” presented at the 138th Audio Eng. Soc., Convention, Warsaw, Poland, (May 2015).

编辑于 2019-05-24

文章被以下专栏收录