
我们的广播与制作首席技术官托马斯·伦德已将多款移动设备,包括苹果的iPhone和iPad,带到“TC实验室”进行测试。
在本白皮书中,所有测试结果、建议和实用指南均已披露。
阅读白皮书
访问完整的论文技术库
移动设备、iPad 和 iPod 的音频
托马斯·伦德
作者在过去五年中系统地研究了苹果、诺基亚、三星和索尼爱立信的Pod和移动电视设备的音频能力。本文是首次公开报告测试的部分内容,调查了移动用户能够听到什么,以及她无法听到什么。
发表于2013年NAB,拉斯维加斯。
移动电视、iPad 和 iPod 的音频信号
托马斯·伦德
在过去五年中,本文的作者系统地研究了苹果、诺基亚、三星和索尼爱立信的移动电视设备和耳机的音频能力。本文是首次向公众展示关于移动设备用户能够听到和无法听到的内容的一部分测试和研究结果。
发布于2013年NAB,拉斯维加斯
CALM法案与跨平台广播
托马斯·伦德
本文详细介绍了从制作到多平台交付的循环,为跨流派和平台的高质量音频铺平了道路。报告了针对iPod和iPhone设备的优化归一化,并描述了正在进行的NoTube项目。
发布于2012年NAB,拉斯维加斯。
响度范围设计与评估
由埃斯本·斯科文博格撰写
在2009年,我们发布了用于计算LRA的算法,该算法被纳入了EBU R-128响度标准化推荐中。本文描述了LRA算法背后的设计选择。
发表于2012年AES会议,布达佩斯。
瞬时响度:RMS滤波器选项
由埃斯本·斯科文博格和托马斯·伦德撰写
使用响度计是一种有效的方法,可以平衡广播节目和频道的音量,以防止观众/听众体验到令人烦恼的音量跳跃。
发布于2012年3月。
重新审视BS.1770广播标准
托马斯·伦德
ITU标准已更新为BS.1770-2。它现在适用于各种类型的节目,例如广告和常规节目之间。对于广播公司、制作人以及与CALM法案等立法相关的方面,透明度是必须的。还描述了新的连贯的EBU R128工具。
发表于2011年NAB,拉斯维加斯。
门控响度测量
由格林、斯科文博格和斯皮科夫斯基撰写
根据ITU-R BS.1770-1规定的响度规范,对于大多数广播节目来说效果相当不错。然而,响度范围较宽的节目可能与其他节目不太一致。添加一个测量门提供了一个简单而有效的解决方案。
发表于2010年AES,伦敦。
节目响度和响度范围
由埃斯本·斯科文博格和托马斯·伦德撰写
EBU P/LOUD 花费了大量时间寻找一种透明的跨流派节目标准化测量方法。本文是该过程的一部分。它还描述了响度范围,研究了听众的响度跳跃容忍度,并介绍了 Zap 测试。
发表于2009年AES会议,纽约。
通用响度描述符
由埃斯本·斯科文博格和托马斯·伦德撰写
本文提出了两个描述符,“重心”和“一致性”,用于总结电影、音乐和广播节目及曲目的响度特性。应用包括交付规范、诊断、记录和元数据交付,例如用于MPEG和AC3编解码器。
发表于2008年AES会议,旧金山。
广播中的节目间跳转
托马斯·伦德
DTV在节目之间的音量跳跃问题日益严重;尤其是在宽动态范围的节目之后,紧接着是广告、宣传片或体育节目。对导致这种节目间音量跳跃的重要因素进行了调查并进行了报告。
发表于2008年新加坡广播亚洲展。
响度的实时可视化
由埃斯本·斯科文博格和索伦·H·尼尔森撰写
提出了一种新型实时响度计,能够同时显示短期响度、长期响度和峰值水平。
发表于2007年DAFx,波尔多。
停止计数样本
托马斯·伦德
来自CD响度战争前线的报告,2006年:这场战争还没有结束。阅读关于CD播放器、数据压缩系统等出现的失真情况。附录建议在制作和母带处理中遵循改进的程序。
发表于2006年AES会议,旧金山。
数字电视中的音量控制
托马斯·伦德
本文描述了各种响度测量模型及其局限性。消费者动态范围容忍度(DRT)被量化,并提出了考虑DRT的站点基础设施。
发表于2006年NAB,拉斯维加斯。
不同响度模型的评估
由埃斯本·斯科文博格和索伦·H·尼尔森撰写
评估了十二种响度模型测量语音和音乐片段的能力。Leq(A)和Leq(M)是表现最差的模型,而来自ITU实验的Leq(RLB)和一些新先进模型与广泛的听力测试结果相关性更好。
发表于2004年AES会议,旧金山。
响度匹配实验的设计
由埃斯本·斯科文博格和索伦·H·尼尔森撰写
不同响度实验设计进行了比较,并评估了使用固定参考与平衡配对匹配设计的效果。
发表于2004年,波兹南,SOAS。
音乐和语言的响度评估
埃斯本·斯科文博格,雷内·凯斯内尔 & 索伦·H·尼尔森
进行了一项实验,以使用一般线性模型研究音乐和语言的响度评估。
发表于2004年AES会议,柏林。
数字母带中的音量控制
由索伦·H·尼尔森和托马斯·伦德撰写
音乐母带制作正变成一种追求最大音量的斗争,而不是追求音质,因为在OdBFS下计算连续样本并不是对音量的充分限制。
发表于1999年AES会议,纽约。

大师级工程师的秘密
鲍勃·卡茨
掌握是一门艺术和科学。在这本备受赞誉的小册子中,鲍勃·卡茨分享了关于监控、测量和处理的良好建议。关于倾听音乐并支持它的道路通向涅槃——来自我们行业真正的瑜伽士之一。
发表于2004年,波兹南,SOAS。
关于响度的10件事你需要知道
EBU提供了关于响度的10个基本主题的简要概述。虽然不是详细介绍,但您将获得一个良好的起点以便进一步深入。
美国数字电视的推荐实践。A/85 基于 BS.1770 的响度和真实峰值水平。它规定了一种基于锚点或通用的音频标准化方法,但没有明确区分何时使用何种方法。A/85 包含有关校准监测环境的广泛信息,可能在某种程度上类似于 Dolby 手册。与 EBU R128 不同,A/85 仅专注于数字电视平台和 AC3 编解码器。发布于 2009 年 11 月。
声音的感知属性。人类将响度评定为安静与响亮之间。多个物理和心理因素共同影响响度的感知。Skovenborg、Quesnell 和 Nielsen 在其论文《音乐和语言的响度评估》中描述了一个用于研究这一属性的听觉实验,发表于 AES 116 会议论文。注意:响度并不指高保真音响上的开关,该开关在系统增益(“音量”控制)变化时改变频率响应。
请参阅ITU-R BS.1770
程序或音乐曲目的响度范围的标准化测量。响度范围,简称LRA,基于BS.1770并且是EBU R128的一部分。响度范围以LU为单位进行测量,基本上测量程序中柔和部分和响亮部分之间的距离。该测量用于作为制作指南,用于手动或服务器上的质量控制,以及检查整个信号路径的完整性。即使程序经过归一化,生产后的数值也保持不变。注意:响度范围取代了TC Electronic在其第一代LM5仪表中使用的描述符“Consistency”。
工作室音响可能会被校准,以在特定房间的特定位置产生特定的声压级(SPL)。经过校准的监控对高质量音频的制作有益,并使项目在不同工作室之间的移动变得不那么复杂。经过校准的监控有助于通过耳朵(以及响度计)控制响度,同时也能实现节目之间一致的频谱平衡。当监控级别未定义时,我们耳朵的级别依赖性敏感度在混音中发挥了作用。随着广播响度的标准化,现在是广泛鼓励校准监控的最佳时机。ATSC A/85中包含了关于这个问题的详细章节。
响度范围的缩写。
录音室扬声器可能会被校准以在特定房间的特定位置产生特定的声压级(SPL)。经过校准的监控对高质量音频的制作有益,并使项目在不同录音室之间的移动变得不那么复杂。经过校准的监控有助于通过耳朵(以及响度计)控制响度,同时也能在不同节目之间实现一致的频谱平衡。当监控级别未定义时,我们耳朵的级别依赖性敏感性会在混音中发挥作用。随着广播响度的标准化,现在是广泛鼓励校准监控的最佳时机。ATSC A/85中包含了关于这个问题的详细章节。
响度的单位是相对尺度。1 LU 等于 1 dB。如果定义了目标水平作为 LUFS 标度上的零点,它也可以用来测量节目响度,例如 0 LU = -23 LUFS。
通信研究中心。加拿大的联邦研发机构,是ITU-R BS.1770背后研究和听力实验的推动力。
数字信号的响度级单位,采用绝对尺度。1 LUFS 等于 1 dB。广播中的大多数响度水平在 -36 到 -18 LUFS 范围内,而接近 0 LUFS 的水平则表示非常响。
一个由编码器和解码器组成的组合结构。数据压缩系统如AAC、MP3和AC3是音频编解码器的例子。
在整个节目开始到结束时应用滑动窗口时测得的最大响度水平。在EBU R128中,滑动窗口的宽度定义为400毫秒或3秒。最大响度可以作为对抗令人烦恼的响亮广告的第二道防线,以防制作人开始规避与EBU节目响度标准化相关的平均响度方法。
分贝的缩写。dB用于表示两个幅度水平之间的对数比率。例如,10:1的比率等于20 dB,而1:10 = 10%则为-20 dB。因此,dB本质上总是相对的。没有+3 dB的水平,而+3 dB的增益是适用的。有时,dB的相对性质是隐含的,例如,当声压级(SPL)仅以“dB”表示时。由于听觉是一个对数感知,增益、失真、信号/噪声和音频中的其他关系通常以dB而不是百分比表示。
关于核心数据的额外信息。核心数据可以是实际的音频、视频或文本内容,而元数据可能包含访问或理解核心数据所需的工具。元数据被广泛用于阻止其他供应商处理核心数据,例如在文字处理软件中,因此只有在基于开放标准时才应予以接受。AES/EBU音频接口包括开放标准的元数据,而AC3包含某些特定于Dolby的元数据。在这种情况下,一个目标是尽量减少对这些难以捉摸的额外数据的依赖。
在数字领域中,用于描述样本水平的绝对单位。0 dBFS,其中“FS”代表满刻度,表示样本的最大编码值。以dBFS指定的水平测量通常表示样本峰值水平或真实峰值水平。
使用400毫秒滑动窗口测量响度,定义在EBU R128中。瞬时响度应可用于EBU模式仪表的实时响度显示。瞬时响度提供了响度水平最快和最动态的显示。
指的是dBFS真实峰值水平
对源、程序或音乐轨道应用静态增益偏移以满足特定标准。归一化可以基于多种标准,例如对响度或峰值水平的特定定义。广播电台的响度归一化,无论是实时的还是基于文件的,都是所有广播平台的优势。
用于描述模拟信号水平的绝对单位。参考点0 dBU等于0.775 V RMS。
澳大利亚FreeTV的操作实践。OP-59基于BS.1770响度和真实峰值水平,建议采用基于语音的以及通用的音频标准化方法。所有短节目应使用通用(完整混音)方法进行测量。
AC3中的元数据字段名称,指示节目的平均或基准音量水平。在AC3解码器中,dialnorm可用于通过应用增益偏移来规范化节目,并且还作为DRC系统的参考点。尽管其名称如此,dialnorm在解码器中并没有特定于语音的用途。广播电台的目标音量水平通常用作其AC3平台的dialnorm设置。
人类如何解读感官信息。大多数感官与物理刺激呈对数关系,从而使得能够感知到大量的刺激。作为听觉感知的一部分,响度与物理刺激呈对数关系,这使得分贝(dB)在测量中非常有用。
由杜比实验室专利的专有技术,用于区分语音和其他声音,从而在测量响度时排除非语音部分。该技术在控制广告方面可能效果不佳,也可能在语音与非语音之间界限模糊的类型中无效。对话智能(“DI”)含糊不清,且没有标准定义。杜比音频计可能运行不同版本的软件,其中某个版本的DI与各种加权方法结合。另见“通用测量”。
感知响度水平的单位。phon 级别与 SPL dB 级别相似。在 40 dB 以上的 SPL 水平下,两者在 1 kHz 音调处重合。因此,SPL 为 50 dB 的 1 kHz 纯音测得为 50 phons,通常被认为响度是 40 phons 的两倍。
动态范围控制。可能指的是AC3的一项功能,能够在播放过程中限制动态范围。AC3 DRC不采用符合BS.1770的校正能力,并且在某些产品中,最终听众无法禁用该功能。
一个由EBU内部和来自世界各地的音频专业人士组成的团队,正在研究广播中的响度测量和响度控制。P/LOUD由ORF的Florian Camerer担任主席,是EBU音频专家社区(ECA)的一个子组。P/LOUD的一个成果,推荐EBU R128,于2010年9月发布,开创了各种新的符合BS.1770标准的工具和制作技术。
一家美国公司的品牌名称,该公司通过销售专利技术的许可证在音频和娱乐领域开展业务。2005年,杜比实验室在纽约证券交易所上市。
峰值程序计量器。通常用于指准峰值计。
适用于整个节目、电影或音乐曲目的综合性、通用响度测量。EBU节目响度基于ITU-R BS.1770,但增加了一个相对阈值测量门,使其能够专注于前景声音。另见目标水平。
将一个集成的响度数字表示整个节目或音乐曲目的概念。EBU节目响度和重心就是这样的例子。节目响度可用于规范广播节目、广告、音乐曲目等。
由欧洲广播联盟(EBU)定义的响度计规格。符合EBU模式的响度计可以可靠地进行相应的测量。操作细节,如刻度和单位也包含在内。EBU模式在EBU Tech 3341中定义。
与准峰值计相同。
欧洲广播的音频指南,基于ITU-R BS.1770响度和真实峰值水平。与ATSC A/85相比,R128包含了显著的新BS.1770合规工具,适用于各种类型和广播平台。R128完全基于开放标准,并由四份技术文件支持,具体说明了EBU节目响度、响度范围、EBU模式、短期响度、瞬时响度、指南等。实用指南包括有关透明控制商业广告的细节,以及一个广泛的分发部分,阐述响度标准化对所有广播平台的好处。
音频电平的显示。准峰值计(PPM或QPPM)在广播和电影中被广泛使用。根据IEC 60268-10标准,该计表在其“攻击”响应时间上故意减慢,衰减时间则更慢。可以说,它既不是峰值电平计,也不是平均电平计,也不适合测量响度电平。在使用真实峰值计测量时,信号中可以轻易找到比QPPM显示的更高的峰值。
EBU模式的定义,PLOUD对响度计的一组要求。
采样峰值计是数字音频中的一种残余物。它易于实现且容易作弊,因此在CD和商业制作中的响度战争中承担了主要责任。采样峰值计通常出现在工作站和编辑系统中,但不要依赖它。在数字音频中,使用真实峰值计来显示峰值水平,并使用响度计来确定归一化。
响度范围的定义,由TC Electronic贡献并由欧洲广播联盟(EBU)标准化。
滑动窗口提供了一种方法,可以一次处理一定数量的数据点。滑动均方根窗口测量在音频中非常有用,例如在时间变化性方面检查某个属性。考虑到响度,滑动窗口方法在实时和制作应用中尤其有用,因为尚未获得完整数据。因此,滑动窗口的长度在EBU R128中被指定,并定义为400毫秒(瞬时响度)或3秒(短期响度)。
广播响度和真实峰值水平测量的全球标准。响度部分基于采用K加权的leq测量。这个基线方法相对简单,但已得到独立验证。标准的真实峰值部分由AES SC-02-01规定。BS.1770-1可用于测量单声道、立体声和5.1内容,并将在2010年10月进行修订。
相对于20 µPa(1 kHz纯音)的声压的声学对数测量,被认为是人类听觉的阈值。注意:与其他情况下使用分贝(dB)不同,当我们谈论例如“60 dB的声压级(SPL)”时,这个参考点是隐含的。由于耳朵的频谱灵敏度依赖于声压级(SPL),在测量时使用一种滤波器来近似耳朵在特定声压级范围内的灵敏度,例如A加权或C加权。
指示响度的原则是用一个数字来指定整个节目或音乐曲目从头到尾的整体响度。综合响度的例子包括:重心、EBU节目响度、"原始" BS.1770响度级别。
在广播传输中,尽可能保持元数据不变的原则,从而限制可能出现的问题数量。采用静态元数据的广播电台持续插入目标响度作为节目响度数字(在AC3中称为“dialnorm”),仅在格式变化时切换元数据,例如从立体声切换到5.1声道。EBU R128和ATSC A/85包含静态元数据广播电台设计的描述。
由CRC开发的频率加权,也称为“R2LB”。
目标响度是广播电台的归一化水平。根据EBU R128,所有类型和节目风格的目标响度为-23 LUFS。在ATSC A/85中,目标响度为-24 LUFS,但测量时不使用EBU模式的门限。在经过校准的监控系统中,目标响度被转换为制作工作室中可预测的声压级(SPL)。一旦定义了目标响度,用户可以选择在相对尺度(LU)上显示响度测量,而不是绝对尺度(LUFS)。在基于元数据的交付系统中,目标响度是指示节目级别的默认值。在AC3中,该元数据参数的名称为“dialnorm”。
等效声级。一个能量积分的声音测量,通常结合频率加权,以近似在某一声压级下的听觉。积分可以是以秒、分钟或小时为单位。BS.1770-1中的响度部分使用了一种特定的频率加权Leq(K),也称为Leq(R2LB),以及在5.1声道中前后声道的不同增益因子。
用于描述数字信号真实峰值水平的绝对测量。可以按照ITU-R BS.1770的规定进行测量。数字信号的内在或真实峰值水平可能比同一信号的采样峰值水平高出3 dB或更多。与采样峰值水平相反,真实峰值是处理信号而不发生削波所需的余量的有价值估计。0 dBFS+水平通常被打印到CD上,导致在再现设备、采样率转换器和数据压缩系统中出现失真。有关更多信息,请参见Lund的“停止计数样本”,AES 121大会论文。
绝对音量单位。与LUFS相同。
一种改进型的峰值电平计,用于数字音频。虽然在数字音频的早期阶段,采样峰值计是足够的,但它容易被误导,已不再是一个可靠的工具。
用于描述数字信号真实峰值水平的绝对测量。可以按照ITU-R BS.1770的规定进行测量。数字信号的内在或真实峰值水平可能比同一信号的采样峰值水平高出3 dB或更多。与采样峰值水平相反,真实峰值是处理信号而不发生削波所需的余量的有价值估计。0 dBFS+水平通常被打印到CD上,导致在重放设备、采样率转换器和数据压缩系统中产生失真。有关更多信息,请参见Lund的“停止计数样本”,AES 121大会论文。
绝对音量单位。与LUFS相同。
在不同电视频道之间“切换”时,响度的最高跳跃通常会发生。Zap测试是一种基于统计的方法,用于检查这些响度跳跃的幅度如何受到不同归一化方案的影响。有关更多信息,请参见Skovenborg和Lund的论文《响度描述符以表征宽响度范围材料》,AES 127大会论文。
我们全球的一些广播和制作用户
